![]() ![]() ![]() syllable "fi" turning into the greek letter "Þ".The output I get is: 'APPENDICEB.APPENDICECARTOGRAFICA EICONOGRAFICA\nTabella B.1\nSoggetto\nPianta degliortia OvestdelBattistero.\nAutore\nRanieriCorsi\nData\nNondatato\nTe c n i c a\n-\nDimensioni\n-\nIscrizioni\nPianta dellÕOrto attenentealla VenerabilOpera delDuomo diPisa\ndetto LÕOrto da SanGiovanni.\nCollo cazione\nPisa,Opera della PrimazialePisana,Archivio.\nDescrizione\nNeldisegno sono rappresentatigliorticoltivatiadOvestdelBat-\ntistero,la Casa dellÕOrtolano eilmuro divisorio checosteggiava\nla Porta ovestdelmonumento.Adovesttalepropriet‹ conÞnava\nconunÕaltra porzionediterreno dipropriet‹ della Dogana diPisa,\ncomeattesta lÕiscrizionelungo ilmarginesinistro deldisegno.\nNote\n-\nBibliograÞa\n-\n250\n' ![]() You can download the pdf file here: def extractTextFromPdf(filename, ignore_newline=False):Įstrazione_prova = extractTextFromPdf('input/document-page259.pdf') Here is my code and a pdf example file (with correct characters). I'm trying to extract some texts from PDF files using PyPDF2, but I'm encountering some problems. ![]()
0 Comments
Leave a Reply. |
AuthorWrite something about yourself. No need to be fancy, just an overview. ArchivesCategories |