python - pypdf2を使用したPDF解析

翻译自：https://stackoverflow.com/questions/35401630 2016-02-15T04:43:58.240

1326 次

pypdf2 を使用して pdf ファイルを解析しているときに、改行で mm-dd-yy のようなハイフン化された単語を次のように読み取ります。

んん

これは私のコードです：

import PyPDF2    
def getPDFContent(path):
    pdf = PyPDF2.PdfFileReader(file(path, "rb"))    
    content = ""
    content += pdf.getPage(0).extractText() + "\n"    
    return content

これを克服して同じ行に印刷するにはどうすればよいですか?

python - pypdf2を使用したPDF解析

0 に答える 0

Related

Reference