python - io を使用して PDF の URL からテキストを抽出すると、PyPDF2 で出力が得られない

翻译自：https://stackoverflow.com/questions/66402858 2021-02-27T19:46:02.550

59 次

PDFのURLからテキストを抽出しようとしています。PDFをダウンロードすると、関数でテキストを簡単に抽出できますslate。ただし、pdf をインポートしioてテキストを抽出しようとすると、返される出力は何もありません。以下にコードを添付します。

import requests, PyPDF2, io
from io import BytesIO

url = 'https://www.poderjudicial.es/search/contenidos.action?action=accessToPDF&publicinterface=true&tab=AN&reference=e3ca421447bc6b71&encode=true&optimize=20210216&databasematch=AN'

response = requests.get(url)
f = io.BytesIO(response.content)

with f as data:
    read_pdf = PyPDF2.PdfFileReader(data)
    page = read_pdf.getPage(1)
    print(page.extractText())

他の多くの機能を試しましたが、機能しません。私は何か間違ったことをしていますか？

python - io を使用して PDF の URL からテキストを抽出すると、PyPDF2 で出力が得られない

1 に答える 1

Related

Reference