17

PDF データ コーパスのカスタム検索エンジンに取り組んでいます。

PDFコンテンツをテキストにダンプできる変換レイヤーがあります(Apache TikaとGROBIDを使用)。検索レイヤーと検索結果リストを返すビューが完成しました。

ここで、元の PDF に、検索語が表示された行の強調表示機能を追加したいと思います。はい、必要に応じて PDF ファイルを変更します。

PDFファイル内のテキストを強調表示する方法はありますか? PDFMinerまたはPyPDF2または他のPythonライブラリはそれを行うことができますか?

...または、他の外部サービスをお勧めできますか?

4

1 に答える 1

9

PyPDF2を使用してテキストを強調表示できます。

テキストの場所を見つけるには、この回答を確認してください。

于 2016-11-18T15:41:41.047 に答える