PDF データ コーパスのカスタム検索エンジンに取り組んでいます。
PDFコンテンツをテキストにダンプできる変換レイヤーがあります(Apache TikaとGROBIDを使用)。検索レイヤーと検索結果リストを返すビューが完成しました。
ここで、元の PDF に、検索語が表示された行の強調表示機能を追加したいと思います。はい、必要に応じて PDF ファイルを変更します。
PDFファイル内のテキストを強調表示する方法はありますか? PDFMinerまたはPyPDF2または他のPythonライブラリはそれを行うことができますか?
...または、他の外部サービスをお勧めできますか?