問題タブ [swish]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
21 問題
0
投票する
1
に答える
199
参照
perl - PDF ファイルの索引付けとキーワードの要約の生成
ドキュメント ベースとして使用するローカル ファイル システムに大量の PDF ファイルがあり、これらのファイルのインデックスを作成したいと考えています。私はしたいと思います :
- PDF ファイルの内容を解析してキーワードを取得します。
- 最も関連性の高いキーワードを選択して要約を作成します。
- 適切なファイルにリンクされたエントリを含むいくつかのキーワードの静的 HTML ページを作成します。
私の質問は次のとおりです。
- ジョブ全体を実行する既存のツールはありますか?
- PDF ファイルのコンテンツを解析し、(単語サイズで) フィルター処理し、単語をカウントするための最も適切なツールは何ですか?
Perl
、swish-e
、pdfgrep
を使用してスクリプトを作成することを検討しています。役に立つ他のツールを知っていますか?