問題タブ [swish]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
199 参照

perl - PDF ファイルの索引付けとキーワードの要約の生成

ドキュメント ベースとして使用するローカル ファイル システムに大量の PDF ファイルがあり、これらのファイルのインデックスを作成したいと考えています。私はしたいと思います :

  1. PDF ファイルの内容を解析してキーワードを取得します。
  2. 最も関連性の高いキーワードを選択して要約を作成します。
  3. 適切なファイルにリンクされたエントリを含むいくつかのキーワードの静的 HTML ページを作成します。

私の質問は次のとおりです。

  • ジョブ全体を実行する既存のツールはありますか?
  • PDF ファイルのコンテンツを解析し、(単語サイズで) フィルター処理し、単語をカウントするための最も適切なツールは何ですか?
  • Perlswish-epdfgrepを使用してスクリプトを作成することを検討しています。役に立つ他のツールを知っていますか?