java - キーワードに基づいて査読者に論文を割り当てる

Question

次の状況で自動割り当てを行うことができるアルゴリズムを知っているかどうか疑問に思っていました.いくつかのキーワードが定義された論文と、いくつかの特定のキーワードが定義された査読者がいます. レビュアーが関心のある分野から論文をレビューできるように、自動マッピングを行うにはどうすればよいですか?

score 0 · Accepted Answer

Apache Luceneは 1 つのソリューションになる可能性があります。

これにより、RAM ディレクトリまたはファイルシステムの実際のディレクトリ内でドキュメントのインデックスを作成し、全文検索を実行できます。

フィルターやアナライザーなどの非常に興味深い機能を多数提案しています。たとえば、次のことができます。

あなたは見てみるべきです！選択した方法が Lucene である場合は、遠慮なくコードサンプルを尋ねてください。:)

score 0 · Accepted Answer

基本的には、独自のパーサーを設計するか、必要に応じて既存のパーサーを特化する必要があります。書類をスキャンし、キーワードに従ってトークンを検索して一致させる必要があります。次に、これらのキーワードを含む文を分離してレビュアーに表示します。

Stanford NLP POS taggerをお勧めします。必要なすべてのキーワードは、品詞に分類されます。次に、ドキュメント全体にタグを付けて、それらのタグを検索し、それに応じて文を並べ替えることができます。

score 0 · Accepted Answer

外部ツールの使用にオープンな場合、 Luceneは、(Web サイトから) に基づいてテキストを検索できるライブラリです。

3 に答える 3