1

各ドキュメントの単語/フレーズの内容に基づいて、一連のドキュメント (最小で 10 個のドキュメントから最大で 2000 個のドキュメントの範囲) をグループに編成するアプリケーションを作成しています。各ドキュメントは、1 段落の単語から約 1 ページ半までさまざまです。

最初の検索語に基づいて結果をクラスタ化するドキュメント クラスタリング ライブラリを探しているのではなく、検索語なしでクラスタ化するライブラリを探しています。

Objective-C プロジェクトと簡単に統合できるドキュメント クラスタリングを行うライブラリはありますか?

4

1 に答える 1

0

私は Object C についてあまり詳しくありませんが、ネイティブ C コードをインポートできる場合は、greedyRSC ヒューリスティックを使用できます。Reuters と LA-Times コーパスでは非常に良い結果が得られました。

メッセージの説明と C コードはこちら: http://research.nii.ac.jp/~meh/greedyRSC/rscpage.html

于 2011-09-13T03:44:26.603 に答える