問題タブ [carrot2]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
solr - 地理空間位置フィールドを含む solr フィールドに基づく solr クラスタリング
結果セットのクラスタリングを行うためにcarrot2を使用しようとしています。これに関していくつか質問があります。
a) Solr の特定のフィールドに基づいて、Solr/Lucene のドキュメントをクラスター化できますか? 名前、人名、地理的距離 (緯度、経度) に基づいて、特定のフィールドの重みでそれらをクラスター化しますか?
b) クラスタリングの私のユースケースは実際にはオンラインではなく、バッチのユースケースに近いものですが、最大 1K の制限がまだありますか? 結果の?
solr - STCアルゴリズムを使用する場合、solrはどのようにラベルを選択しますか?
現在、Solr を使用してクラスタリングを実行しようとしています。STC アルゴリズムを使用しています。ただし、クラスターのラベルがどのように生成されるかはわかりません。サフィックス ツリーのノードのラベルが使用されていることは知っていますが、どのように使用されますか? どのサフィックス(用語)が選択されますか? ありがとうございました。
text-analysis - コメントのクラスタ リスト
私は素晴らしい Carrot2 フレームワークを発見したばかりの初心者です。
Java API を使用して、LingoClusteringAlgorithm を使用して Facebook コメントのリスト (約 10 ~ 200 文字のコメントが 100 個まで) をクラスター化しようとしています。コメント テキストを「タイトル」フィールドとして使用し、「スニペット」、「URL」、および「クエリ」フィールドを空のままにすることはできますか? または、より良い方法があります (「タイトル」と「スニペット」にコメント テキストを 2 回使用するなど)。
cluster-analysis - Carrot2 による順次クラスタリング?
キャロット2で「シーケンシャルクラスタリング」を行うことができます。シーケンシャル クラスタリングとは、つまり、クラスタリングを行っている一連のドキュメントがあり、しばらくすると新しいドキュメントがクラスタリングのために到着したとします。新しいドキュメントを古い結果でクラスタリングすることは可能ですか、それとも再クラスタリングする必要がありますか?すべてのドキュメント。
ところで最初の投稿なので優しくしてください。
elasticsearch - ES 応答で共通フィールドを非表示にする
ES からの応答として返される共通フィールドの一部を非表示にする方法はありますか。
たとえば、次のような応答が得られた場合:
ここで、ES がtake、timed_out、_shards、total、successful、failed の値なしで応答 するようにします。特定のインデックスとタイプに対してクエリを実行しているため、 _index、_typeの名前は必要ありません。
では、そのように ES 応答をフィルタリングする方法はありますか?
elasticsearch - Elasticsearch wrt label/word/synonym 用の lingo3g のユーザー定義辞書
lingo3g のマニュアルを閲覧しているときに、http: //download.carrotsearch.com/lingo3g/1.9.0/manual/#chapter.lexical-resources を見つけました。
これは、定義済みの単語/ラベル辞書に従ってラベルの名前をカスタマイズできることを示しています。
だから私はそれに基づいていくつかの疑問があります:
これらのファイルを正確に ES に保存する必要がある場所 (ES/config または他の場所のいずれか)
これらの辞書を使用している場合、POS のデフォルトの辞書はラベルのクラスタリングで機能しませんか?
これらの特定の辞書を使用すると、クラスタリング後のラベル名はこれのみに基づいて形成されますか、それとも他のロジックもありますか?
クラスタリング用に組み込みの単語データベース wrt ES を確認するにはどうすればよいですか? word-dictionary.en.xml は ES の組み込みデータベース ファイルですか? ソース: http://download.carrotsearch.com/lingo3g/manual/#section.attribute.use-built-in-word-database-for-label-filtering
elasticsearch - Python Elasticsearch と Carrot
Python エラスティック検索を使用しており、ドキュメント クラスタリングを行う必要があります。私はcarrot2(https://github.com/carrot2/elasticsearch-carrot2)をインストールしました。
Python からニンジン クラスタリング モジュールを呼び出すにはどうすればよいですか?