それぞれ数百文字の長さの短いテキスト ドキュメントをクラスター化しようとしています。
私はcartoon2ワークベンチを使用しており、その機能がとても気に入っていますが、APIは本当に古臭く、理解/使用が困難です。
同様の機能 (クラスタリング アルゴリズム) を持ち、より優れた API を備えた代替品を探しています。
私はJavaまたはPythonで何かを本当に探しています.それはオープンソースであり、ビールのように無料でなければなりません.
そのため、lingpipe ( http://alias-i.com/lingpipe/ ) は対象外です。
ありがとう。