3

テキストドキュメントをクラスタリングする効率的な方法はありますか?K-Meansについて考えましたが、時間がかかりすぎるようです。誰かが私に効率的な方法を提供できますか?

4

2 に答える 2

1

K-Meansが実際に仕事をしていて、単に遅いように思われる場合は、もっと速くしてみませんか?私が使用する方法はランダム一時停止です。

通常、高速化の余地がたくさんある場合があります。コードでは、基本的なアルゴリズムを変更しなければ、問題になるとは思われませんでした。 これが例です。

于 2010-12-24T16:26:08.963 に答える
1

クラスタリング アルゴリズムはデータセットに依存します。ドキュメントをクラスタ化するアルゴリズムを Java で記述しますか? 、ホイールを再発明する代わりにwekaを使用して、データセットで別のクラスタリングアルゴリズムを試すことができます。

于 2010-12-24T11:01:41.120 に答える