2

私は主に、分散型、非正規化、完全にオープンなユーザー送信タグから、それらを「クラスター」と呼ばれるセマンティックグループに結合することですべてを理解し始める方法についてのアプローチの議論を探しています。

使用されているタグが実際に何を意味しているのかを実際に理解するのに実際の人が必要ですか、それともタグが一緒になる頻度を自動的に分析するだけでそれを行うことができますか?

そのようなもの。自由に乱暴に詳しく説明してください:)(また、これが他の場所で議論されている場合は、それについて聞いてみたいです)。

4

2 に答える 2

3

この記事を読む:自動タグクラスタリング。既存のアプローチの概要を説明し、タグクラスタリングのアルゴリズムについて説明します。

于 2009-06-26T04:24:10.733 に答える
1

Intelligent Web(Manning)のアルゴリズム(特に第4章)とO'Reillyの同様のタイトルの本は、クラスタリングアルゴリズムをカバーしています。マニングの本は、ナイーブなSQLアプローチから始まり、K-means、ROCK、およびDBSCANに移行します。タグに焦点を当てるよりも一般化されていますが、そのコンテキストで簡単に適用できます。コードはJavaで表示されますが、Rubyに簡単に適応できます(Javaコードを問題に適応させるよりも簡単な場合もあります)。

第5章では、トポロジの構築に関する分類について説明し、ベイズアルゴリズムについて説明します。

于 2009-10-30T21:57:45.273 に答える