オブジェクトの大規模なリスト(数千または数万)があり、それぞれに少数のタグが付けられているとします。数十または数百の可能なタグがあり、それらの使用法は一般的なべき法則に従います。一部のタグは非常に頻繁に使用されますが、ほとんどはまれです。実際、最も頻繁に使用される数十個のタグを除くすべてのタグは、通常は無視できます。
ここで問題となるのは、これらのタグ間の関係をどのように視覚化するかです。タグクラウドは、それらの頻度だけを視覚化したものですが、どのタグが他のどのタグと一緒に発生するかを無視します。タグ:barは、:fooとタグ付けされたオブジェクトでのみ発生するとします。それは視覚的に明らかなはずです。同様に、一緒に発生する傾向がある3つのタグについても同様です。
各タグをバブルにして、部分的に重ね合わせることができます。技術的にはそれはベン図ですが、そのように扱うのは扱いにくいかもしれません。たとえば、Googleチャートはベン図を作成できますが、3セット以下(タグ)のみです
。http
://code.google.com/apis/chart/docs/gallery/venn_charts.html3
セットに制限されている理由それはもうそれであり、それは恐ろしいように見えます。Wikipediaページの「より多くのセットへの拡張」を参照してください:http: //en.wikipedia.org/wiki/Venn_diagrams
しかし、それはすべての可能な交差点が空でない場合のみです。共起するタグが3つ以下の場合(おそらく、まれなタグを破棄した後)、ベン図のコレクションが機能する可能性があります(バブルのサイズはタグの頻度を表します)。
または、共起の頻度を表すために、視覚的に厚いまたは薄いエッジを持つグラフ(頂点やエッジなど)。
ツールやライブラリへのアイデアやポインタはありますか?理想的にはjavascriptでこれを行いますが、RやMathematicaなど、実際には何でもかまいません。興味のある方がいらっしゃいましたら、実際のデータを共有させていただきます(それが何を表しているのかを教えていただければ笑うでしょう)。
補遺:私が最初に考えていたアプリケーションはTagTimeでしたが、これは自分のおいしいブックマークを視覚化する問題にもよく対応していると思います。