0

ドキュメントの情報の視覚化を行う場合、複数のドキュメントにわたるグラフの生成はメッシュを形成することがよくあります。明確な画像を取得するには、最小限のデータ負荷で簡単に作成できるため、要約するのは良いことです。しかし、ドキュメントの負荷が100万になると、要約するとグラフも大きなメッシュを形成します。メッシュをクリアする方法に少し戸惑っています。データが膨大であるため、 http: //www.jerrytalton.net/research/Talton04SSMSA.report/Talton04SSMSA.pdfを読んで作業することはあまり役に立ちません。

学んだメンバーが親切に私を助けてくれるかもしれません。

よろしく、SK

4

1 に答える 1

0

ドキュメントのグラフまたはネットワークを作成することについて話しているのですか?たとえば、引用、著者の共有、同じ用語の表示などによってドキュメントのネットワークをリンクすることができます。これは一般にメッシュの問題とは呼ばれず、自動グラフレイアウトの問題です。

より良いレイアウトアルゴリズムか、ある種のクラスタリングと削減を行う必要があります。使用できるクラスタリングアルゴリズムはたくさんあります。たとえば、Wakita&Tsurumiの次のようなものです。

  • 脇田健、鶴見敏幸。2007.メガスケールのソーシャルネットワークでコミュニティ構造を見つける:[拡張要約]。Proc。ワールドワイドウェブに関する第16回国際会議(WWW '07)。1275-1276。DOI = 10.1145/1242572.1242805

「グラフの要約」を通じて複雑さを軽減することを特に対象としているのは、Navlakhaetalです。2008年:

  • Saket Navlakha、Rajeev Rastogi、およびNisheethShrivastava。2008.制限付きエラーを含むグラフの要約。Proc。データ管理に関する2008ACMSIGMOD国際会議(SIGMOD '08)。419-432。DOI = 10.1145/1376616.1376661

また、ネットワーク内の一般的な繰り返しパターンを代表的なグリフに置き換えた最新の論文を確認することもできます。

  • Dunne、C.&Shneiderman、B. 2013. Motifの簡略化:ファン、コネクタ、およびクリークグリフを使用してネットワークの視覚化の可読性を向上させます。Proc。2013 SIGCHI Conference on Human Factors in Computing Systems(CHI '13)。PDF

可能な削減の例を次に示します。

ダン&シュナイダーマンのモチーフの簡素化

于 2013-02-03T18:07:00.080 に答える