0

networkD3 パッケージで sankeyPlot() を使用してサンキー ダイアグラムをプロットしようとしています。ビジュアライゼーションは、このようなサンプル データでうまく機能します

ノード

node
1124107186
1124132760
1124119016
20150517
/matte-low-dome-49354
/accounts/account-order-list.html
/Stepp

とリンク

 source target   value
0        3       5
1        3       9
2        3       1
3        4       6
3        5       12
3        6       8

ただし、csv ファイルからリンク テーブルを作成するのは困難です。

       URI                          DATE_KEY    TIME_KEY GUID_KEY
/matte-low-dome-49354               20150517    145755  1124107186
/matte-low-dome-49355               20150517    145755  1124107186
/accounts/account-order-list.html   20150517    143857  1124132760
/accounts/account-order-list.html   20150517    143857  1124132760
/Stepp                              20150517    143416  1124119016
/Stepp                              20150517    143415  1124119016
/platinum-47184                     20150517    145637  1124107186

このようなデータセットのソース、ターゲット行番号を準備する再現可能な方法はありますか?

4

1 に答える 1

0

vlookupとピボットを使用してExcelで行う方法を見つけました。row() を使用して、一意の変数エントリごとに行番号を割り当てました。

variable          row
20150517           1
20150518           2
/platinum-47184    3

別のテーブルでその名前を使用してvlookupを実行したため、ソースとターゲットをシーケンス番号の形式で取得しました。次にピボットを実行して、次のように変数の一意の組み合わせの数を取得しました。

 source                              target   value
/matte-low-dome-49354               20150517    12 
/matte-low-dome-49355               20150517    6

これをサンキー プロットを作成するための入力として使用できました。

これは非常にプログラム可能な方法ではありませんが、目的には役立ちます。

于 2015-07-16T13:31:52.563 に答える