3

複数のソースからOpenRefine(Google Refineでした)でデータをクリーニングしています。会社を含むさまざまなソースからのファイルがあります。列の定義は同じです。

UNID | 名前 | 通り | 都市 | 国 | 電話 | ...
sg52d | 会社 a | 通り | 写真 都市 | c 国 | 12345
sg52d | 会社 a | 通り | 写真 都市 | c 国 | 0099835
dfnsd | B社 | B ストリート | 都市 B | c 国 | 33445
dfnsd | B社 | 違う | 別の | c 国 | 33445
xxbb3 | C社 | C ストリート | 都市 B | 国 A | 1111
xxbb3 | C社 | C ストリート | 都市 B | 国 A | 1111

私が欲しいのはこの結果です(最後の会社のみがマージされ、すべての列が同一でした)

UNID | 名前 | 通り | 都市 | 国 | 電話 | ...
sg52d | 会社 a | 通り | 写真 都市 | c 国 | 12345
sg52d | 会社 a | 通り | 写真 都市 | c 国 | 0099835
dfnsd | B社 | B ストリート | 都市 B | c 国 | 33445
dfnsd | B社 | 違う | 別の | c 国 | 33445
xxbb3 | C社 | C ストリート | 都市 B | 国 A | 1111

これを行う簡単な方法はありますか?

すべての列を新しい列に連結できることは理解していますが、列の数が多いため、これは少し PITA です。

おそらく、新しい列定義が他のすべての列をループしてマージする方法はありますか?

4

2 に答える 2

6

これは奇妙なアプローチですが、これは機能するはずです: http://googlerefine.blogspot.com/2011/08/remove-duplicate.html 並べ替えの変更を永続的にするようにしてください。

于 2014-03-11T01:19:10.470 に答える
1

次のような式で新しい列を作成できます。

forEach(["UNID", "Name", "Street", "City", "..." ],x,cells[x].value).join("")
于 2014-01-25T01:13:59.977 に答える