3

次のような厄介な名前のデータベースが 2 つあります。

  • ボビー・ジンダル
  • フロリダ州知事 ボビー・ジンダル
  • ボビー・ジンダル
  • スリーエム株式会社
  • 3Mメノモニー

一致するものを見つける必要があります。Google Refineでこれを行う方法について、誰かが私に指摘したり、良いレシピを提案したりできますか?

このリンクは私に出発点を与えてくれますが、さらにアドバイスを使用できます: http://blog.ouseful.info/2011/05/06/merging-datesets-with-common-columns-in-google-refine/

4

2 に答える 2

2

Refine拡張機能を試すことができます。特にドキュメントの調整部分を参照してください。

于 2012-05-07T21:04:09.717 に答える
1

cell.cross 関数は Excel の vlookup に似ており、2 つのセルが同一である場合にのみ一致します。この方法を使用する場合は、事前にデータをクラスタリングしてクリーンアップする必要があります。

私はマイケルの答えを支持します。調整サービスを試してみてください: rdf one またはopen reconcile

于 2012-05-16T13:31:16.860 に答える