3

私はFacebookからの一連の興味といいねのデータを持っており、他のソース、つまりFreebaseからのデータで強化することに興味があります。Freebase内のどのエントリがFacebookグラフ内の特定のエントリに対応するかを識別する方法はありますか?

まず、Facebook Graphは外部ソースへのリンクを提供していないため、外部ソース内で何らかの関係を見つける必要があるようです。少なくとも一部のエントリでは、Freebaseが「FacebookURL」を提供しているため、回りくどい方法で2つをリンクできることがわかりました。たとえば、バンド「テイキングバックサンデー」の場合、FacebookグラフのURLは次のとおりです。

https://graph.facebook.com/23854511408

...代わりにバニティURLを使用できます:

https://graph.facebook.com/TakingBackSunday

テイキング・バック・サンデーのエントリーをRDF形式(http://rdf.freebase.com/rdf/en.taking_back_sunday)またはJSON形式で表示すると、FacebookのバニティURLへのリンクが表示されます。この属性がMQLによってクエリ可能であると仮定すると、このメソッドを介してFreebaseをFacebookGraphにリンクすることが可能です。ただし、問題は、Freebaseの多くのエントリにFacebookへのリンクがないことです。

これらのつながりを発見するための一貫した方法があるかどうかについてのアイデアはありますか?

4

2 に答える 2

4

FacebookのグラフデータをRDF形式で取得でき、データセット間で特定の種類のエンティティ(バンドなど)を接続することに関心がある場合は、 Silkなどのリンク検出ツールを使用できます。名前、ジャンル、出身地などを比較する方法をSilkに指示するマッピングを作成すると、Silkが接続を計算します。ただし、これにはかなりの労力が必要です。

もう1つのオプションは、データに一致するFreebaseエンティティを検出できる「調整」機能を備えたGoogleRefineを使用することです。課題は、FacebookデータをGoogleRefineに取り込む方法です。

于 2012-05-01T23:52:44.710 に答える
4
  1. 興味といいねのリストから、名前とFBグラフURIの列を含むスプレッドシートを作成します。
  2. スプレッドシートをGoogleRefineに読み込みます
  3. 名前の列をFreebaseと調整します。
  4. 次のGRELコードを使用して、調整された名前列に基づいてFreebaseURIの新しい列を作成します。

    "http://rdf.freebase.com/ns/" + cell.recon.match.id [1、-1] .replace( "/"、 "。")

  5. 拡張データを新しいスプレッドシートにエクスポートします。

于 2012-05-02T02:24:59.463 に答える