3

私はライブ ミュージックの会場/アーティスト データベースを構築している会社に所属しており、最近 Freebase に出会いました。新進気鋭のバンドのデータがなくても、非常に魅力的に見えます。Freebase を使用したことのある方に、いくつか質問があります。

  1. すべてのデータ入力を Freebase に統合することの欠点はありますか? この情報を販売または私有化するつもりはありません。

  2. 使いやすさに関して、Freebase の弱点は何ですか?

4

1 に答える 1

1

開示:私はGoogleでFreebaseに取り組んでいます。

Freebaseの音楽データは私たちの最も強力な分野の1つであり、より多くのデータセットをロードし続けるにつれて、より広く、より豊かになり続けるでしょう。たとえば、MusicBrainzからデータをインポートしてクリーンアップし、トピックをFreebaseの既存のトピックと照合して、重複を回避します。

  1. 欠点としては、大量のデータを処理する準備をする必要があります。たとえば、Freebaseには現在「JohnSmith」という名前の4人のミュージシャンがいます。これはアプリケーションに役立つ場合と役に立たない場合がありますが、ユーザーが興味を持っているJohnSmithへのマップを特定する必要があります。これを「調整」と呼び、APIにクエリを実行するトピックをアプリが正確に認識できるようにするために必要です。

    音楽会場についておっしゃっていたので、Freebaseには場所に関する多くのデータがありますが、geosearch APIはまだないので、必要に応じて独自にロールする必要があることも指摘しておく必要があります。

    Freebaseは誰でも編集できるため、破壊行為からサイトを保護するためにas_of_timeの使用も検討する必要があります。

  2. Freebaseは、簡単にジャンプして不良データをクリーンアップしたり、不足しているトピックを追加したりできるため、開発者に最適です。ただし、常に課題となっている分野の1つは、Googleの外部から大量のデータを読み込むことです。人々がデータセットをアップロードできるようにするOpenRefineを構築しましたが、これらのデータセットは、完了するまでに時間がかかるQAプロセスを通過する必要があります。Freebaseの品質レベルを維持するには、これらのQAプロセスが必要ですが、大規模なデータセットのロードプロセスが遅くなります。

Freebaseの音楽データを利用して会社を設立することを選択していただければ幸いです。私たちのデータを喜んで利用している音楽スタートアップはすでにたくさんあることを私は知っています。

于 2012-08-21T01:23:34.073 に答える