freebase のデータ ダンプを使用して、freebase が提供するものと同様のデータベースを独自のサーバー上に作成する既存の方法はありますか? ほぼフリーベースですが、API 経由ではなく、ローカルで使用できますか?
作成することは可能だと思いますが、これに対する既存のソリューションは既にありますか? または、API を使用しない同様のデータの代替ソリューションはありますか? dbpediaでもこれは見つかりませんでした:|
freebase-quad-rdfize の代替はこちら: https://github.com/castagna/freebase2rdf
Apache Jena の TDB ストアを使用して RDF データをロードし、Fuseki を使用して HTTP 上の SPARQL プロトコル経由でデータを提供します。
以下も参照してください。
さらに、別のオプションがあります: http://basekb.com/
私は、FreebaseからRDFへの最初の使用可能な変換である:BaseKBの作成者です。
Freebaseクアッドダンプには重要な整合性の問題があり、クアッドダンプから完全に正しい結果を得るのが困難です。:BaseKBは、Freebaseのキー構造を再構築して、一意の名前の仮定が成り立つようにします。SQLクエリのように機能する単純なSPARQLクエリを作成する機能はこれに依存するため、これは重要です。
現在、:BaseKBには2つのエディションがあります。400万のトピック(ウィキペディアからのもの)についての1億2000万の事実からなる無料版があり、すべてを含む「プロ」版があります。
Phillip Kendallによって提起されたパフォーマンスの問題については、ほとんどの場合、十分なRAMがあることが問題であると言えます。24GBのRAMを使用すると、無料版を1時間でトリプルストアにロードできます。一部のクエリは私が好きなよりも時間がかかりますが、全体的なクエリのパフォーマンスは良好です。
「Pro」エディションを使用したい人は誰でも、非常に強力なハードウェアを必要とし、ツールチェーンを機能させるために多大な労力を費やします。私は現在、パートナーと協力して「Pro」を満足のいく方法でユーザーに提供しています。
Google Codeのfreebase-quad-rdfizeプロジェクトを見てください。毎週のFreebase クワッド ダンプをダウンロードして、選択した RDF トリプル ストアにロードできるはずです。
選択したトリプル ストアにデータをインポートすることは難しくありませんが、些細なことをしない限り、適切な時間内に回答を得るのは非常に困難です。
数年前、誰かがデータセット全体を MySQL にインポートしました。読み込みに 2 週間かかり、「人として入力されたものの数」のような単純なクエリでさえ、答えを出すのに 1 分以上かかりました。それは大きなハードウェア上にあり、データセットは当時よりもはるかに大きくなっています。
データベースをエクスポートして、TXT のタブ区切りまたはコンマ区切りの値、または MDB、XLS、またはその他の高度に転送可能なデータ形式などのデータベース ファイルをエクスポートできる場合、それを使用してコンピュータ上に独自の MySQL データベースを構築することに問題はありません。データ。主なことは、独自のデータベースを再構築できるデータをエクスポートできることを確認することです。