mysql - RDBMS（MySQLデータベース）のSPARQLエンドポイントを作成するための最良の方法

Question

私はリンクされたオープンデータセット、特に政府によって出されたものでいくつかの実験を行っています（やりたいです）。

私はRDBMS（より具体的にはMySQL）を持っています。セマンティックWebのアイデアを念頭に置いて設計しました。つまり、オブジェクト、述語、およびオブジェクトを定義するクラスとして情報を格納しています。次に、すべてのオブジェクトは、サブジェクト->述語->オブジェクト（サブジェクトはオブジェクトテーブルからのもの）という形式のステートメントを介して相互に関連付けられます。

アプリケーションから他のRDFトリプルストアにクエリを実行し、他のトリプルストアにデータをクエリさせたい。これが可能になるように「何かを設定する」ことは可能ですか？

イエナを見てきました。Jenaを使用するということは、MySQLではなくストレージアプリケーションとして使用する必要があることを意味しているようです。これに関する唯一の問題は、カテゴリと呼ばれる新しい概念を含めることです（これはセマンティックWeb言語の一部ではないと思います）。カテゴリを使用して情報を表示します（他の意味はありません）が、Jenaを使用すると、より便利に表示できるようにカテゴリの下に述語を整理できないようです。

私はJavaを使用しているので、JAVAAPIが推奨されます。

イエナの目的を誤解した可能性もあり、それが役立つかもしれませんが、どうすればよいかわかりません。

今から4日後、この質問はかなりばかげているように見えると思いますが、現時点では、どのように進めるかについて少し混乱しています。

score 5 · Accepted Answer

「カテゴリと呼ばれる新しい概念」が何を意味するのかよくわかりませんが、例を挙げていただけますか?

おそらくユーザーインターフェイスで情報を整理する方法として、追加のメタデータを追加することを意味する場合、セマンティック Web 言語またはストレージシステムを拡張する必要はありません。

英国政府の学校のデータセット(簡潔にするために Turtle エンコーディングを使用)からの学校のデータがあるとします。

@prefix sch-ont:  <http://education.data.gov.uk/def/school/>.
<http://education.data.gov.uk/id/school/135412>
a sch-ont:School;
sch-ont:establishmentStatus 
    <http://education.data.gov.uk/def/school/EstablishmentStatus_Open>;
sch-ont:MSOA <http://statistics.data.gov.uk/id/msoa/E02000001>;
sch-ont:establishmentName "Guildhall School of Music and Drama";
...

そのデータをSPARQL エンドポイントから直接クエリするか、データをダウンロードして独自のトリプルストアにローカルに保存することができます。いずれにせよ、ユーザーに役立つ追加情報を自由に追加できます。例えば：

@prefix ankurs-app: <http://ankur.org/example/app/vocab/display#>.
<http://education.data.gov.uk/id/school/135412> 
        ankurs-app:category ankurs-app:wkdCool.

この新しいトリプルをダウンロードしたデータと同じグラフに保存するか、別の名前付きグラフに保存して、ソースデータとは異なる来歴を持つ情報であることを示すことができます。いずれにせよ、Jena からプログラムで、または SPARQL クエリを介してクエリを実行するのは簡単です。

スキーマのないトリプル中心のデータを効率的にクエリするためのレイアウトを行うことは、よく研究された難しい問題です。Jena を含むほとんどの RDF プラットフォームには、独自のデータベーススキームからトリプルをクエリおよび更新するための十分に最適化されたコードがあります。独自のリレーショナルテーブルレイアウトに着手するには、非常に正当な理由が必要です:)

本当に既存のリレーショナルテーブルスキームを使用して Jena RDF モデルにマップする必要がある場合は、D2RQを参照してください。

score 3 · Accepted Answer

トリプルストアを使用してすべてのデータを保存しなかったのはなぜですか? SPARQL エンドポイント機能を備えたトリプルストアを使用すると、SPARQL でアクセス可能な Web API が得られます。同様に、Web 上の他の多くのデータセットは SPARQL エンドポイントとして公開され、HTTP 経由でアクセスできます。

db とそれ以外 (Jena + SDB、Mulgara、Virtuoso、Oracle など) の両方で永続ストレージを使用できる多くのトリプルストアがあります。カスタムデータベースに対するクエリをサポートするために、リゾルバーを介してMulgaraを拡張することは確かにできますが、実際の価値があまりないため、おそらく多くの作業になると思います.

既存の概念を使用して、RDF のカテゴリの概念を処理したり、おそらく Jena に何かを重ねたりすることができると確信しています。

mysql - RDBMS（MySQLデータベース）のSPARQLエンドポイントを作成するための最良の方法

2 に答える 2

Related

Reference