問題タブ [linkedmdb]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
rdf - SPARQL を使用して類似のコンテンツを見つける方法
私は、SPARQL を使用して物事間の概念的な重複を特定するというアイデアで遊んでいます。
映画を例にとると (LinkedMDB データ)、映画「マトリックス」があり、その映画に似た映画をリストすることが私の目標である場合、おそらく次のことから始めます。
- マトリックス
- ジャンルを取得
- アクターを取得する
- ディレクターを得る
- 場所を取得
- 等
次に、マトリックスで特定したものを使用して、それらのプロパティを持つものをクエリします (疑似クエリ)。
SPARQL に、異なるノード間のプロパティの重複をチェックできるものはありますか? それとも、私が提案したようにこれを手動で行う必要がありますか?
rdf - SPARQL を使用して LinkedMDB から ID の高いムービーを取得できない
LinkedMDB SPARQL エンドポイントで次のクエリを実行していますが、動作します。これにより、ID 72 の映画の監督 (タイタニック)について必要なすべての情報を取得できるため、ジェームズ・キャメロンに関する情報を取得できます。
ID が 44396 のStar Trekなど、より高い ID を持つ映画の場合、72 を 44396 に置き換えると、クエリは結果を返しません。ただし、エントリには明らかにディレクトリ、ID、および名前があります。変更されたクエリが機能しないのはなぜですか?
xml - Sparql クエリの方法
助けてください。
これまでのところ、ARQ (コマンドライン) で Jena を使用する方法、xml ファイルをロードしてクエリを query.rq ファイルに書き込み、次のコマンドでクエリを実行する方法を知っています。
rdf - SParQL の URI に基づくフィルタリング
Linked MDB SPARQL Explorerで以下のクエリを実行できます。(最後の変数)の値には?imdbID
、3 つの可能なドメイン (freebase.com、rottentomatoes.com、または imdb.com) のいずれかからの IRI が含まれます。filter
imdb.com ドメインの行のみが保持されるように適用する方法を知りたいです。
rdf - Linked MDB は最新ですか?
LinkedMDB でThe Machineやその他の多くの映画を検索しようとしても、見つかりません。このようなクエリを使用して、映画の IMDB URL と foaf:page プロパティのクエリを SPARQL エンドポイントで取得できますが、結果は返されません。
ご覧のとおり、クエリには、一致するリソースをキャッチするための正規表現が含まれています。クエリにエラーがありますか、それとも LinkedMDB リポジトリにすべての IMDB の映画が含まれていませんか (探している映画は非常に古いものです)?
rdf - LinkedMDB SPARQL の結果は予想よりも少ないですか?
Linked Open Data を使用した Ontology Alignment Discoveryのスライド 14 には、LinkedMDB データセットには 50,603 人のアクターがいると書かれています。次のクエリを使用すると、2500 が返されます。ここで間違っているのは誰ですか?、クエリに欠けているものはありますか? スライドの数がこれほど多いのはなぜですか? これは SPARQL クエリです。
sparql - Linkedmdb の実行制限を解決する方法
Linkedmdb からすべてのムービーを抽出しようとしていました。OFFSET を使用して、クエリごとの最大結果数に達しないようにしました。Pythonで次のスクリプトを使用しました
オフセットを 0、1000、2000、3000、4000 にして 5 回ループし、結果の数を記録しました。(1000,1000,500,0,0) でした。制限が 2500 であることは既に知っていましたが、OFFSET を使用することでこれを回避できると考えました。それは真実ではありませんか?すべてのデータを取得する方法はありません (何らかのループを使用している場合でも)?