sparql - DBpediaクエリは、フィルターにもかかわらず、いくつかのミュージカルを複数回返します

Question

DBpediaに対してSPARQLクエリを使用して、ミュージカルのリストといくつかの関連するプロパティを取得しようとしています。ただし、適切なフィルターを使用しているにもかかわらず（私が知る限り）、結果には多くのミュージカルが複数回含まれています。これが私の質問です：

    PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
    PREFIX dbo: <http://dbpedia.org/ontology/>
    PREFIX dbpprop: <http://dbpedia.org/property/>
    SELECT ?label ?abstract ?book ?music ?lyrics
    WHERE { 
        ?play <http://purl.org/dc/terms/subject> <http://dbpedia.org/resource/Category:Broadway_musicals> ;
            rdfs:label ?label ;
            dbo:abstract ?abstract ;
            dbpprop:book ?book ;
            dbpprop:lyrics ?lyrics ;
            dbpprop:music ?music .
        FILTER (LANG(?label) = 'en')    
        FILTER (LANG(?abstract) = 'en')
        FILTER (LANG(?book) = 'en')
        FILTER (LANG(?lyrics) = 'en')
        FILTER (LANG(?music) = 'en')
    }

結果のリストには、多くの重複するエントリがあります。ここにクエリを貼り付ける： DBpedia SPARQL Explorer、「Mama Mia！」で始まることがわかります。リストには重複がたくさんあります。

重複のないユニークな結果を得るために私が欠けているものはありますか？ありがとう！

[ここで「複製」されているのはミュージカルであり、トリプルではないことを明確にするために、glennmcdonaldによって編集されました。]

score 5 · Accepted Answer

SPARQLは変数バインディングを返します。「複製」は、投影されたプロパティの倍数のデカルト積です。Mamma Miaには複数の音楽作家と複数の作詞家がいるため、テーブルに列を作ることができる可能性のあるすべての組み合わせを取得できます。

なんて痛いの？「解決策」は、SELECTの代わりにCONSTRUCTを使用し、テーブルの代わりにグラフを取得することです。多分このように：

score 3 · Accepted Answer

重複は正確に重複していますか？つまり、重複する各結果のすべての変数のすべての値は同一です

その場合は、DISTINCT後にキーワードを追加しSELECTて、SPARQLエンジンに重複するソリューションを破棄させます。

そうでない場合、Glennは完全に正しいです。これは、さまざまなプロパティに複数の値が指定されているため、複数の結果が得られるためです。サブクエリなどで実行できる複雑な回避策がありますがGROUP BY、それらはクエリの効率を低下させる傾向があります。場合によっては、クライアント側で重複を処理する必要があります。

sparql - DBpediaクエリは、フィルターにもかかわらず、いくつかのミュージカルを複数回返します

2 に答える 2

Related

Reference