lucene と jena を使用して、dbpedia (tdb ストアにある) のサブセットで全文検索を実行したいと考えています。
String TDBDirectory = "path" ;
Dataset dataset = TDBFactory.createDataset(TDBDirectory) ;
ただし、すべてのリソースではなく、タイトルのみです。必要なトリプルに対してのみインデックスを作成することで、より高速な検索を実行できると思います。例えば
<http://de.dbpedia.org/resource/Gurke> <http://www.w3.org/2000/01/rdf-schema#label> "Gurke"@de .
ここで「Gurke」を検索したいのですが、#label プロパティを持つトリプル以外は検索しません。私の質問は、インデックスを作成して #label プロパティでトリプルのみを検索するにはどうすればよいですか? 私はすでにhttp://jena.sourceforge.net/ARQ/lucene-arq.htmlを見てきましたが、詳細が不十分であるか、私にとって難しすぎます。