大規模な Apache Jena TDB があります。新しいテキスト検索機能で使用するために、Apache Jena 2.10.2 を使用して Lucene インデックスを構築したいと考えています。ドキュメントに従うのは難しいと思います。
最初にコードで構成を使用しようとしましたが、依存関係に問題がありました。lecene-core と solr-solrj を組み合わせると、特定の「classNotFound」エラーまたは「StandardAnalyzer overrides final method tokenStream」エラーが発生します。コードの例:
Dataset ds1 = DatasetFactory.createMem() ;
EntityDefinition entDef = new EntityDefinition("uri", "text", RDFS.label) ;
Directory dir = new RAMDirectory();
// Have also tried creating the index in a file
File indexDir = new File("luceneIndexes");
Directory dir = FSDirectory.open(indexDir);
// Fails on this line
Dataset ds = TextDatasetFactory.createLucene(ds1, dir, entDef) ;
唯一の解決策は Text Dataset Assembler を作成することだと思いますが、これをコードで作成することについてアドバイスがある場合は、その方法で行うことをお勧めします。