0

大規模な Apache Jena TDB があります。新しいテキスト検索機能で使用するために、Apache Jena 2.10.2 を使用して Lucene インデックスを構築したいと考えています。ドキュメントに従うのは難しいと思います。

最初にコードで構成を使用しようとしましたが、依存関係に問題がありました。lecene-core と solr-solrj を組み合わせると、特定の「classNotFound」エラーまたは「StandardAnalyzer overrides final method tokenStream」エラーが発生します。コードの例:

Dataset ds1 = DatasetFactory.createMem() ;

EntityDefinition entDef = new EntityDefinition("uri", "text", RDFS.label) ;

Directory dir =  new RAMDirectory();

// Have also tried creating the index in a file
File indexDir = new File("luceneIndexes");
Directory dir = FSDirectory.open(indexDir);

// Fails on this line
Dataset ds = TextDatasetFactory.createLucene(ds1, dir, entDef) ;

唯一の解決策は Text Dataset Assembler を作成することだと思いますが、これをコードで作成することについてアドバイスがある場合は、その方法で行うことをお勧めします。

4

1 に答える 1