0

Jackrabbit で次のコードを使用して、アラビア語のテキスト ファイルのテキスト検索を正常に実行できます。しかし、アラビア語の PDF ファイルの場合、同じ検索は機能しません。ファイル内にアラビア語以外のテキストを入力すると、正しい結果が得られますが、ファイル内にアラビア語を入力すると、結果が得られません。

Query query = queryManager.createQuery("select * from [nt:resource] AS resource where contains(resource.*, '%القط%')", Query.JCR_SQL2);

 QueryResult result = query.execute();
 RowIterator ri = result.getRows();

     while (ri.hasNext()) {      
     Row row = ri.nextRow(); 
     System.out.println("Row: " + row.toString()); 
 }

ありがとう

4

1 に答える 1

0

PDFBox がファイルを解析できなかった可能性があります。この場合、ログ ファイルに警告が記録されます

于 2011-04-28T11:51:16.170 に答える