java - Jackrabbit アラビア語 PDF ファイルでのテキスト検索

Question

Jackrabbit で次のコードを使用して、アラビア語のテキストファイルのテキスト検索を正常に実行できます。しかし、アラビア語の PDF ファイルの場合、同じ検索は機能しません。ファイル内にアラビア語以外のテキストを入力すると、正しい結果が得られますが、ファイル内にアラビア語を入力すると、結果が得られません。

Query query = queryManager.createQuery("select * from [nt:resource] AS resource where contains(resource.*, '%القط%')", Query.JCR_SQL2);

 QueryResult result = query.execute();
 RowIterator ri = result.getRows();

     while (ri.hasNext()) {      
     Row row = ri.nextRow(); 
     System.out.println("Row: " + row.toString()); 
 }

ありがとう

score 0 · Accepted Answer

PDFBox がファイルを解析できなかった可能性があります。この場合、ログファイルに警告が記録されます。

java - Jackrabbit アラビア語 PDF ファイルでのテキスト検索

1 に答える 1

Related

Reference