アラビア語の Web サイトの URL のインデックス作成で Oracle テキストを使用しています。アラビア語はサポートされておらず、シソーラスがないため、サイトのインデックス作成時に句読点が無視されないことに気付きました。句読点のない文を検索すると、スコアが低く、句読点を使用して検索すると悪い結果が返され、次のエラーが返されることがあります。
ORA-20000: Oracle Text エラーです
DRG-50962: 問合せ演算子は変換入力文字列では使用できません
このエラーの意味、一部の文に Oracle Text 演算子が含まれていること、検索時にそれらを無視するにはどうすればよいか (文をそのまま送信すること)、または削除する演算子のリストを知っています。注: クエリの書き換えとエスケープ シーケンスを使用しています
(select /*+ FIRST_ROWS(1)*/ id,score(1) as sc1, isn ,sentence_length,URL from plag_web_temp_docsentences
where contains(URL,'<query>
<textquery>' || OriginalSentence ||'
<progression>
<seq><rewrite>transform((TOKENS, "{", "}", "{ }"))</rewrite></seq>
</progression>
</textquery>
<score datatype="INTEGER" algorithm="COUNT"/>
</query>',1)>0