1

CLOB列の任意の文字シーケンスを正確に検索する必要があります。パフォーマンス上の理由から、検索はインデックスベースである必要があります。

現時点では、別々のテーブルに格納されているn-gramを使用しています。

Oracle Textを使用して、トークナイザーが必要であることを学びました。「正確で文字ごとの検索」要件に一致させるには、このトークナイザーは最初のCLOBを単一の文字に分割する必要があります。文字は無視できません。反転テキストインデックスが使用されているため、このソリューションが適切かどうかは疑問です。

もう1つのオプションは、LuceneとJavaをOracleで活用することです(Luceneが正確な文字ごとのマッチングをサポートしていると仮定します)。

他に選択肢はありますか?

4

0 に答える 0