CLOB列の任意の文字シーケンスを正確に検索する必要があります。パフォーマンス上の理由から、検索はインデックスベースである必要があります。
現時点では、別々のテーブルに格納されているn-gramを使用しています。
Oracle Textを使用して、トークナイザーが必要であることを学びました。「正確で文字ごとの検索」要件に一致させるには、このトークナイザーは最初のCLOBを単一の文字に分割する必要があります。文字は無視できません。反転テキストインデックスが使用されているため、このソリューションが適切かどうかは疑問です。
もう1つのオプションは、LuceneとJavaをOracleで活用することです(Luceneが正確な文字ごとのマッチングをサポートしていると仮定します)。
他に選択肢はありますか?