1

さて、実際に私は日本語/中国語のテキストを解析するためのプログラムを書いていますが、それを英語の例にマッピングしようとしています. いいえ、パスワードリストの作成には使用したくありません:)。

次のようなスペースのないテキストがあるとします (ほとんどの東アジア言語ではスペースは使用されません)。

helloiamwritingproperenglish!

r適切なテキスト内の特定の文字位置が与えられます。

helloiamwritingproperenglish!
                ^

そのため、テキストは で分解できますprefix + 'r' + suffix


さらに、次のような文字の組み合わせ (単語) を含む SQLite に格納された辞書があります。

sqllite>SELECT writingKey from dic_writings;

writingKey
----------
A, Aa, ...

選択した文字「r」と、次のような接頭辞と接尾辞の(おそらく空の)部分文字列を含むすべての通常の単語を辞書で検索したい:

sqllite>FindCandidates('helloiamwritingp','r','operenglish!');
R, Pro, Rope, Prop, Proper

入力内のすべての単語を検索するクエリは次のtextようになります。

SELECT * FROM dic_writings WHERE (text LIKE ('%'||writingKey||'%'));

しかし、このアプローチはそれほど高速ではなく、選択した「r」を含む単語をフィルタリングする必要があります (実際には「r」をチェックするだけでは十分ではありません)。誰にもアイデアがありますか?お時間をいただきありがとうございます!

4

0 に答える 0