description
最大500語の長いテキスト文字列があります。私は次のことをしたいと思います:
- ループして
description
、配列から多数の事前定義された単語を探しますkeywords
。これには、単一の単語、単語のペア、および単語のトリプレットが含まれます。 - 一致するものが見つかるたびに、この一致を新しい配列に
matches
追加し(プロセスの前半ですでに追加されている場合を除く)、一致した単語をから削除しdescription
ます。
私は解決策を探しましたが、それらのほとんどは、現在のニーズには複雑すぎる自然言語処理の最深部に飛び込むか、テキスト文字列をスペースで分割するだけのようです。その後、単語のペアを探すことは不可能です。
これを効率的に行う方法についてのアイデアをいただければ幸いです。