A別のテキスト ブロック( ) に含まれるテキスト ブロック ( ) の量を計算する必要がありますB。Btextには text ではない/すべきではない追加のテキストが含まれているため、 soundex のような単純なアルゴリズムは私にとって素晴らしい結果を提供していませんA。の特定の割合Aが 内Bにあることを確認し、 への追加を無視する必要がありますB。
私の場合にうまく機能する可能性のある単純なアルゴリズムについて最初に考えたのは、文に分割Aし、文の総数を記録してから、各文Bのインスタンスを検索してパーセンテージを提供することです。これは機能するはずですが、かなりハッキリしているように感じます。私よりも知的な誰かが、同様の原理でより良い計算を提供するアルゴリズムを考案したと確信しています。