0

重複の可能性:
php : 単語近接スクリプト?

Word Proximity Redux。

テキストのチャンク (任意の長さ) をスキャンし、指定/定義された用語を探すことができる PHP スクリプトを作成したいと思います。

次に、それらの発生間の距離を測定したいと思います (存在する場合)。

物理的な距離としての距離 - 発生の間にある単語/文字の数。(スペル/サウンド/文字数などを意味するものではありません。アイテムの数だけを個別に示しています)。

例: 検索する特定の用語 = Word1 Word2 スキャンする特定のテキスト = 何とか Word1 何とか何とか Word2 何とか。結果は次のようになります = Word1-Word2:+2 距離

(私は真剣にこれを十分に明確に説明し、最初の試みよりもうまく説明したことを願っています)

.

私は周りを偵察し、Google/here/other forums などを調べましたが、一致するものは何も見られませんでした。そのため、ここに投稿しています。

上記は欲求の最も基本的なものです。最終的には、出現が同じ文脈チャンク (段落、同じ見出しの下、または別のものなど) 内にあるかどうかをスキャンして確認できるようにしたいと考えています。したがって、最終的な目標は、単語とセマンティック ブロックの実際の距離に基づいてスコアを付けることです。

4

0 に答える 0