2

数百語の長さのテキストを取り、キーワードの配列を生成する利用可能なPHP関数を知っている人はいますか?つまり。最も重要で、頻繁に発生する固有の用語は?

ありがとうフィリップ

4

2 に答える 2

7

そのような関数は存在しません(存在する場合は魔法のようになります)が、何かを始めるには、次のようにすることができます。

  1. スペースでテキストを分割し、単語の配列を生成します。
  2. ストップワードと不要な句読点と記号を削除します(正規表現を使用している可能性があります-を参照してくださいpreg_replace)。
  3. 残りの配列内の各単語の出現回数をカウントし、頻度の順に並べ替えます(したがって、最も頻繁に出現する単語は最初のオフセットにあります。つまり$words[0])。
  4. array_uniqueを使用して重複を削除し、出現頻度順に並べられた一意のキーワードの配列を生成します。
于 2009-08-27T01:32:39.213 に答える
0

このような何かがトリックを行う可能性があります:

$thestring = 'the most important, frequently occuring unique terms?';
$arrayofwords = explode(" ", $thestring);
echo print_r($arrayofwords);

また、コンマ「、」を空白に置き換えて、クリーンなキーワードを取得することもできます。

$thestring = 'the most important, frequently occuring unique terms?';
$cleaned_string = str_replace(",", "", "$thestring");
$arrayofwords = explode(" ", $cleaned_string);
echo print_r($arrayofwords);
于 2009-08-27T01:38:44.730 に答える