問題タブ [word-frequency]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
4 に答える
11022 参照

php - php を使用したテキストで最もよく使用される単語

以下のコードは、stackoverflow で見つけたもので、文字列内の最も一般的な単語を見つけるのにうまく機能します。しかし、「a、if、you、have など」のような一般的な単語を数えることを除外できますか? または、数えた後に要素を削除する必要がありますか? どうすればいいですか?前もって感謝します。

0 投票する
1 に答える
906 参照

javascript - 単語の頻度をカウントするブックマークレットを作成する

Web ページ上のすべてのテキストをカウントアップし、結果を絶対位置の div に表示するブックマークレットを作成したいと考えています。

私が行ったすべてのGoogle検索は、フォームまたはテキスト領域または既知のdiv ID内の単語の総数を数えることについて話しています。それは私が欲しいものではありません。各 /w が Web ページ全体に表示される回数が必要です。

私はこれを行う方法がわからないことを知るのに十分なJavaScriptを知っています。

0 投票する
2 に答える
1657 参照

vb.net - キーワードを除く、文字列内の単語頻度 (最も重要な単語) のカウント

文字列内の単語 (一部のキーワードを除く) の頻度をカウントし、DESC で並べ替えたいと思います。それで、どうすればできますか?

次の文字列では...

除外キーワードの場所

出力は次のようになります

PSいいえ!私はグーグルを再設計していません!:)

0 投票する
2 に答える
475 参照

php - 単語または単語シーケンスの頻度を置き換えてカウントする方法は?

私は2つのことをする必要があります。最初に、最も使用されている単語単語シーケンス(nに制限されている)である特定のテキストを見つけます。例:

Lorem * ipsum * dolor sit amet、consecteturadipiscingelit。Nunc auctor urna sed urna mattis nec interdummagnaullamcorper。Donec ut lorem eros、idrhoncusnisl。Praesent sodales lorem vitae sapien volutpat et accumsanloremviverra。Proin lectus elit、cursus ut feugiat ut、porta sitametleo。Cras est nisl、aliquet quis lobortis sit amet、viverranonerat。faucibus orci luctus et ultrices posuerecubiliaCuraeのVestibulumanteipsum primis ; 整数euismodscelerisquequam、et aliquet nibhdignissimat。Pellentesque ut elitneque。Etiam facilisis nisl eu mauris luctus in consequatliberovolutpat。Pellentesque auctor、suscipit mollisのjusto、erat justo sollicitudin ipsum、 cursus erat ipsumidturpis。tincidunthendreritscelerisqueで。

(一部の単語は省略されていますが、これは例です)。

座ってアメットではなく、シットアメット結果を出したい

始める方法について何かアイデアはありますか?

次に、特定のリストから一致したすべての単語または単語シーケンスを特定のファイルにラップする必要があります。

このため、リストに別の座る単語がある場合に座るアメットがラップされるのを避けるために、長さを降順で結果を並べ替えてから、置換関数で各文字列を処理すると思います。それは良い方法ですか?!

ありがとうございました

0 投票する
10 に答える
85956 参照

python - Pythonを使用してソートされた単語頻度カウント

Pythonを使用して、テキスト内の単語の頻度をカウントする必要があります。単語を辞書に保管し、これらの単語ごとにカウントすることを考えました。

ここで、出現回数に従って単語を並べ替える必要がある場合。キーをカウントとして、単語の配列を値として持つ新しい辞書を使用する代わりに、同じ辞書でそれを行うことはできますか?

0 投票する
3 に答える
11933 参照

search - luceneインデックスで単語の頻度を数える

誰かがすべてのluceneインデックスで単語の頻度を見つけるのを手伝ってもらえますか?
たとえば、ドキュメントAに3つの単語(B)があり、ドキュメントCに2つの単語がある場合、単語(B)の頻度を示す5を返すメソッドが必要です。すべてのluceneインデックスで

0 投票する
1 に答える
20366 参照

php - テキスト内の単語の頻度を数えますか?

重複の可能性:
php: 特定の文字列内の単語のインスタンスを並べ替えてカウントする

文字列を入力として受け取り、それを単語に分割し、各単語の出現頻度でソートされた単語の配列を返すphp関数を作成しようとしています。

これを達成する最もアルゴリズム的に効率的な方法は何ですか?

0 投票する
1 に答える
512 参照

java - Web をクロールして単語を保存するための最も簡単なツール (Windows プラットフォーム)?

Web ページをクロールし、キーワードをその頻度とともに保存したいと考えています。たとえば、URL: http://www.dmoz.org/Arts/からカテゴリ Arts をクロールし、単語のリストを頻度とともに保存します。だから私は次の出力が欲しい

単語頻度
映画 400
歌 100
雑誌 120

それを達成する最も簡単な方法はどれですか?どの言語のツールやライブラリも非常に役立ちます。

0 投票する
2 に答える
662 参照

php - テキストのブロックで最も使用されている 2 つの単語の組み合わせを見つけるにはどうすればよいですか?

連続して使用した最も一般的な 2 つの単語をテキスト ブロックから特定するにはどうすればよいですか? 言い換えれば、テキストをコピーして貼り付けることができるオンラインまたはオフラインのツール (またはコード) があり、次のような最もよく使用される 2 つの単語の頻度を出力します。

最も使用されているものから最も使用されていないものへ:

「猫」 2.9% 「彼女が言った」 1.8% 「行った」 1.2%

ありがとう

0 投票する
1 に答える
116 参照

java - 単語の分布配列を見つけるJavaプログラム

ファイルの各行の単語の頻度を知りたいです。ファイル内のすべての単語に対してこれを行いたいです。JavaでBufferedReaderとFileReaderを使用しています。