問題タブ [word-frequency]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
objective-c - 1ワードの頻度をサポートするタグクラウドアルゴリズム
私はObjective-Cでタグクラウドを作成しようとしています。そして、良いアルゴリズムを見つけようとしています。私はいくつか試してみましたが、最初は非常にうまく機能しているように見えましたが、すべてに1つの欠陥がありました。出現回数が最も少ない単語が、頻度が最も高い単語と同じくらい頻繁に出現する場合、プロセス全体に欠陥がありました。
例(Googleの最初のアルゴリズム):
ここで、min = 5、max = 5、maxPercent = 300、minPercent = 75、およびcount = 5の場合、次のようになります。
だから私の質問は、これを考慮に入れて、最大頻度が最小頻度に等しい場合でも、各単語のフォントサイズを計算できるタグクラウドアルゴリズムはありますか?
java - ハッシュテーブルを使用して単語と使用頻度を保持するにはどうすればよいですか?
私は今とても混乱しています。ハッシュテーブルを使用するプログラムを作成することになっています。ハッシュテーブルには、使用頻度とともに単語が保持されます。クラス「Word」は、カウンターと文字列を保持します。単語が既に表にある場合、その頻度は増加します。私はこれを行う方法を研究してきましたが、迷っています。私は正しい方向に向けられる必要があります。どんな助けでも素晴らしいでしょう。
c++ - 単語頻度統計
事前インタビューで、私は次のような質問に直面しています。
文字列が単一の空白で区切られた単語で構成されている場合、文字列に出現する回数でソートされた降順で単語を印刷します。
たとえば、「abb」の入力文字列は、次の出力を生成します。
まず、入力文字列が1文字の単語で構成されているのか、複数文字の単語で構成されているのかは明確ではありません。前者の場合、それは単純かもしれません。
これが私の考えです:
入力文字列内のすべての1文字の単語の頻度の統計を取得し、それを並べ替えることができます(QuickSortなどを使用)。しかし、カウント配列がソートされた後、後でペアで印刷できるように、カウントに関連付けられた1文字の単語を取得するにはどうすればよいですか?
map<const char *, int>
入力文字列が複数文字の単語で構成されている場合は、aを使用して頻度を追跡する予定です。しかし、繰り返しになりますが、マップのキーと値のペアを並べ替える方法は?
質問はCまたはC++であり、どんな提案でも歓迎します。
ありがとう!
c - C (C++ ではない) の単語頻度統計
文字列が単一の空白で区切られた単語で構成されている場合、文字列に出現する回数で並べ替えられた単語を降順に出力します。
たとえば、「ab bc bc」の入力文字列は、次の出力を生成します。
この問題は、マップなどの C++ データ構造を使用すると簡単に解決できます。しかし、問題が単純な古い C でしか解決できない場合は、はるかに困難に見えます。
ここでは、どのようなデータ構造とアルゴリズムを使用する必要がありますか? できるだけ詳しく教えてください。DSとアルゴが苦手です。:-(
python - 文字列内の単語の頻度を効率的に計算する
長いテキスト文字列を解析し、Python で各単語が出現する回数を計算しています。私は機能する関数を持っていますが、それをより効率的にする方法があるかどうか (速度の点で) があるかどうか、およびこれを実行できる Python ライブラリ関数があるかどうかについてのアドバイスを探しているので、車輪の再発明はしていません。 ?
長い文字列 (通常、文字列内の 1000 語以上) に出現する最も一般的な単語を計算するためのより効率的な方法を提案できますか?
また、最初の要素が最も一般的な単語、2 番目の要素が 2 番目に一般的な単語などのリストに辞書を並べ替える最良の方法は何ですか?
c# - 各単語の頻度を数えるには
いくつかのテキストファイルを含むディレクトリがあります。各ファイルの各単語の頻度をカウントするにはどうすればよいですか?単語とは、文字、数字、および下線文字を含むことができる文字のセットを意味します。
string - Perl で記述された単語頻度カウンターの例が有用な出力を生成できないのはなぜですか?
私は Perl に非常に慣れていないので、学習演習として単語頻度カウンターを作成しようとしています。
ただし、作業した後、以下のコードのエラーを把握できません。これは私のコードです:
それは「ここに」印刷することでも、言葉でもありません。現時点では最適化について心配していませんが、その方向への入力も大歓迎です。
java - 二分木を使用して単語の頻度を追跡する
私は現在、二分木と二分探索木について学んでいます。私が取り組んでいる演習の 1 つは、テキスト ファイルを読み取り、各単語を二分木にアルファベット順に格納し、さまざまな方法で木をトラバースすることです。正確な仕様は次のとおりです。
テキストを読み取り、テキスト内のすべての単語 (アルファベット順) で構成される二分探索木を構築し、単語を保存して、単語の頻度 (各単語がテキストに出現する回数) のカウントをノードに保持します。クラスで言及されているツリー トラバーサルを実行します。
私の質問は、単語をツリーに追加するときに単語の頻度を追跡するにはどうすればよいですか? クラスで同一のノードを取り上げたことがないので、ここで立ち往生しています。どんな提案でも大歓迎です!
mysql - 単語のMySQLカウント頻度
特定の列に出現する単語の頻度をカウントできるようにしたいと考えています。
このコードは、一致する文の頻度を数えたい場合に機能しますが、個々の単語を検索する必要があります。