問題タブ [frequency-distribution]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
5 に答える
3878 参照

r - RのZipf(ランクに対する頻度)プロットのコマンドは何ですか

ネットワークトラフィックデータから、発信元と宛先のIPペアの1週間のデータ量(バイト数)とフロー数を取得しました。分布、つまり頻度とランクをプロットしたいと思います。そのためにRがすでに提供している機能があると思います。それは何であり、私のシナリオでその機能を使用する方法です。

0 投票する
4 に答える
21240 参照

sql - Oracleでヒストグラム/度数分布を作成する最適な方法は?

1970 年 1 月 1 日からのミリ秒数としてイベントの作成時間を列に格納する 2 つの列(一意の主キー) とを含むeventsテーブルがあります。eventkeycreatetimeNUMBER

先週の各時間に作成されたイベントの数を示す「ヒストグラム」または度数分布を作成したいと考えています。

width_bucket()これは、関数を使用して Oracle でそのようなクエリを作成する最良の方法ですか? width_bucket各行が属するバケット番号を特定してそれ以上を行うのではなく、他の Oracle 分析関数のいずれかを使用して、各バケットに分類される行数を導き出すことは可能count(*)ですか?

0 投票する
2 に答える
10856 参照

python - NLTK を使用した FreqDist

Python を使用して一連のドキュメントの度数分布を取得しようとしています。何らかの理由でコードが機能せず、次のエラーが発生しています。

手伝ってくれますか?

これまでのコードは次のとおりです。

0 投票する
2 に答える
5150 参照

c# - C#でアレイの度数分布を計算する最速の方法は何ですか?

私はその計算のための最良のアプローチは何であるか疑問に思っています。値の入力配列と境界の配列があると仮定しましょう-境界配列の各セグメントの度数分布を計算/バケット化したいと思いました。

そのためにバケット検索を使用するのは良い考えですか?

実際、私はその質問を見つけました。.Net/ C#を使用してコレクションの度数分布を計算する

しかし、その目的でバケットを使用する方法がわかりません。私の状況では、各バケットのサイズが異なる可能性があるためです。

編集:すべての議論の後、私は内部/外部ループの解決策を持っていますが、それでも辞書で内部ループを排除して、その場合にO(n)パフォーマンスを取得したいのですが、正しく理解していれば、入力値をバケットインデックスにハッシュする必要があります。では、O(1)の複雑さを持つある種のハッシュ関数が必要ですか?それを行う方法はありますか?

0 投票する
2 に答える
305 参照

java - 周波数が発生する時間の抽出

曲のサンプルを取り、そのサンプルに対して FFT (高速フーリエ変換) を実行します。曲の周波数を取得できますが、それらの周波数が発生する時間を取得できません。なので、時間の情報を取得しないと別のサンプルと合わせないといけないので、基本的には使い物になりません。

続行するにはどうすればよいですか?

0 投票する
1 に答える
5667 参照

r - Rの同じグラフの頻度と累積頻度曲線

(R で ggplot などを使用して) 頻度曲線と累積頻度曲線を 1 つの列 (2 行) に描画する方法はありますか? 私はこれについて明確に願っています..

このデータを使用することができます..

0 投票する
1 に答える
3354 参照

python - Python 頻度分布 (FreqDist / NLTK) の問題

単語のリスト (トークン化された文字列) を可能な各部分文字列に分割しようとしています。次に、各部分文字列で FreqDist を実行して、最も一般的な部分文字列を見つけたいと思います。最初の部分は正常に動作します。ただし、FreqDist を実行すると、次のエラーが表示されます。

これが私のコードです:

の出力substringsは問題ありません。ここにあります:

ただし、FreqDist を実行することはできません。どんな洞察も大歓迎です。この場合、各部分文字列の FreqDist は 1 しかありませんが、このプログラムは、はるかに大きなテキスト サンプルで実行することを意図しています。

0 投票する
1 に答える
85 参照

php - ユーザーが日付の繰り返しを選択するインターフェースのコーディング

ユーザーが自分の雑誌/新聞を配布する回数を選択する必要があるインターフェースを作成する必要があります。一部の雑誌/新聞が配布されます

  • 週に数回。
  • 月に数回:-日別(例:隔週火曜日)または日付別(例:1日、10日、28日)
  • 年に数回。

頻度を選択したら、各頻度項目に追加情報を追加する必要があります。たとえば、ユーザーが毎週月曜日と金曜日を選択した場合、月曜日に追加情報を追加し、金曜日に個別の情報を追加する必要があります。

誰かがこれを行う方法について何かアイデアがありますか?または、どこでもっと読んだり、いくつかの例を入手したりできますか?

このアプリケーションにはPHPとjavascript/jqueryを使用しています。

前もって感謝します。

0 投票する
2 に答える
1867 参照

python - Python NLTK FreqDist()はk、vをディスクに書き込むことでメモリ使用量を削減しますか?

NLTK を使用してかなり大きなデータセットの頻度分布を取得する小さなプログラムがあります。問題は、数百万ワードの後に​​、システムのすべての RAM を使い果たし始めることです。関連するコード行であると私が信じているのは次のとおりです。

キー、値ストアをディスクに書き込む方法が必要です。方法がわかりません。私は MongoDB のようなドキュメント ストアから離れ、純粋に Pythonic を維持しようとしています。誰かが何か提案があれば、私はそれをいただければ幸いです。

0 投票する
1 に答える
154 参照

python - freq dist 計算のために db クエリを効率的に処理するにはどうすればよいですか?

私はこれに少しの間取り組んでおり、頻度分布データベース側を作成しようとしています:

(うわー、180 行のコードベースがテストケースで 37 行になりました! :D - 実際の単語リストは 4 ではなく 2900 万であることに注意してください!!!)

私はそれを実現しました:

  • update_freq_dist内側のループ内に 2 つのクエリは必要ないはずです
  • データベース要素 (行) を反復処理する方法があります。たとえば、一度に 5 つずつです。

ただし、どちらの問題もどのように解決できるかわかりません。

解決策を考えられますか?