問題タブ [frequency-distribution]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
3 に答える
2489 参照

.net - .Net/C# を使用したコレクションの度数分布の計算

Linqなどを使用して.Netコレクションの頻度分布を計算する高速/簡単な方法はありますか?

例: 任意に長いリストには、多くの繰り返しが含まれます。リストをたどり、繰り返しをカウント/追跡する賢い方法は何ですか?

0 投票する
2 に答える
24280 参照

matlab - MATLAB:度数分布

テキストファイルに500個の数値(1から25000の範囲)の生の観測値があります。MATLABで度数分布を作成したいと思います。ヒストグラム(履歴)を試しましたが、ブロックやバーよりも度数分布曲線の方が好きです。

どんな助けでも大歓迎です!

0 投票する
1 に答える
745 参照

full-text-search - ネットワークドライブのインデックス作成頻度

私が働いている会社には、ユーザーのドライブにマップされた複数のネットワークドライブに保存および共有されている何百万ものドキュメントがあります(例:d:\から\ server1 \など)。

私が実装したいのは、ネットワークドライブをクロールし、ユーザーがフルテキストインデックスを使用してファイルをすばやく見つけられるようにすることです。

私の現在のインデックス戦略Lucene.net

しかし、ネットワーク上を移動するパケットは言うまでもなく、インデックスを作成するドキュメントが何百万もあるため、ネットワークドライブのインデックスを作成する頻度がわかりません。

したがって、問題は、インデックス作成頻度をどのように実装する必要があるかということです。
私は例としてGoogle/Windowsデスクトップ検索インデックスの頻度について調査を行ってきましたが、成果はありませんでした。

0 投票する
1 に答える
792 参照

sql - SQLクエリ:多対多の関係で頻度をカウントする方法は?

ブログ投稿用のテーブルとタグ用のテーブルがあり、それらの間に多対多の関係があります。

ブログ投稿のサブセットで最も頻繁に使用されるタグを抽出するにはどうすればよいですか? (たとえば、過去 1 年間のもののみ) ブログ投稿サブセットに関連付けられているすべてのタグの頻度を抽出する方法はありますか?

ありがとう

編集:私のスキーマ:

0 投票する
3 に答える
921 参照

cryptography - 暗号化。英語の「通常のテキスト」?

文字の頻度に基づいて「通常の英語」のテキストを暗号化および復号化するソフトウェアを作成するように依頼されました。

問題は、公式の頻度が一致するテキスト サンプルをどこで見つけることができるかということです。

今までレフ・トルストイの「戦争と平和」をやってみたのですが、うまくいきませんでした..

LE: 単語のリストだけではなく、処理を行うためのテキスト サンプルが必要です。
LE2: 目標は、2000 文字の長さのテキストで 26 から 20 を推測することです。

0 投票する
2 に答える
907 参照

python - データセットの「ウィグリネス」を決定する-Python

私は、一連のデータの小刻みに動くことを実装する必要があるソフトウェアに取り組んでいます。これが私が受け取る入力のサンプルであり、各垂直ピクセルストリップの明度プロットとマージされています。 代替テキスト

左マージンが本当に波打っていること(つまり、最小値/最大値が1トンあること)は簡単にわかります。画像の重要なポイントのセットを生成したいと思います。ガウス平滑化関数をデータに約10回適用しましたが、そもそもかなり波打っているようです。

何か案は?

これが私の元のコードですが、(小刻みに動くために)非常に良い結果を生成しません:

0 投票する
4 に答える
8446 参照

python - FreqDist、pythonを使用して単語の頻度を合計します

FreqDistのfd.items()を使用して単語の頻度を合計するにはどうすればよいですか?

たとえば、の各単語most_freq_wが10回出現する場合、結果は次のようになります。100

!!! テキスト内のすべての単語の数は必要ありません。最も頻繁に使用されるのは10語だけです。

0 投票する
8 に答える
48546 参照

r - Rで指定された平均、SD、スキュー、尖度の分布を生成する方法は?

平均、SD、スキュー、および尖度がわかっているRで分布を生成することは可能ですか? これまでのところ、乱数を作成し、それに応じて変換するのが最善の方法のようです。適応できる特定のディストリビューションを生成するように調整されたパッケージがある場合、私はまだそれを見つけていません。ありがとう

0 投票する
1 に答える
2446 参照

r - Rでデータのスライドグループの平均をプロットするにはどうすればよいですか?

Rでプロットしようとしている度数分布があります。ただし、データセットは非常にノイズが多く、乱雑なプロットになります。

10 単位のスライディング ウィンドウの平均を取り、代わりにそのデータをプロットしたいと思います。データポイントの数を減らすことで、プロットがクリーンアップされることを願っていますか?

scatter.smooth() と loess() を試しましたが、これらは私が望むことをしません。私はこれを自分でコーディングできましたが、時間を節約できる機能を誰かが知っているかどうか疑問に思いましたか?

0 投票する
1 に答える
53480 参照

r - 因子頻度のヒストグラムプロットを取得する(要約)

私は多くの異なる値を持つ因子を持っています。実行するsummary(factor)と、さまざまな値とその頻度のリストが出力されます。そのようです:

頻度値のヒストグラムを作成したいと思います。つまり、X軸には発生するさまざまな頻度が含まれ、Y軸にはこの特定の頻度を持つ要因の数が含まれます。そのようなことを達成するための最良の方法は何ですか?

編集:以下の答えのおかげで、私ができることは、テーブルから頻度の係数を取得し、それをテーブルで取得して、それもグラフ化することであることがわかりました(f係数の場合):