問題タブ [frequency-distribution]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
string - 文字列内の位置での文字の頻度
文字列全体のすべての位置で 4 文字の頻度をカウントしたいと考えています。文字はA、T、G、Cです
望ましい出力:
これまでのところ、私は Biostrings と呼ばれる R パッケージを使用してきましたが、これは動作しますが、perl でこれができるのだろうか?
r - R は、分数を合計して 100 になる整数のパーセンテージに変換します
分数として表され、降順にソートされた、さまざまなイベントの頻度のベクトルを計算しました。合計すると正確に 100 になる正の整数パーセンテージを必要とするツールに接続する必要があります。入力分布を最もよく表す方法でパーセンテージを生成したいと考えています。つまり、パーセンテージ間の関係 (比率) が入力分数の関係 (比率) に最もよく一致するようにしたいと考えています。
これらのパーセンテージを生成する関数がありますが、最適またはエレガントではないと思います。特に、「愚かな整数のトリック」に頼る前に、数値空間でより多くの作業を行いたいと考えています。
周波数ベクトルの例を次に示します。
そして、ここに私の機能があります:
何か案は?
excel - バイナリ信号の周波数と持続時間を計算する
120 Hz で収集された信号データを分析しようとしています。私は自由に使える Excel と SPSS を持っています (MATLAB と同様ですが、あまり詳しくありません)。私は約1時間半オンラインで検索してきましたが、探しているものが見つからないようです.
0 と 1 のリストがあります。各信号の持続時間を計算してから、信号の頻度分布をグラフ化します (つまり、1/10 秒の信号の割合、2/10 秒の信号の割合、@ 3/10 秒の信号の割合を示すヒストグラム... @ 1 秒など)。私が探しているのは逆累積分布だと思いますが、それに到達する前に、スプレッドシートでデータを処理する必要があります。
各信号の持続時間を取得するために、各「グループ」を合計する方法を理解するのに苦労しています。1 を含むセルの場合、上のセルに 0 が含まれている場合、新しい合計が開始され、0 が表示されるまで 1 の合計が続けられます。スプレッドシートの終わりまでに、信号持続時間のリストができます (1/120 秒で表されます。つまり、30 は 0.25 秒になります)。
処理するファイルが 100 個以上あるので、ファイルごとにこれをすばやく実行する数式またはマクロを探しています。
4 つの異なるデバイスのデータがあり、これらの信号分布をデバイスごとに比較したいと考えています。これをExcel、spps、またはmatlabで行う方がよいでしょうか?
ありがとうございました!
データは列にフォーマットされています。列 A にフレーム数、列 B (0 または 1) に信号があります。各フレームは 1/120 秒です (ファイルごとに数千のフレームがあります)。私は波形自体には興味がありません - 長い信号と短い信号の分布が条件間で大きく異なるかどうかを検出するために統計的な目的でこれを行っています. 最終的には、周波数のヒストグラムで表すことができる信号の長さのリストが必要です(周波数とは、波の周波数ではなく、発生数を意味します.
python - NLTK による度数分布の集計と出力
NLTK で 12,000 個のテキスト ファイルのコーパス全体でトライグラムを集計し、各トライグラムの頻度分布をファイルに出力しようとしていますが、次のエラーが発生します。
コードは次のとおりです。
よろしくお願いいたします。これに取り組み始める方法がわかりません。
r - Rで異なる列の度数分布を別々のプロット象限に分割する
私は宿題をやっていますが、表のこれら 4 つの列の度数分布を 4 つの異なるプロット象限に表示するためにどの引数を使用するかを理解するのに苦労しています。また、1 つのコマンドでそれぞれに色を割り当てるにはどうすればよいでしょうか。私はこれに非常に慣れていません、申し訳ありません
INCOME、VEHIC (車両価値)、HOMEEQ、および DEBT の度数分布を 4 つの異なるプロット象限に表示します。各変数を示すために異なる色を使用し、各 x 軸に省略されていないラベルを使用します。
これが私がそれ以前に実行したコードです。
ここでは、最初の 10 個の観測の頭です。それがテーブル内のすべてのベクトルであり、文字が多すぎるため、1000 の頭を作成できませんでした。
dput(head(stats,10))
私を助けてくれてありがとう、本当に感謝しています
php - PHP での文字列配列の最初の文字の分布
100,000 個の文字列要素を持つ PHP の配列を指定します。文字列の最初の文字の分布をカウントする方法を探しています。
したがって、基本的に私が探している出力は次のようなものです。
これはどのように達成されますか?
javascript - 特定のグループ数で、ある範囲の数値の配布グループを作成する方法
Javascript では、数値の範囲がある場合、0 ~ 10000 とします。このような:
そして、この範囲を入力によっていくつかのバケットに分割したいと思います:
この場合、この範囲を分割する数値の配列を返したいと考えています。結果の数値は次のようになります: 0、2000、4000、6000、8000、10000
10 バケットと言った場合、数字は 0、1000、2000 などになります。
私の問題は、8 個のバケット、12 個のバケット、32 個のバケットがある場合です.... JavaScript でこれを行うにはどうすればよいですか? ありがとう。
r - Rで度数分布を確率分布に変換する方法
n 行の観測値を持つ行列があります。観測値は、特徴の度数分布です。頻度分布を、各行の合計が 1 である確率分布に変換したいと思います。したがって、行列の各要素は、要素の行の合計で除算する必要があります。
作業を行う次の R 関数を作成しましたが、大きな行列では非常に遅くなります。
仕事をするR関数を提案したり、関数を最適化してより高速に実行する方法を教えてもらえますか?