問題タブ [frequency-distribution]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 度数分布の R 識別タイプ
正規分布していない度数分布に興味があります。正規分布していない度数分布表がある場合。ディストリビューションのタイプを識別する関数またはパッケージはありますか?
frequency-distribution - WinBUGS - 離散段階的分布の定義
モデルで次の形式の分布を定義したい: P(x=10)=0.10、P(x=15)=0.20、P(x=20)=0.70
WinBUGS FAQ には、独自の離散一様分布を、一様事前分布を持つカテゴリ変数として構築でき、必要な整数値を取ることができると書かれています。マニュアルの最初の部分にある blockerht の例を参照してください。
例を調べたところ、これだと思います:「自由度が不明な階層型t分布」
モデル仕様では、次のようなことを行います。
これは、個別のユニフォームを定義します。しかし、必要なフォームに到達する方法がわかりません。誰でも私を助けることができますか?
r - Rの名義変数からのランク付けされた度数分布
Webサイトを検索しましたが、問題の解決策を見つけることができませんでした。次のようなサンプルデータセットがあります。
idは名目変数であり、一意のユーザーを表し、もう1つはカウント変数です。
私が欲しいのは、ユーザーによるl1の分布を調べることです。したがって、指定されたデータセットを見ると、id=1の合計はl1=8です。id=2の合計はl1=9で、id=3の合計はl1=12です。
idに従ってl1の分布を見つけようとしていますが、行き詰まっています。関連する列をグループ化してから分布を見つける方法、または少なくともヒストグラムを作成する方法がわかりません。1つの変数でヒストグラムを作成することはできますが、名義変数でランク付けされた度数分布を作成することはできません。
statistics - SAS: 関連する変数
私は、SAS と統計分析全般の両方に非常に慣れていません。私はコンピューター サイエンスの学位を取得しており、統計学のオンライン コースを受講していますが、SAS で自分が望むことを達成する方法について混乱しています。オンラインで検索しても役に立ちませんでしたが、SAS や統計についてよく知らないので、正しい用語を使用していない可能性があります。
基本的に、データセットにいくつかの変数があり、それらを条件付きで頻度表に表示したいと考えています。
たとえば、Gender、Age、Alcohol_use という変数があるとします。私がやりたいのは、基本的に性別と年齢をアルコール使用に関連付ける度数表を作成することです。それで、それが理にかなっていれば、性別と年齢で同時に分類したいと思います. 一例は次のとおりです。
男性, 21-25 -> 適度に使用する
女性, 21-25 -> あまり使用しない
男性, 26-30 -> 頻繁に使用する
など...
したがって、最初の 2 つの変数の特定の条件で、3 番目の変数の度数分布表が必要になると思います。
通常、頻度表を表示するときは、PROC FREQ と書くだけです。表 性別 年齢 アルコール使用;
影響を受けるのは頻度表であるため、そこで何かを変更しますか? または、プログラムのデータ セクションにいくつかの条件を追加する必要がありますか?
どんな助けでも素晴らしいでしょう。私の質問について明確にする必要がある場合はお知らせください。ありがとう!
sql - SQL での相対度数の計算
私は、オブジェクトのメタデータ文字列 (テキストの説明など) を取得し、それを 1、2、および 3 グラムに分割するタグ推奨システムに取り組んでいます。
このシステムのデータは 3 つのテーブルに保持されます。
- 「オブジェクト」テーブル (例:記述されているもの)、
- 見つかったすべての 1、2、および 3 グラムで満たされた「トークン」テーブル (以下の例)、および
- (1) と (2) の間の関連付けと、これらの発生の頻度カウントを維持する「マッピング」テーブル。
したがって、LEFT JOIN を使用して、次のようなテーブルを作成できます。
ここで、単一のオブジェクト ID のコンテキスト内で各用語の相対確率を取得できるようにしたいと考えています。これにより、それらを確率でソートし、どの用語が最も可能性が高いかを確認できます (例: ORDER BY rel_prob DESC LIMIT 25
)
行ごとに、の結果を与える列を追加することを想定していますfreq/sum of all freqs for that given token_size
。たとえば、「a big」の場合、それは1/(1+3) = 0.25
. 「a」の場合、それ1/3 = 0.333
は などです。
私の人生では、これを行う方法を理解することはできません。どんな助けでも大歓迎です!
r - R:日付と時間ごとに頻度カウントを取得する方法
「Period」、「cell_id」、「daterank」、「timerank」の 4 つの変数を持つデータフレームがあります。個々の期間ごとに、各日付および各時間のセル ID (115 の一意のレベル (または cell_id) があります) の頻度を取得したいと考えています。"Period" は、個人 (5 人) の数値識別子です。 "daterank" の値は 0 ~ 29 です。 "timerank" の値は、1 ~ 24 です。値の例は、101、102、103、104、105、201..205、2401..2405 です。
これまでのところ、それを行う方法を理解できる唯一の方法は次のとおりです。
手動で入力した daterank と timerank の値を変更し続けることなく、「期間」ごとに「daterank」と「timerank」ごとに「cell_id」の頻度を取得する方法はありますか?
excel - ファーストネームとラストネームがExcelの差分列にあるときに頻度カウントを取得する方法
姓が 1 行、名が 1 行の Excel 2010 ブックがあります。約1800件のエントリーがあります。
同じ人物 (名字) が複数回出現する可能性があります。ジム・スミスは 5 回出現します。ジム・シムスがリストに表示される回数の頻度をカウントしたいと思います。
を使用=COUNTIF($B$2:$B$1800,B2)
しましB
た。 は姓です。問題は、名前が別の列にあるためにカウントされるリストに他の Smiths があることです。姓が同じである可能性のある各個人の頻度をカウントする方法を知っている人はいますか?