問題タブ [contingency]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - Rを使用して、大きな複数列の度数分布表を作成します
これを効率的に行うのに苦労しており、基本的な質問である場合はお詫び申し上げます。多数のバイナリ変数間の関係を、他の要約統計量なしで、単純に頻度とパーセントで要約するために、Nとパーセントで分割表を作成する必要があります。
具体的には、サンプルタイプXと臨床転帰Yを持つ患者の数を要約します。患者は、任意の数の転帰と任意の数のサンプルを持つことができます。つまり、各変数は相互に排他的ではなく、独立しています。
すべての結果(死亡、ICU入室、脚の脱落など)を列に、すべてのサンプルタイプ(血清、尿など)を行にしたいと思います。「陽性」反応の頻度と割合、つまり死亡して尿サンプルを採取した患者のNと割合のみをリストする必要があります。
この種のテーブルに役立つパッケージはありますか?私が見つけたものはすべて、優れた1xN変数分割表を作成するのに適しています。どういうわけかその出力の列を抽出し、それらをマスターテーブルにバインドしてすべてを支配することができれば、結果ごとに個別のテーブルを作成してもかまいません。もう1つのアイデアは、2つのmChoice(Hmiscパッケージ)変数の度数分布表を作成することです。これら2つの戦略のどちらかが可能かどうかはわかりません。
何か案は?
私が探しているのは次のようなものです。
サンプルデータを含めるように編集します。
r - 統計の偶発性 R
TRUE または FALSE の 2 つのベクトルがあります。基本的に、世帯、車を所有しているかどうか、金の時計を持っているかどうかに関するデータです。(注: 「車」と「金時計」は実際のカテゴリではありませんが、この質問の代替として有効です)。
車の所有と時計の所有の関係を知りたいので、使用する機能に関して、統計と R の両方についてアドバイスを使用できます。
アイデアは、「誰かが車を持っている場合、金の時計を持っている可能性が 25% あると 95% の信頼度で言える」と言うことができるようにすることです。
私は Cross.Table と assocscats をいじっていて、基本的に、標準的な統計の質問だと思うことに完全に混乱してしまいました。
どのテスト/関数を使用する必要があるかについての簡単な洞察はありますか? .265 の相関がありますが、信頼度を定量化したいと考えています。
私は次を含めてたくさん見てきました: 分割表を取得するにはどうすればよいですか? 当てはめ値が欠落している R のロジスティック回帰の分割表
ありがとう!!
spss - SPSSで分割表を入力する
次の形式の分割表があります。
このデータを SPSS v21 に取り込めないので、分析できません (カイ 2 乗)。このようにデータを直接入力して、分析>記述統計>クロス集計を行ってみたのですが、分析結果が正しくなく、変なカテゴリに分かれてしまい、カイ二乗値が2になってしまいました。私は144.2を取得します。これを正しく入力する方法について誰かが意見を持っている場合は、大いに感謝します。ありがとう!
r - 分割表を正規化する
テーブルがあるとします
と のエントリをマージし"www.a.com"
て"a.com"
取得したい
私は持っている
tab
問題は、値を必要なものに変換するにはどうすればよいですか?
r - 3 つの要素を持つフラットな 5 列の data.frame から R で 4 次元の分割表を設定する
Rにデータフレームがあります。最初の 2 列は、「はい」と「いいえ」の頻度の合計です。最後の 3 列はカテゴリ因子で、それぞれにラベルが付いています。
この形式から 4 次元分割表を作成しようとしていますが、どこからプロセスを開始すればよいかわかりません。
私のデータは次のようになります。
8 つの列から始めました。3 つのカテゴリ + 各カテゴリの 3 つの値 + (1) 書かれた見積もりの数、および (1) それらの見積もりの販売数 = 8。それぞれのカテゴリと値の文字列を連結して、上記の 3 つの列を形成しました。 . 19 のカテゴリがあり、各カテゴリには 2 ~ 6 の独自の数の属性があります。並べ替えにより、それぞれの列が順番に配置されますが、必ずしも 3 つのカテゴリとそれぞれの [はい] (販売済み) と [はい] (販売) といいえ(売れ残り)。平均販売率は 11.4% です。これらの 4 方向の偶発事象に対して Chi2 検定を実行して、平均値から最も強い外れ値を生み出す組み合わせを特定するために、頻度を具体化したいと考えています。基本的に 80046 の組み合わせがあり (19 が 3 を選択)、これら 3 つの選択肢のそれぞれにそれぞれのバケットがあります。
このデータをtable()
とxtabs()
関数、したがってchi2.test
. (カテゴリと値を連結する前のステップに戻る必要がありますか?)
私はRを初めて使用しますが、これらの大きな配列のプログラミングがはるかに優れているはずであることを知っています. SPSS にはアクセスできませんが、SAS にはアクセスできます (これも新しいものです)。
どんな方向性でも大きな助けになります。
------------------- 希望する出力は?返信 --------------------- さて、table
コマンドは data.frame を取得します
...分割表形式にしますよね?しかし、私はすでにイエスとノーを頻度形式で 3 つのカテゴリとしてリストしています。
この単一インスタンス形式に変更して、80046 行のテーブルを数百万行に分解する必要がありますか? table
または、既に 2 つの列に一覧表示されている [はい] と [いいえ] の頻度でコマンドを開始する方法はありますか?
r - 分割表と信頼区間
私は最近 deducer を発見しました。これは分割表関数です ( deducer の分割表を csv または xls としてエクスポートするを参照) 。
私がやろうとしているのは、ggplot の分割表の値をプロットして、y 軸に % 頻度、x 軸に沿ってカテゴリ データを示す棒グラフを表示することです。次に、可能であれば、エラーバーを作成して、全体に対する各変数の割合の信頼区間を示したいと思います。
データを使用した例mtcars
として、R は次のcontingency.tables
関数を使用してこれを生成します。
基本的に、行の合計と列の合計の両方で計算された x ギアと y シリンダーを備えた車の割合。
ddply などを使用してこれを生成し、これらの割合の標準誤差/信頼区間も追加する方法を誰も知りませんか? 私は本当に苦労しており、ライフラインがあれば本当に感謝しています!
r - Rの複数行分割表
このデータセットを考えてみましょう:
医学論文では、最初の表に母集団 (または必要に応じてそのサブグループ) を要約します。ここでは、行は年齢、性別、喫煙状況などになり、2 つの結果は別々の列にリストされます。連続変数は平均として報告されます。カウントとしてのカテゴリ変数。
- そのような分割表を作成する、欠けている関数があるかどうか疑問に思っていました。手動で行うこともできますが、データ セットが変更された場合に自動的に更新できるようにしたいと考えています。最終的にはラテックスで出力する必要があります。
- 関数は欠落データを無視する必要がありますが、それらの行は削除しません。
求めすぎ!?