“contingency”の関連問題_Stack Overflow日本語サイト

0 投票する

2 に答える

4269 参照

r - Rを使用して、大きな複数列の度数分布表を作成します

これを効率的に行うのに苦労しており、基本的な質問である場合はお詫び申し上げます。多数のバイナリ変数間の関係を、他の要約統計量なしで、単純に頻度とパーセントで要約するために、Nとパーセントで分割表を作成する必要があります。

具体的には、サンプルタイプXと臨床転帰Yを持つ患者の数を要約します。患者は、任意の数の転帰と任意の数のサンプルを持つことができます。つまり、各変数は相互に排他的ではなく、独立しています。

すべての結果（死亡、ICU入室、脚の脱落など）を列に、すべてのサンプルタイプ（血清、尿など）を行にしたいと思います。「陽性」反応の頻度と割合、つまり死亡して尿サンプルを採取した患者のNと割合のみをリストする必要があります。

この種のテーブルに役立つパッケージはありますか？私が見つけたものはすべて、優れた1xN変数分割表を作成するのに適しています。どういうわけかその出力の列を抽出し、それらをマスターテーブルにバインドしてすべてを支配することができれば、結果ごとに個別のテーブルを作成してもかまいません。もう1つのアイデアは、2つのmChoice（Hmiscパッケージ）変数の度数分布表を作成することです。これら2つの戦略のどちらかが可能かどうかはわかりません。

何か案は？

私が探しているのは次のようなものです。

サンプルデータを含めるように編集します。

r frequency contingency

2013-03-19T14:36:27.273

0 投票する

3 に答える

182 参照

r - 統計の偶発性 R

TRUE または FALSE の 2 つのベクトルがあります。基本的に、世帯、車を所有しているかどうか、金の時計を持っているかどうかに関するデータです。(注: 「車」と「金時計」は実際のカテゴリではありませんが、この質問の代替として有効です)。

車の所有と時計の所有の関係を知りたいので、使用する機能に関して、統計と R の両方についてアドバイスを使用できます。

アイデアは、「誰かが車を持っている場合、金の時計を持っている可能性が 25% あると 95% の信頼度で言える」と言うことができるようにすることです。

私は Cross.Table と assocscats をいじっていて、基本的に、標準的な統計の質問だと思うことに完全に混乱してしまいました。

どのテスト/関数を使用する必要があるかについての簡単な洞察はありますか? .265 の相関がありますが、信頼度を定量化したいと考えています。

私は次を含めてたくさん見てきました: 分割表を取得するにはどうすればよいですか? 当てはめ値が欠落している R のロジスティック回帰の分割表

ありがとう！！

r statistics regression correlation contingency

2013-04-01T02:50:52.120

0 投票する

1 に答える

1428 参照

spss - SPSSで分割表を入力する

次の形式の分割表があります。

このデータを SPSS v21 に取り込めないので、分析できません (カイ 2 乗)。このようにデータを直接入力して、分析＞記述統計＞クロス集計を行ってみたのですが、分析結果が正しくなく、変なカテゴリに分かれてしまい、カイ二乗値が2になってしまいました。私は144.2を取得します。これを正しく入力する方法について誰かが意見を持っている場合は、大いに感謝します。ありがとう！

spss chi-squared contingency

2013-05-29T20:48:54.473

0 投票する

1 に答える

628 参照

r - 分割表を正規化する

テーブルがあるとします

とのエントリをマージし"www.a.com"て"a.com"取得したい

私は持っている

tab問題は、値を必要なものに変換するにはどうすればよいですか?

r contingency

2013-06-07T18:07:25.650

0 投票する

1 に答える

177 参照

r - 3 つの要素を持つフラットな 5 列の data.frame から R で 4 次元の分割表を設定する

Rにデータフレームがあります。最初の 2 列は、「はい」と「いいえ」の頻度の合計です。最後の 3 列はカテゴリ因子で、それぞれにラベルが付いています。

この形式から 4 次元分割表を作成しようとしていますが、どこからプロセスを開始すればよいかわかりません。

私のデータは次のようになります。

8 つの列から始めました。3 つのカテゴリ + 各カテゴリの 3 つの値 + (1) 書かれた見積もりの数、および (1) それらの見積もりの販売数 = 8。それぞれのカテゴリと値の文字列を連結して、上記の 3 つの列を形成しました。 . 19 のカテゴリがあり、各カテゴリには 2 ～ 6 の独自の数の属性があります。並べ替えにより、それぞれの列が順番に配置されますが、必ずしも 3 つのカテゴリとそれぞれの [はい] (販売済み) と [はい] (販売) といいえ（売れ残り）。平均販売率は 11.4% です。これらの 4 方向の偶発事象に対して Chi2 検定を実行して、平均値から最も強い外れ値を生み出す組み合わせを特定するために、頻度を具体化したいと考えています。基本的に 80046 の組み合わせがあり (19 が 3 を選択)、これら 3 つの選択肢のそれぞれにそれぞれのバケットがあります。

このデータをtable()とxtabs()関数、したがってchi2.test. (カテゴリと値を連結する前のステップに戻る必要がありますか?)

私はRを初めて使用しますが、これらの大きな配列のプログラミングがはるかに優れているはずであることを知っています. SPSS にはアクセスできませんが、SAS にはアクセスできます (これも新しいものです)。

どんな方向性でも大きな助けになります。

------------------- 希望する出力は？返信 --------------------- さて、tableコマンドは data.frame を取得します

...分割表形式にしますよね？しかし、私はすでにイエスとノーを頻度形式で 3 つのカテゴリとしてリストしています。

この単一インスタンス形式に変更して、80046 行のテーブルを数百万行に分解する必要がありますか? tableまたは、既に 2 つの列に一覧表示されている [はい] と [いいえ] の頻度でコマンドを開始する方法はありますか?

r contingency

2013-07-09T21:52:51.220

0 投票する

0 に答える

674 参照

r - 分割表と信頼区間

私は最近 deducer を発見しました。これは分割表関数です ( deducer の分割表を csv または xls としてエクスポートするを参照) 。

私がやろうとしているのは、ggplot の分割表の値をプロットして、y 軸に % 頻度、x 軸に沿ってカテゴリデータを示す棒グラフを表示することです。次に、可能であれば、エラーバーを作成して、全体に対する各変数の割合の信頼区間を示したいと思います。

データを使用した例mtcarsとして、R は次のcontingency.tables関数を使用してこれを生成します。

基本的に、行の合計と列の合計の両方で計算された x ギアと y シリンダーを備えた車の割合。

ddply などを使用してこれを生成し、これらの割合の標準誤差/信頼区間も追加する方法を誰も知りませんか? 私は本当に苦労しており、ライフラインがあれば本当に感謝しています!

r plyr contingency deducer

2013-07-27T06:52:49.373

0 投票する

1 に答える

315 参照

r - Rの複数行分割表

このデータセットを考えてみましょう:

医学論文では、最初の表に母集団 (または必要に応じてそのサブグループ) を要約します。ここでは、行は年齢、性別、喫煙状況などになり、2 つの結果は別々の列にリストされます。連続変数は平均として報告されます。カウントとしてのカテゴリ変数。

そのような分割表を作成する、欠けている関数があるかどうか疑問に思っていました。手動で行うこともできますが、データセットが変更された場合に自動的に更新できるようにしたいと考えています。最終的にはラテックスで出力する必要があります。
関数は欠落データを無視する必要がありますが、それらの行は削除しません。

求めすぎ!?

r contingency

2013-08-13T05:36:01.217

問題タブ [contingency]

Reference