問題タブ [categorical-data]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 従属変数が因子/カテゴリ変数の場合の線形モデル (lm)?
関数で線形回帰を行いたいlm
。私の従属変数は と呼ばれる因子ですAccountStatus
:
独立変数として、いくつかの数値変数があります: Loan to value
、debt to income
およびinterest rate
。
これらの変数で線形回帰を行うことは可能ですか? ネットで調べたらダミーのものを見つけたのですが、どれも独立変数のものでした。
これはうまくいきませんでした:
r - R: 各因子レベルのダミー列に R 因子を展開する
R に 2 つの列を持つ非常に大きなデータ フレームがあります。Code
列(factor
858レベルのタイプ)からダミー変数を作成しようとしています。問題は、それを行おうとすると R Studio が常にクラッシュすることです。
列は一意ではありません。User
つまり、同じ を持つ複数の行が存在する可能性がありますUser
。最終的に行の数が同じままであるか、同じ行が sUser
の数で空でないいくつかの列を持つ 1 つの行にマージされるかどうかは問題ではありませんCode
。
小さなデータセットでは機能するが、私のものでは機能しないソリューションがいくつか見つかりました。
を使用してみ
model.matrix
ましたが、R Studio がクラッシュするだけですfor
でサイクルを試みましifelse
たが、コードが 4 時間実行された後、R Studio がクラッシュしたことに気付きました。
そのようなタイプのデータに対して高速で機能する方法をお勧めしていただければ幸いです。
ありがとう!
python - 「statsmodels」でベースとして扱うカテゴリを指定する
モデルにカテゴリ変数が渡されると、statsmodels
fit
カテゴリに対してダミー変数が自動的に生成されることを理解してください。たとえば、値が「IndianOcean」、「Thailand」、「China」、「Mars」の変数「Location」がある場合、フォームのモデルで変数を取得します
値の 1 つが表されていません。デフォルトでは、除外された変数は最も一般的ではないようです。理想的にはモデル仕様内で、どの値を「ベース値」として扱い、除外するかを指定する方法はありますか?
categorical-data - 数値変数をカテゴリおよびグループに変換する
患者の年齢の変数があります。私は18 歳から 92 歳までの180 values
年齢層を持っています。この変数を 3 つの水準を持つ因子として使用したいと考えています。
a: 18 ~ 57 歳 b: 58 ~ 68 歳 c: 69 ~ 92 歳
私が入力した:
しかし、私が得る応答は次のとおりです。
str(AGE.factor) 74 レベルの係数 "(18,19]","(19,20]",..: 44 44 44 44 44 44 50 50 50 28 ...
年齢がグループ化された変数の 3 つのレベルのみが必要です。
ありがとう
r - カテゴリ データを使用した R での 3D プロット
そのため、私は R での 3D プロット全体にかなり慣れていないため、ここや他の Web サイトや本でさまざまな記事や投稿を読むのに最後の 1 日を費やしました。そして、私は告白しなければなりません、私はまだ迷っています。だから、人々が私に与えることができるどんな助け/アドバイスも大歓迎です!
わかりました、これが私の問題です(サンプルデータ付き)。私は 3 つの場所 (AC) を 12 年間 (2001 年から 2012 年) 連続してサンプリングしましたが、多くのゼロがありました。だから私はテーブル/マトリックス/データフレームにこのデータを持っています:
私が望むのは地形図に似たもので、x 軸は場所、z 軸は年、y 軸は測定対象の値です。棒グラフを使用する可能性はありますが、理想的には wireframe() のようなものが最適です。私はさまざまな機能やパッケージをいじっていますが、なぜ私がやっていることはうまくいかないのか分かりません。
ご助力ありがとうございます!私は少しばかで、それを理解していない可能性があることを十分に認識しています。
乾杯!
編集:
というわけで「長文」に変更。x 値を非数値にすることはできなかったので、x2 に変更しました (以下を参照)。
次に、wireframe() 関数を使用しました。
今、私が理解できず、いじっているのは、色付けです。drape() サブ関数を使用すると、ラティスに色の変化のグラデーションを与えることができ、高い値が低い値とは異なる色を示すことを知っています。しかし、私はそれを機能させることができないようです。それは私に色のグラデーションを与えますが、ターコイズ色(デフォルトの色のグラデーションはピンクターコイズです-後でこれを変更しようとします)である必要がある最高値(これは0.83です)は、実際には〜に対応する色です0.3 値。エラーメッセージや警告メッセージは添付されておらず、なぜこれが起こっているのかわかりません...何かアイデアはありますか?
再度、感謝します!:)
r - データフレームの要素にレベルを追加
数値列と順序付けられた因子列を含むデータ フレームがあります。私は多くの NA 値を持っているので、レベルは割り当てられません。NA を「無回答」に変更しましたが、因子列のレベルにはそのレベルが含まれていないため、開始方法は次のとおりですが、エレガントな方法で終了する方法がわかりません。
新しいレベルを因子列に直接適用する方法はありますか。たとえば、次のようになります。
もちろん、これは正しく動作しません。
レベルの順序を維持し、「無回答」レベルを最後に追加したい。