問題タブ [dummy-variable]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 出力でNA値を生成するdummyVars
dummyVars
以前にパッケージの関数を使用Caret
して、値が欠落している文字/因子からダミー変数を作成しましたが、(NA)
正常に機能しました。
ただし、今回は出力にNA
値が含まれています。デフォルトでは、それNA
も別のエントリとして扱い、ダミー変数も作成します。何か不足していますか?前回はNA
値で機能したため、さらに心配です。
次のコードを使用します。
出力ファイル、つまりschar_data_raw_train_dum
が含まれますNA
。助けてください。
r - R: 別の変数を条件とする 1 つの変数の値に対してダミー変数を作成する
元の質問
データ フレーム内の x の各値に対してデータ フレームに一連のダミー変数を追加したいが、別の変数が NA の場合は NA を含みます。たとえば、次のデータ フレームがあるとします。
私は生産しようとしています:
- x == 1 の場合は z$var1 == 1、そうでない場合は y == NA、z$var1 == NA、そうでない場合は z$var1 == 0 のような var1。
- x == 2 の場合は z$var2 == 1、そうでない場合は y == NA、z$var2 == NA、そうでない場合は z$var2 == 0 のような var2。
- var3など
これをベクトル化する方法がわかりません。x の多数の値に使用できるソリューションを探しています。
アップデート
x の各インデックスを反復処理したいという混乱がありました。私はこれを探しているのではなく、x の一意の値ごとに変数を作成するソリューションを探しています。以下のデータを入力として取得する場合:
z$var1、z$var2、z$var3、z$var9 を探しています。ここで、z$var1 <- c(1, 1, NA, 0, NA) および z$var2 <- c(NA, 0, 1) 、0、NA)。元の解では、z$var1 <- z$var2 <- c(1,1,NA,0,NA) が生成されます。
stata - 因子とダミーの異なる限界効果
次のコマンドで異なる限界効果、つまり離散効果(ただし係数は同じ)が得られる理由を誰かが説明できますか。この発見を再現するためのデータセットを作成しようとしました。
両方の場合の限界効果が異なるのはなぜですか?
r - polycor パッケージ - 最適化での hetcor エラー
polycor パッケージのヘクター関数とここで見つけた手順を使用して、80 個の二分変数 (1440 ケース) のセットで因子分析を実行しようとしています: http://researchsupport.unt.edu/class/Jon/Benchmarks /BinaryFA_L_JDS_Sep2014.pdf
悲しいことに、データセットの残りの部分から関心のある変数のみを選択して因子分析を実行した後、一貫して次のエラーと警告が表示されるようです。
これは、上記の PDF で説明されているステップを実行したときのコマンドです。
これが何を意味するのか、どのように進めればよいのかわかりません... ご意見をお待ちしております。ありがとうございました!
r - このループを高速化して、data.table でダミー列を作成し、R に設定します
データ テーブルがあり、一意の日ごとに新しい列を作成し、その日が列名と一致する各行に 1 を割り当てたい
forループを使用してこれを行いましたが、data.tableとsetを使用して最適化する方法があるかどうか疑問に思っていましたか?
ここに例があります
私のテーブルは298k行で、実行に時間がかかりませんが(以下)、長いスクリプトの一部であり、非効率的なループがかなりあるため、全体の実行時間を短縮しようとしています.
実行時間:
前もって感謝します。
python-2.7 - Pandas で get_dummies を実行するときに他の変数を保持する
ID 変数と別のカテゴリ変数を持つ DataFrame があります。get_dummies を使用して、カテゴリ変数からダミー変数を作成したいと考えています。
ただし、これにより ID 変数が消えます。そして、後で他のデータセットにマージするために、この ID 変数が必要になります。
他の変数を保持する方法はありますか。get_dummies のドキュメントでは、何も見つかりませんでした。ありがとう!
r - 条件の多いダミー変数の作成 (R)
私のデータセットは次のようになります
(ATTXX は XX 年の学校への出席を示すダミー変数、GRADEXX は学年を示す)
個人が19/20歳のときに学校に通っている場合、= 1のダミー変数を作成しようとしています。たとえば、YOB = 1988 で ATT98 = 1 の場合、新しい変数 = 1 などです。dplyr で mutate を使用してこれを試みてきましたが、R (および一般的なコーディング) は初めてなので、エラー以外を取得するのに苦労しています。私が書いたコード。
どんな助けでも感謝します、ありがとう。
編集:
それで、何かが間違っていることに気づきました。コードを少し変更して、長い形式のデータ テーブルに別の列を追加しました。これが私が最終的にやったことです:
だからそれは例えばのように見えます
つまり、ATT 変数が 0 以外の値をとるときはいつでも、たとえ 19 歳か 20 歳でなくても、ダミー = 1 になります。何がうまくいかないのでしょうか?