問題タブ [r-factor]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R 加算係数
次のような要因に従っていくつかのデータを分割します。
ここで、いくつかの要因を一緒に追加したいと思います。
しかし、次のエラーが表示されます。
どんな助けでも素晴らしいでしょう。
aaa val1 val2 ...
aaa
bbb
bbb
ccc
ccc
因子に分割すると、3 つになります。しかし、たとえば aaa と ccc を一緒に考えたいと思います。これは、他の列の値を合計する必要があることを意味します。
ありがとう
r - plyr は因子 [グループ化変数] の欠損レベルをスキップしますか?
plyr は因子 [グループ化変数] の欠損レベルをスキップしますか? これは、問題を診断する際の私の最初の質問です。
患者がstrata=rural
またはにいるデータセットがありstrata=city
ます。とを比較age
したい。treatment=A
treatment=B
たとえば、私はやろうとしています:
しかし、それは私に言います
t.test.formula(年齢 ~ 治療、データ = x、na.rm = TRUE) のエラー: グループ化係数には正確に 2 つのレベルが必要です
実行factor(data$strata)
してfactor(data$treatment)
、それぞれ 2 つのレベルしか表示されない場合 (それらはそれぞれ 2 つのラベルです。それは問題ではありませんよね?)。
plyr は、NA がグループ化係数のレベルであると考えていますか? エラーメッセージの問題は何ですか?
私はグーグルで、質問に答えるためにstackoverflowを調べてきました。私はRにかなり慣れていませんが、答えが見つかりませんでした。どんな助けでも大歓迎です。
だから私はいくつかのサンプルコードを持っています。Chase の例はうまく機能しましたが、自分のデータを使用すると、同じエラーが発生します。
dlply(data.c, .(strata), function(x) t.test(age~treatment, data=x, na.rm=TRUE
同じエラーが発生しました。
これがなぜなのかわかりません。
以下は私のdata.c
r - data.frameのstringsAsFactors設定を変更します
data.frame
ループを使用してデータを入力する関数を定義しています。ある時点で、警告メッセージが表示されます。
警告メッセージ:1:In
[<-.factor
(*tmp*
、iseq、value = "CHANGE"):無効なファクターレベル、NAが生成されました
stringsAsFactors
したがって、data.frameを定義するときに、オプションをに設定したいのですが、そのFALSE
方法がわかりません。
私が試してみました:
そしてまた:
stringsAsFactorsオプションを設定する正しい方法は何ですか?
r - 因子から二分変数を生成する
次のような要素を含むデータフレームがあります。
の特定の値に対して1と0として定義された二分変数を生成しようとしていますvar1
。ただし、次のコードを入力すると、次のようになります。
私は次のようになります:
最初の項目は1に変更されますが、残りはNAになります。どうすれば希望の結果を得ることができますか?
r - データフレームの値を変更せずに、データフレームの列クラスを因子から数値に変更します
重複の可能性:
情報を失うことなく因数を整数\数値に変換する方法
data.frame の factor 列について質問があります。因子を数値クラスに変換し、別のことを試したいのですが、私の結果はちょっと変です。次のようなデータフレームがあります。
クラス「因子」をクラス「数値」に変更したい。以下の解決策は良いと思いますが、作成したテーブルを見ると、すべての値が変更されています。この値の変化を防ぐ方法はありますか? または数値データフレームを取得するための他の解決策はありますか?
ありがとうございました
r - データフレームなしで因子レベルを追跡する
免責事項: このプロジェクトは、他の誰かのコードとして開始されました。最適ではない設計上の決定があると確信していますが、自分のプロジェクトよりも私の手は少し縛られています。
トレーニング済みのモデル オブジェクトを一連のスコアリング データと組み合わせて使用し、スコアリングされたデータのデータ フレームを作成する機械学習アルゴリズムがあります。モデル オブジェクトは、数式とデータ フレームを含むリストです。
モデルのデータ フレームの役割の 1 つは、スコアリング データ フレームに、モデルが期待するものと同じ列があり、それらの列の因子レベルが同じであることを確認することです。これを達成するために、トレーニング データの任意の 1 行をmodel$df
(データ フレーム) に保存します。次に、ややぎこちない線を使用します
これにより、値は同じですが因子レベルが拡張されたスコアリング データ フレームが生成されます。私の理解ではrbind
、両方のデータ フレームの因子変数のレベルが 2 つの個々のフレームのレベルの結合と等しくなるように強制するので、これはまさに私が必要とすることを行います。
しかし、それが正しい方法ではないことは確かです。推奨事項はありますか?
事前に感謝します。詳しく説明するために待機します。
r - R のゴースト ファクター レベル
重複の可能性:
R のサブセット化されたデータ フレームで因子レベルを削除する
特定の因子レベルで観測をサブセット化しました。これがレベルで行われたかどうかを確認するとsummary()
、レベルはまだリストされていましたが、観測値はゼロでした。サブセット化中に消えてはいけませんか?
r - Rでは、2つの要素が同等であるかどうかをどのようにテストできますか?
さまざまなレベルの要因の大きなリストを生成していますが、それらの2つが同じパーティションを定義していることを検出できるようにしたいと考えています。たとえば、次のすべてが互いに同等であると検出したいとします。
これを行うための最良の方法は何ですか?
r - 2 つの因子の水準を比較する
2 つの要因を評価して、それらが同じ数のレベルを持っているかどうかを確認することは可能ですか?もしそうなら、どのレベルが一方または他方に存在しないかを確認できますか?
r - factor()の不特定のレベル
私はコードブックが付属しているRのデータセットを使用しています。このデータセットは、基本的に、因子変数のさまざまなレベルのラベルがどうあるべきかを教えてくれます。たとえば、コードブックでは、「Sex」変数で、0が「女性」で、1が「男性」であることがわかります。この情報を使用して、それに応じて変数の値にラベルを付けています。
しかし、私は最近、コードブックが完全ではないことに気づきました。たとえば、1つの変数について、1が「はい」、2が「いいえ」であることがわかりますが、データで確認できる7、8、および9が何であるかはわかりません。私がやりたいのは、この変数に次のようにラベルを付けることです(またはこのようなもの):
基本的に、コードブックで指定されていないすべてのレベルに、それ自体のラベルを付けたいと思います。私が抱えている問題は、このコードブックにこれらのかなりの数が欠落していることです。実際には、データ内の未定義の値をすべて手動で調べて、上記の変数のコードを作成する必要はありません。さらに、これらの欠落しているレベルを除外すると、Rは自動的にそれらに「NA」というラベルを付けます。これは不要です。
概要:factor()を使用して、指定されていないすべてのレベルを「NA」としてラベル付けする代わりに、それらを自分自身としてラベル付けする方法を理解しようとしています。