問題タブ [r-factor]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - データフレームで係数を整数に変換します
私は次のコードを持っています
最後に私のテーブルには次のような数字が含まれています
等々......
その後、特定の値よりも低いスコアなど、いくつかの基準に適合する値のみを取得しようとしています。
だから私は次のことをしています
だから私は問題は私のテーブルが整数ではなく因子を持っていることだと思います
私のanna.total$scoreが要因であり、整数にする必要があると思います
私が正しく読んだ場合、as.numericは私の問題を解決するかもしれません
as.numeric関数について読んでいますが、どのように使用できるのか理解できません
それで、私にいくつかのアドバイスをお願いしますか?
前もって感謝します
よろしくアンナ
PS:私は次のことを試しました
再び私は同じ問題を抱えています......
r - as.numeric を使用して因数を整数に変換する方法に関するアドバイス
重複の可能性:
データフレームで係数を整数に変換する
次のコードがあります
最後に私のテーブルには次のような数字が含まれています
等々......
その後、特定の値未満のスコアなど、いくつかの基準に適合する値のみを取得しようとしています
だから私は次のことをやっています
問題は、テーブルに整数ではなく因数があることだと思います
私の anna.total$score は要因であり、整数にする必要があると思います
正しく読めばas.numeric
問題が解決するかもしれません
関数について読んでいas.numeric
ますが、どのように使用できるかわかりません
そこで、アドバイスをいただけないでしょうか。
r - データフレームをボックスプロットできるように、因子のデータフレームを変更するにはどうすればよいですか?
列に可変量の数値と可変量の NA が含まれるデータフレームがあります。データフレームは次のようになります。
これから箱ひげ図を作りたいのですが、そうすると
エラーが発生します
私がする時
次の出力が得られます。
では、列が数値として表示されるようにデータフレームを変更するにはどうすればよいですか?
r - リストの第2レベルにアクセスする
私はこのようなリストを持っています
このリストの最初のレベルは増加する数です。2番目のレベルには、列名として年を含むテーブルがあります。
列名が2005である第2レベルのすべての要素の合計を作成したいのですが、これを行うにはどうすればよいですか?
r - 数式の R と係数コーディング
0 と 1 ではなく、値 1 と 2 が必要な場合など、カスタムの値付きダミーが必要な場合、数式インターフェイスをどのように使用すればよいでしょうか。推定は次のようになりsupp
ます。
この例では、さまざまな値があまり使用されていませんが、「書き直された」モデルの多くの場合に役立ちます。
EDIT:実際には、たとえば3つのレベルがあり、2つの列を別々にコーディングしたいので、1つは1/0変数で、もう1つは1/2変数です。上記の例には 2 つのレベルしかありません。
r - ggplot2 の geom_boxplot() : 空のレベルを強制的に表示する
データフレームに実際の欠損値を代入せずに、ggplot2 に boxplot に空のレベルを表示するように依頼する方法が見つかりません。再現可能なコードは次のとおりです。
だから私は何かが欠けていると思います。これらの欠落データがデータフレームで明示される可能性があるバランスの取れた実験を扱う場合、これは問題ではありません。しかし、たとえばコホートで観測されたデータでは、観測されていない組み合わせの欠損値をデータに代入することを意味します...助けてくれてありがとう。
r - 因子水準の不要な値を NA に置き換えます
空白の欠損値と NA の両方を含む大きなデータ フレームがあります。summary(factor(df$col)) を実行すると、次のような結果が得られます
( の後の空白に注意してください50000
。)
とsum(is.na(df$col))
は の数と同じ 12476 ですNA
が、空白と s の合計にしたいと思いNA
ます。
And then
try を実行して空白のレベルを作成しようとしましたが、が生成されたと表示されますが、出力は同じです。因子レベルに基づいて NA を作成する方法を知っている人、または欠落している値を置き換えるためのより良い解決策を知っている人はいますか? 問題は、空白が複数の空白文字であるため、に変換されなかった可能性があると思いますが、それを確認する方法がわかりません。
levels(df$col) <- c("A", "B", "Blank", "C")
df$col <- factor(df$col, exclude="Blank")
NA
NA
r - 範囲内の数値を係数で置き換える
一連の整数(年齢)であるデータフレーム列が与えられた場合、整数の範囲を順序変数に変換したいと思います。
現在のコードが機能しません。どうすればよいですか?
r - 動的な先行ゼロを使用してデータセットの係数を調整します
私は大きなものを持っていますdata.frame
(190万レコード、20列)。列の1つは、異なる長さの桁の値を持つ因数列です(異なる文字数/桁、たとえば567839、234324324、3243211など)。注:これらは数値コードであり、実際の値ではなく、異なる文字だけである場合もあります。この例の長さ。
ここで、桁数が13未満の場合に因子がゼロより前になるように、因子を13桁の因子に変換したいと思います。
例:
さまざまなアプローチを試しましたが、今は行き詰まっています。問題は、因子の長さがデータセット全体で異なることです。
例を挙げて、次のことを試しました。
data.frame
問題を特定するために、コードを実行する3つの異なる列を使用して作成します。
問題は、コードnchar(as.character(levels(df.test$V1)))
がベクトルの長さではdf.test$V1
なく、1つの値のみを使用することです。因子の最初のレベルの長さ(アルファベット/昇順)。そして、それはすべてのレコードで必要な先行ゼロの数を実行します。したがって、ベクトルコードはありません!
注:「nchar」コードを個別に実行すると、結果としてすべてのレコードの長さのベクトルが得られるため、機能するはずだと思いました...
nchar(as.character(levels(df.test$V1)))
ベクトル演算子として実行されないのはなぜですか?誰かが私のコードを変更する方法を教えてもらえますか?そうすれば正しい結果が得られますか?
前もって感謝します!
NB。実際の場合、この調整を実行する必要があるのは、の1つの列だけであることに注意してくださいdata.frame
。
r - Rで因子レベルを曜日ごとに並べ替えます
Rに次のdata.frameがあります:
因子レベルの順序を変更して、週が (米国の) 曜日順になるようにしたいと考えています。
でゆっくりと不可解な方法でこれを行うことができるようですrelevel()
。ただし、これは数値引数を 1 つだけ取り、それを一番上に移動します。そのためrelevel(daily$DoW, 7)
、 は日曜日を一番上に移動しますが、残りは順不同のままです (つまり、逆の順序で再レベル化する必要があります)。
実行可能ですが、もっと良い方法があるはずですよね?
(時系列解でも可)