問題タブ [r-factor]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - サブセット化されたデータ フレームで未使用の因子レベルを削除する
を含むデータ フレームがありfactor
ます。subset
または別のインデックス関数を使用してこのデータフレームのサブセットを作成すると、新しいデータ フレームが作成されます。ただし、factor
変数は、新しいデータフレームに存在しない場合でも、元のレベルをすべて保持します。
これは、ファセット プロットを実行するとき、または因子レベルに依存する関数を使用するときに問題を引き起こします。
新しいデータフレームの因子からレベルを削除する最も簡潔な方法は何ですか?
次に例を示します。
r - 大きなIDの名前を変更する
N行のdata.frameがあるとします。id
列には10個の一意の値があります。これらの値はすべて、1e7より大きい整数です。それらの名前を1から10までの番号に変更し、これらの新しいIDをdata.frameの列として保存したいと思います。
id
さらに、1)与えられたものid.new
と2)id.new
与えられたものを簡単に判断したいと思いid
ます。
例えば:
r - 見えない文字列値を持つ新しいレコードをデータフレームに追加するときの見えない因子レベルにより、警告が発生し、結果は NA になります
2001 年から 2007 年までの請求データを含むデータフレーム (14.5K 行 x 15 列) があります。
2008 年の新しいデータを次のように追加します。alltime <- rbind(alltime,all2008)
残念ながら、それは警告を生成します:
私の推測では、以前のデータフレームに名前がなかった新しい患者が何人かいるため、それらにどのレベルを与えるべきかわかりません。同様に、「紹介医」の列に新しい未公開の名前が表示されます。
解決策は何ですか?
r - 適用内で使用すると、as.factor が文字を返すのはなぜですか?
を使用して変数を因子に変換したいapply()
:
結果:
これが因子ベクトルではなく文字ベクトルになる理由がわかりません。
r - stats :: reorder vs Hmisc :: reorder
stats::reorder
vsの奇妙な重なりを回避しようとしていますHmisc::reorder
。
ロードされていないHmisc
場合、必要な結果、つまり順序付けられていない要素が得られます。
ロード後Hmisc
、結果は順序付けられた要素になります。
直接電話stats::reorder
することで、私は今、何らかの理由で順序付けられた要素を取得します。
順序付けされていない要素が必要になると指定すると、使用されていないことを示唆するエラーが発生しstats::reorder
ますか?
したがって、問題は、Hmiscがロードされた状態で順序付けされていない要素を取得するにはどうすればよいかということです。
r - 整数レベルに変換せずに因子を連結するにはどうすればよいですか?
ベクトルを連結するときに、Rが因子を数値に強制変換するのを見て驚いた。これは、レベルが同じ場合でも発生します。例えば:
Rでこれを行う慣用的な方法は何ですか(私の場合、これらのベクトルはかなり大きくなる可能性があります)?ありがとうございました。
r - Rの要因:煩わしさ以上のもの?
Rの基本的なデータ型の1つは因子です。私の経験では、要因は基本的に苦痛であり、私はそれらを使用することはありません。私はいつも文字に変換します。何かが足りないような気がします。
因子データ型が必要になる場合に、因子をグループ化変数として使用する関数の重要な例はありますか?ファクターを使用する必要がある特定の状況はありますか?
r - ネストされたリストで引用されていないメンバーを引用する
R を使用して、特定の引用符で囲まれていない要素を含むリストを生成します。一番下をご覧ください - これは無効な JavaScript コードです。
R コード (動作しません)
R言語では、どうすればlist$x$ann
因子のメンバーを引用できますか?
この JSON を解析しようとすると、json2.js が失敗します。
サンプル データ (無効な JSON)
r - 係数を数値に変更-使用できない値に対処する方法
質問からのビッグデータセットがあります。SPSSからRに(SPSSのStata-Outputを使用して)インポートすると、各質問に対する答えが要因として得られました。
質問には1から10までの回答があります。ただし、欠落している値がたくさんあります。Rはそれらも認識します。
ただし、ここでいくつかの計算を行いたいと思います。たとえば、回答の平均を計算したいのです(あまり良い統計ではありませんが、気にしないでください)。
したがって、係数を数値に再コード化する必要があります。私はこれをで行いましas.numeric()
た。
ただし、現在、11から14としてエンコードされた欠落値があります。もちろん、このような平均を計算することはできません。
因子を数値として再コード化し、Rに10より大きい値をNAに設定するように指示する適切な方法は何でしょうか?
例:あなたは魚が好きですか?
r - Rにcsvデータセットをインポートしましたが、値は要因になります
私は R を初めて使用し、インポートしたデータセットにアクセスできません。私はRStudioを使用しており、csvファイルをインポートするときにデータセットのインポート機能を使用し、コンソールウィンドウからソースウィンドウに行を貼り付けました。コードは次のようになります。
ただし、データは私が慣れているように整数または数値ではなく、要因であるため、変数をプロットしようとすると、通常のプロットではなくヒストグラムのみが得られます。データを確認すると問題ないようですが、因子形式なので使用できません。