問題タブ [dataframe]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 頻度を要約するための table() の as.data.frame
Rでは、次のように表形式データの要約を作成するメモリ効率の良い方法を探しています。
たとえば、data.frame
foo
私がtable()
要約に使用したものを取り、続いas.data.frame()
て頻度カウントを取得します。
これにより、次の頻度カウントが得られますbar
私が直面している問題は、x
とのレベルが多くy
、64 GB を超える大量のメモリを使い始めることです。この種の頻度カウントを行う別の方法があるかどうか疑問に思っていました。最初のステップとして を設定stringsAsFactors=F
しましたが、これで問題が完全に解決するわけではありません。
r - data.frame コマンドでリストから列名を指定する
cols
列名を含むリストがあります:
cols <- c('Column1','Column2','Column3')
このコマンドを再現したいのですが、リストを呼び出します。
data.frame(Column1=rnorm(10))
試してみると、次のようになります。
> data.frame(cols[1]=rnorm(10))
Error: unexpected '=' in "data.frame(I(cols[1])="
orでラップcols[1]
しても同じことが起こります。I()
eval()
data.frame()
そのアイテムをベクトルからコマンドにフィードするにはどうすればよいですか?
アップデート:
背景としてcalc.means()
、データ フレームと変数のリストを受け取り、大規模で複雑な ddply 操作を実行し、変数によって指定されたレベルで要約する関数を定義しました。
このコマンドで私がやろうとしているのdata.frame()
は、集計レベルを一番上まで戻しcalc.means()
、各ステップで再実行しrbind()
、結果を互いに接着するために使用することです。rbind を適切に機能させるには、「すべて」の値を持つダミー列を追加する必要があります。
cast
基本的に、マージンのような機能を ddply に入れていますが、実行ごとに列名を再入力したくありません。完全なコードは次のとおりです。
list - data.framesのリストを折りたたむためのコードを改善する
親愛なるStackOverFlowers(略して花)、
単一の(巨大な)data.frameに折りたたむdata.frames(walk.sample)のリストがあります。折りたたみ中に、リストのどの要素からどの行が来たかをマーク(別の列を追加)したいと思います。これは私がこれまでに持っているものです。
これは、折りたたむ/スタックする必要があるdata.frameです。
行がどの要素から来たかを示す列を追加し、その後に既存のdata.frameに追加する関数を作成しました。
おそらくdo.call()または他のより一般的な関数を使用して、これをよりエレガントに実行できるかどうか知りたいですか?
r - Rで重複する属性を持つ行を削除します
次のような列を持つ大きなデータフレームがあります。
そのデータフレームの各行は、1つのエントリに対応します。一部のIDのそのデータフレーム内には、いくつかのエントリ(行)が存在します。これらの複数の行を削除したいと思います(明らかに、他の属性は同じIDで異なります)。または、別の言い方をすれば、IDごとに1つのエントリ(行)だけが必要です。
ID列で使用するunique
と、レベル(またはそれぞれの一意のID)のみを受け取りますが、他の属性も保持したいと思います。を使ってみましたapply(x,2,unique(data$ID))
が、これもうまくいきません。
r - R: data.frame の要素を置き換えるには?
「#N/A」を含む data.frame の要素を「NULL」に置き換えようとしていますが、問題が発生しています。
[<-.data.frame
( 、リスト、値 = "NULL") のエラー*tmp*
: 新しい列は既存の列の後に穴を残す
問題は、私のインデックスが data.frame をベクトルとして扱っていることだと思いますが、replace 関数は何らかの方法でそれを別の方法で扱っていますが、何が問題なのかわかりませんか?
r - データフレームで繰り越された最後の観測?
私が取り組んでいるデータ セットの最後に欠損値がある場合、「最後の観察の繰り越し」を実装したいと考えています。
これを行うための簡単なコードを次に示します(その後の質問)。
現在、これは単純なベクトルに最適です。しかし、データフレームでどこで試して使用するか:
データ フレームを文字マトリックスに変換します。
マトリックスに変換せずに、data.frame で LOCF を実行する方法を考えられますか? (ループなどを使用して混乱を修正することもできますが、よりエレガントなソリューションが欲しいです)
r - マトリックス、data.frame、またはベクトルの行を別のものに従って並べ替えるにはどうすればよいですか
行が test1 と同じ順序になるように、test2 を並べ替えるにはどうすればよいですか? 例えば
reorder (test1, test2) で reorder 関数を使用しようとしましたが、正しい構文を理解できませんでした。並べ替えにはベクトルが必要で、ここでは行列を使用しています。私の実際のデータには、1 つの文字ベクトルと data.frame としての別のベクトルがあります。上記の例では、データ構造はあまり重要ではないと考えました。構文に関する助けが必要なだけで、それを実際の問題に適応させることができます。
r - R の質問です。data.frame で lappy を使用し、出力付きの新しい変数を作成する
data.frame (「UNCA」と呼ばれる) に 13 個の量的変数があります。
変数の名前は、q01_a、q01_b、...q01_m です。
同じ値を持つが因子としてコード化された 13 個の新しい変数を作成したいと考えています。
これら 13 個の新しい変数に q01_a.F、q01_b.F、...q01_m.F という名前を付けたいと思います。
どんな助けでも大歓迎です!
r - Rの質問。4つの条件すべてを満たす新しいデータセットを作成する
次の4つの条件がすべて満たされる新しいデータセットを作成したいと思います。
ありがとう!
r - data.frame 列を因子から文字に変換する
私はデータフレームを持っています。彼を呼びましょうbob
:
このデータ フレームの行を連結したいと思います (これは別の質問になります)。でも、見てください:
Bob
の列は因子です。たとえば、次のようになります。
私はこれを理解し始めていませんが、これらはbob
? 私が必要とするものではありません。
奇妙なことに、私はbob
手で列を通り抜けることができます。
これは正常に動作します。そして、いくつか入力した後、列が因子ではなく文字である data.frame を取得できます。だから私の質問は:どうすればこれを自動的に行うことができますか? 各列を手動で処理することなく、factor 列を持つ data.frame を character 列を持つ data.frame に変換するにはどうすればよいですか?
おまけの質問: 手動のアプローチが機能するのはなぜですか?