問題タブ [rbind]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - システム R で 2 つ以上のデータ フレームを結合する
私の質問は、システム R で 2 つ以上のデータ フレームを結合する方法です。
例えば:
2 つのデータ フレームがあります。
最初:
2番目:
私はこれを必要とする:
次のように、各ベクトルに追加を使用しようとしました。
for( i in 1:length(first)){
f<-do.call(rbind, mix)
しかし、それは私が必要としていたようには機能しませんでした。マトリックスを取得できませんでした。別の構造を取得しました。
r - R:空のデータフレームに行を追加すると列名が失われます
Rから始めたばかりで、奇妙な動作に遭遇しました。空のデータフレームに最初の行を挿入すると、元の列名が失われます。
例:
ご覧のとおり、列名1と2はX5とX6に置き換えられました。
誰かがこれが発生する理由を教えてもらえますか?列名を失うことなくこれを行う正しい方法はありますか?
ショットガンの解決策は、名前を補助ベクトルに保存し、データフレームでの作業が終了したらそれらを追加し直すことです。
ありがとう
コンテクスト:
いくつかのデータを収集し、パラメーターとして受け取ったデータフレームに新しい行として追加する関数を作成しました。データフレームを作成し、データソースを反復処理して、data.frameを各関数呼び出しに渡して結果を入力します。
r - R - ある変数のケースを他の変数に追加する方法 (スタック変数)
取得するために、var1 の下に var2 と var3 をスタックします。
私は試した:
次に、置換にさらに行があるというエラーが表示されます。これを解決するにはどうすればよいですか?
performance - rbind.data.frameのパフォーマンス
すべてに少なくとも1つの行が含まれ(実際には、1つの行のみが含まれるものもあれば、特定の数の行が含まれるものもある)、すべて同じ列(名前とタイプ)。重要な場合は、行のどこにもNAがないことも確信しています。
状況は次のようにシミュレートできます。
(ランダム化の)パラメーターを設定して、実際の状況に近づけるようにしました。
ここで、これらすべてのデータフレームを1つのデータフレームに統合したいと思います。rbindを使用すると、次のようにうまくいくと思いました。
さて、私のシステム(特に遅くはありません)で、上記の設定で、これはsystem.timeの出力です:
200個の変数の254行(私の場合)を処理するのに6秒近くかかりますか?確かに、ここでパフォーマンスを向上させる方法が必要ですか?私のコードでは、同様のことを頻繁に行う必要があるため(複数の代入によるものです)、これをできるだけ高速にする必要があります。
datetime - 予期しない「rbind.fill」の動作
Hadley の "rbind.fill" 関数の動作について混乱しています。簡単な rbind 操作を実行したいデータ フレームのリストがありますが、rbind.fill 関数で説明できない結果が得られます。「rbind」関数によって、期待どおりの出力が得られることに注意してください。最小限の例を次に示します。
ご覧のbind1
とおり、出力が含まれていると、元のデータセットにはなかっrbind.fill
た新しい時間がDATE
列に作成されます。これは予想される動作ですか?
bind <- do.call(rbind, list(data1, data2))
私が持っている5000以上のデータフレームをバインドするために単純に使用できることは承知していますが、誰もが前述の動作について話すことができますか?
ありがとうございました。
編集:
@DWin が以下で指摘したように、これは rbind.fill 関数自体の問題ではなく、出力では時刻が太平洋時間で印刷されていたが、GMT 形式であったという事実です。
r - rbindのメモリ効率の良い代替手段-インプレースrbind?
2つの大きなデータフレームを作成する必要があります。今使っています
しかし、私は(ほとんど)即座にメモリを使い果たします。dfがメモリに2回保持されているからだと思います。将来的にはさらに大きなデータフレームが表示される可能性があるため、何らかのインプレースrbindが必要です。
だから私の質問は:rbindを使用するときにメモリ内のデータの重複を回避する方法はありますか?
SqlLiteを使用するこの質問を見つけましたが、ハードドライブをキャッシュとして使用することは避けたいと思います。
r - R: xts シリーズを複数のファイルから 1 つのブロックにロードする
複数のファイルから xts timeseries をロードし、それらを単一の xts マトリックスにマージする次の R コードがあります。
する方法はありますか
- 最初の ts.set を初期化するために必要な if/else ステートメントを避けますか?
- for ループを完全に回避しますか?
r - cbind または rbind の後にテーブルの dimname の名前が失われる
cbind
テーブル オブジェクトをor -ing した後rbind
(たとえば、合計のマージンを追加するなど)、dimname の名前が失われます (「 」を参照y
)。私はこの「回避策」を見つけましたが、ハッキーに見えないすぐに使える解決策があるかどうか疑問に思っていました。おそらく、その場でできることでしょうか?class のオブジェクトを保持したいと思いますtable
。
r - rbindが数値要素のリストを文字行列に変換するのはなぜですか?
rbindが数値要素のリストを文字に変換するのはなぜですか?
r - 欠落しているデータフレームをどのように見つけることができますか?
私は選挙資金データを作成しており、1989年から2010年の間にxの金額を寄付したxの企業の従業員を検索しています。sqldfを使用してこの情報を解析することができました。データは>4gbで、RAMは<2gbなので、データを約100mbのスプレッドシートに分割し、この情報を取得するために40個をロードしました。企業xからの寄稿者がいる人もいれば、いない人もいます。
ファイルの「キャッチャーミット」を作成する方法を知っている人はいますか?この「キャッチャーミット」は、これらの関連ファイルを識別し、行をバインドします。
誰かが一般的な改善をしたい場合に備えて、コードを添付していますか?
ご協力いただきありがとうございます