問題タブ [rbind]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R data.table rbindlist
妥当なサイズの data.table で 30 ほどの列を含む問題が発生しています: (以下のダミー値を使用していることに注意してください)
を使用rbindlist(list(dat, dat2))
して、同じフィールドを持つ新しい data.table を別の 50000 行で追加すると、誤った新しいマスター data.table が生成されます。
列フィールドがすべて一致する data.table に新しい行を追加する簡単で高速なソリューションはありますか?
簡単にするために、ダミーのデータセットを作成しました。
出力を使用rbind(dat,dat2)
すると、dat2 が複製されます。(合計 15 行になるはずです)
より良い解決策についてフォーラムを読んだところ、何か思いついたのですrbindlist
が、それもうまくいくようには見えません。と同じ出力rbind
重複せずにdat2をdatにバインドする高速なソリューションはありますか?
rbind および rbindlist の出力
r - R: Split-Apply-Combine... クラスごとに行にバインドされたデータ フレームのサブセットに集計を介して関数を適用する
更新: 私の NOAA GHCN-Daily ウェザー ステーション データ関数はクリーンアップされ、rnoaaパッケージに統合されました。CRAN またはこちらから入手できます: https://github.com/ropensci/rnoaa
複数のデータ フレームで構成されるデータ セット全体の統計を計算する R 関数を設計しています。つまり、名前を含む参照データ フレームに基づいて、クラスごとにデータ フレームをプルしたいと考えています。次に、特定の日ごとにリストされたメトリックの値に統計関数を適用したいと考えています。実際には、データ フレームのリストを呼び出してオーバーレイし、値が NA ではないすべての一意の日付とメトリックの値のベクトルで関数を計算したいと考えています。
データ フレームは、'by' 関数を使用して、クラス変数に基づいてファイルからワークスペースに繰り返し読み込まれます。特定のクラスのファイルをインポートした後、そのクラスのデータ フレームと、ある範囲内の各ユーザー定義メトリックを rbind() したいと考えています。次に、ユーザー提供の統計関数の連結を、年、月、日の特定の値に対応するクラス内の各メトリックに適用したいと考えています (つまり、7 月 1 日の平均 [関数] 低温 [クラス]、 1990 [日付] は、特定の地域 [クラス] 内のすべての場所 [データ フレーム] にわたって報告されました.最終結果は、地域内のすべての日付の値と、適用される各メトリックおよび統計関数の年の範囲を含む新しいデータ フレームにしたいと考えています。私は、aggregate() 関数を使用してこの結果を得るのに非常に近づいています。しかし、平均温度以外のほとんどの関数に対して現在 NA と NaN を出力している集計関数から妥当な結果を得るのに問題があります。どんなアドバイスでも大歓迎です!これまでの私のコードは次のとおりです。
私はかなり近いと思いますが、 rbind() が適切に実行されているかどうか、また、aggregate() 関数が非常に多くのメトリックに対して NA と NaN を出力している理由もわかりません。データ フレームが結合されていないか、一部の統計関数で欠損値が適切に処理されていないことが懸念されました。あなたが提供できるアドバイスを事前に感謝します。
乾杯、
アダム
r - 異なる列を持つ data.frames を rbind する効率的な方法
列のセットが異なるデータ フレームのリストがあります。それらを行単位で 1 つのデータ フレームに結合したいと考えています。私はそれをするために使用plyr::rbind.fill
します。これをより効率的に行うものを探していますが、ここで与えられた答えに似ています
r - R データフレームの作成
Rにデータフレームがあります。たとえば、f1です。f2の行名としてf1の列名(ヘッダー)を持つ別のデータフレームf2を作成したいと思います。f1 に 300 の名前があることを知っています。最初の 200 に色「#ff0000」を割り当て、最後の 100 に色「#0000ff」を割り当てたいと考えています。どうすればよいですか? 結果は次のようになります。
r - data.table の rbind/rbindlist エラー: 強制によって導入された NA
私はデータフレームを操作していましたが、これを操作のためにデータテーブルに変換する必要がありました。rbind()
2 つのデータ テーブルにアクセスしようとすると、次の警告メッセージが表示されます。
この問題についてここで以前の質問を見つけました。これは R のバグです。
私が抱えている問題は、大規模なデータセットで作業していて、新しい NA 値がデータフレームに追加されているかどうかに気付かないことです。(とにかく NA 値が追加されるのはなぜですか?)
データテーブルをバインドする前にデータフレームに変換することで、問題を回避しようとしました。
エラーは出なくなりましたが、自分のデータが本当に心配です! NA 値が追加されましたか? または、このトリックを実行してもデータは同じままですか? data.frame のデータを引き続き使用できることをうれしく思います。
ありがとう、
r - 2 つの Zoo オブジェクトをマージすると、「rbind.zoo(...) のエラー: インデックスが重複しています」というメッセージが表示されるのはなぜですか?
異なる期間のcsvファイルから同じコマンドで作成された、一見同一の動物園オブジェクトが2つあります。それらを 1 つの長い動物園に結合しようとしましたが、「インデックスが重複しています」というエラーで失敗しています。('merge' 'c' または 'rbind' はすべて、同じエラー テキストのバリエーションを生成します。) 私が見る限り、重複はなく、期間も重複していません。私は何を間違っていますか?それが違いを生む場合、Windows 7 64ビットでRバージョン3.0.1を使用しています。
更新: 再現可能なケースを作成しようとして、これは私が扱っている多数の行による実装エラーであると結論付けました: 最終結果が 311434 行を超える場合は失敗します。
申し訳ありませんが、クリティカルな長さの動物園を作成するための R スクリプトのスキルがありません。うまくいけば、誰かが私を助けてくれるかもしれません..
更新 2-ジェイソンの提案への対応..: 問題は MATCH にありますが、私の R スキルはそれを解釈する方法を知るのに十分ではありません.MATCH は xt で重複する値を見つけますが、anyDuplicated は見つけませんか?