問題タブ [dataframe]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - データフレームを分割するには?
データ フレームをいくつかの小さなフレームに分割したいと考えています。これは非常に些細な質問のように見えますが、Web 検索から解決策を見つけることができません。
r - R では、データ フレームの行を非常に高速にループするにはどうすればよいでしょうか?
多数の行と多数の列を持つデータ フレームがあるとします。
列には名前があります。行に番号でアクセスし、列に名前でアクセスします。
たとえば、行をループする 1 つの (おそらく遅い) 方法は次のとおりです。
もう 1 つの方法は、個別の列 ( など) の「リスト」を作成column1_list = df[["column1"]
し、1 つのループでリストにアクセスすることです。このアプローチは高速かもしれませんが、多くの列にアクセスしたい場合には不便です。
データ フレームの行をループする高速な方法はありますか? 高速ループに適した他のデータ構造はありますか?
data-structures - R で行列をデータ フレームに変換する際の問題 (R はすべての数値型を因子と見なします)
COM インターフェイスを介して C# から R にデータを渡しています。データが R に到着すると、「マトリックス」に格納されます。私が使用する一部の関数では、代わりにデータが「DataFrame」内にある必要があります。を使用してデータ構造を変換します
データのテーブルはRに問題なく到達しますが、DataFrameに変換すると、すべての数値データが要因であると想定されます!
{34, 46, 90, 54, 69, 54} は {1, 2, 3, 4, 5, 4} になります。
ただし、私のデータテーブルには要素が含まれているため、すべてを強制的に数値にすることはできません。これを回避する方法はありますか?注: データを CSV としてファイル システムにエクスポートし、手動で R に読み込むことはできません。
補足として、DataFrame を必要とする私が使用している関数は、使用する「Hmisc」パッケージです。
これにより、DataFram 内のデータのすべての列の頻度ヒストグラムが生成され、それらがすべてグリッド パターンに配置されます (非常に便利です)。
ありがとう!-デイブ
r - R: data.frame の集計列
私はこのようなdata.frameを持っています
Memory
列の平均と列の平均を見つけたいと思いNaive
ます。このaggregate
関数は行を集計します。これdata.frame
には潜在的に多数の行が含まれる可能性があるため、転置してから元aggregate
の を適用すると、私は悪いと思い、一般的に迷惑です:colnames
data.frame
私が見逃している盲目的に明らかなことは何ですか?
r - write.table経由でRプログラム(ex)を使用して、「.rtest」出力をファイルに書き込みますか?
私はRを使用して、保存された.csvファイルを特定のペアワイズ方法で開き、統計テストを実行しています(mantel.rtest
パッケージ「ade4」に含まれています)。.csv ファイルは、「fileAX」または「fileBY」のいずれかの順番で名前が付けられます。ここで、X と Y は整数です。
このテストの結果を 1 つのファイルに保存したいのですが、いくつか問題が発生しています。
コードは次のとおりです (「貼り付け」の非効率的な使い方をお許しください:
これを実行しようとすると、次のエラー メッセージが表示されます。
「unlist」や「as.vector」などのさまざまな関数を使用して、「mantelout」をより使いやすい形式に変換しようとしましたが、役に立ちませんでした。何かご意見は?
ありがとう、WAW
編集: R 環境でのこのテストの出力は次のようになります。
r - R + reshape : data.frame の列の分散
R で reshape を使用して、data.frame の列の集計統計を計算しています。これが私のdata.frameです:
これは、reshape パッケージを理解するためのちょっとしたテスト data.frame です。a
s と s の平均を見つけるために、溶かしてからキャストしますb
。
ああ!何?の平均c(2,3)
が 2.5 などであることを望んでいました。どうしたの?ここに事があります:
どうしたの?私の両方はどこに行った5
のですか?ここで非常に基本的な誤解がありますか? もしそうなら:それは何ですか?
r - データフレーム内の文字値をNAに置き換える
"foo"
に置き換えたい文字値(たとえば)を(ランダムな場所に)含むデータフレームがありNA
ます。
データフレーム全体でこれを行うための最良の方法は何ですか?
r - Rでは、df["x"]とdf$xの違いは何ですか
data.frame 内の列の呼び出しの違いに関する情報は、次の場所で見つけることができます。
どちらも「同じ」結果を返しますが、必ずしも同じ形式であるとは限りません。私が気付いたもう 1 つのことは、df$x がリストを返すことです。一方、df["x"] は data.frame を返します。
編集: ただし、どの状況でどれを使用するかを知ることは課題になっています. ここにベスト プラクティスはありますか、それとも、コマンドまたは関数が必要とするものを知ることに本当に帰着しますか? これまでのところ、関数が最初に機能しない場合 (試行錯誤) を循環してきました。
r - XTS を data.frame に変更して Index を保持するにはどうすればよいですか?
次の形式の R に XTS 時系列があり、別のプログラムで作業するために CSV としてエクスポートする前に、いくつかの処理、サブセット化、および再配置を試みています。
と
そして、これを data.frame に変換して、より簡単に操作して別のプログラムにエクスポートできるようにしたいと思います。ただし、test1 <- as.data.frame(master_1)
test1 を使用すると、インデックス (つまり、日付と時刻) が表示されます。
インデックスは表示されませんが、
また、csv の書き込みwrite.csv(master_1, file="master_1.csv")
には時刻や日付は含まれません。これはなぜですか? また、他の R コマンドで使用され、適切にエクスポートされるように、日付/時刻データを列として含めるにはどうすればよいですか?
助けてくれてありがとう。
r - 列のセットが異なる場合は、2つのデータフレームを行(rbind)で結合します
同じ列のセットを持たない2つのデータフレームを行バインドすることは可能ですか?バインド後に一致しない列を保持したいと思っています。