問題タブ [dataframe]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - "R" で CSV ファイルから data.frame に日付の数値を読み取る
D[,1]
上記の例で、データを読み取って日付値として保存するにはどうすればよいですか? この形式のデータファイルがたくさんあります。
ティア、
r - R: 他の人が読めるように SO に貼り付けられるように data.frame を書き出す方法は?
プロット時にいくつかの奇妙なプロパティを表示する大きな data.frame があります。私はそれについて Stackoverflow で質問したいと思います。そのためには、data.frame を SO に貼り付けることができる形式で書き出し、他の誰かが簡単に実行して元に戻すことができるようにしたいと思います。 data.frame オブジェクトをもう一度。これを達成する簡単な方法はありますか?また、非常に長い場合は、ここに直接貼り付けるのではなく、貼り付けビンを使用する必要がありますか?
r - 関数に data.frame 列名を渡す
data.frame ( x
) とcolumn
そこから a を受け入れる関数を作成しようとしています。この関数は x に対していくつかの計算を実行し、後で別の data.frame を返します。列名を関数に渡すためのベストプラクティスの方法にこだわっています。
以下の 2 つの最小限の例fun1
では、例としてを使用して、fun2
に対して操作を実行でき、目的の結果が得られます。ただし、どちらも一見(少なくとも私にとっては)エレガントではないことに依存していますx$column
max()
- に電話し
substitute()
、おそらくeval()
- 列名を文字ベクトルとして渡す必要性。
fun(df, B)
たとえば、関数を として呼び出すことができるようにしたいと思います。私が検討したが試していない他のオプション:
column
列番号の整数として渡します。これで回避できると思いますsubstitute()
。理想的には、関数はどちらかを受け入れることができます。with(x, get(column))
、しかし、それが機能したとしても、これにはまだ必要だと思いますsubstitute
formula()
とを利用match.call()
します。どちらもあまり経験がありません。
サブ質問:do.call()
より優先されeval()
ますか?
r - データフレームでグループ化されたレコードを要約する
R に次のようなデータ フレームがあります。
そして私はそれをに変換したい
これを英語に置き換えてみると、同じ「ソース」を持つ連続したレコードをまとめてグループ化し、グループごとに 1 つのレコードを出力して、そのグループの最大時間オフセット、ソース、およびそのグループ内の長さの合計を示したいと考えています。 .
TimeOffset 値は常に増加します。
これはRで可能だと思いますが、どこから始めればよいか本当にわかりません。ピンチでは、データ フレームをエクスポートして Python などで実行することもできますが、可能であれば R 内に留まりたいと思います。
あなたが提供できる支援を前もって感謝します
r - すべての値が NA であるデータフレームから列を削除します
データ フレームに問題があり、その問題を自分で実際に解決できませんでした。データ フレームには列として任意のプロパティがあり、各行は1 つの
データセットを表します。
問題は、すべての行の値が NAである列を削除
する方法です。
select - Rのデータフレーム内のグループ化されたレコードの要約(...もう一度)
(今日、この質問をしようとしましたが、後で質問を単純化しすぎていることに気付きました。受け取った回答は正しかったのですが、元の質問の問題を単純化しすぎたため、使用できませんでした。これが私の2回目の試行...)
Rに次のようなデータフレームがあります。
これを次のように変換したいと思います。
これを英語にしようとすると、同じ「ソース」と「ターゲット」を持つ連続したレコードをグループ化し、グループごとに1つのレコードを出力して、そのグループのStartTime、EndTime、Duration(= EndTime-StartTime)を表示します。そのグループの長さの合計、およびそのグループ内のコンテンツ(すべて文字列になります)の連結とともに。
TimeOffset値は、データフレーム全体で常に増加します。
メルト/リキャストを見て、問題を解決するために使用できると感じましたが、ドキュメントに頭を悩ませることはできませんでした。R内でこれを行うことは可能だと思いますが、どこから始めればよいのか本当にわかりません。ピンチでは、データフレームをエクスポートして、Pythonなどで実行できますが、可能であればR内にとどまりたいと思います。
あなたが提供できるどんな援助にも前もって感謝します
r - ベクトルに基づいて、データフレームにいくつかの変数を追加します
これは簡単だと思いますが、今はわかりません。
基本的に:変数の長いベクトルがあります:
いくつかのデータがあり、変数を追加する必要があります。私はそれをできた:
しかし、リストが長いので、自動化されたソリューションが必要です。これはうまくいきません。
これが必要な理由は、必要なすべての変数を持っていないデータフレームに垂直にマージする必要があるためです。
前もって感謝します
r - R で data.frame の最初の 4 行を選択する
a の最初の 4 行を選択するにはどうすればよいですかdata.frame
:
r - これら 2 つの R データ フレームが同一でない理由は何ですか?
2 つの小さなデータ フレームthis_tx
とlast_tx
. それらは、私が知る限り、完全に同一です。 this_tx
==last_tx
は同じ次元のフレームになり、 all TRUE
. this_tx %in% last_tx
、2つTRUEs
。目視で確認すると明らかに同一。でも電話したら
identical(this_tx, last_tx)
を取得しFALSE
ます。陽気に、さえ
identical(str(this_tx), str(last_tx))
を返しますTRUE
。を設定this_tx <- last_tx
すると、 が得られますTRUE
。
何が起こっている?私は R の内部メカニクスを深く理解しているわけではありませんが、2 つのデータ フレームの違いを 1 つも見つけることができません。関連する場合、フレーム内の 2 つの変数は両方とも要因です。同じレベル、レベルの同じ数値コーディング、両方とも同じ元のデータ フレームのサブセットです。それらを文字ベクトルに変換しても役に立ちません。
背景(これについても助けを求めないため):私は患者に与えられた薬物治療の記録を持っています. 各治療記録は、基本的に個人と日付を指定します。2 番目のテーブルには、特定の治療中に投与された各薬剤と用量の記録があります (通常、各治療で数種類の薬剤が投与されます)。私は、その人が同じ組み合わせの薬を同じ用量で服用していた連続した期間を特定しようとしています.
私が思いついた最善の計画は、治療を時系列で確認することです。治療[i]の薬物と用量の組み合わせが治療[i-1]での組み合わせと同一である場合、治療[i]は治療[i-1]と同じフェーズの一部です。もちろん、薬物と用量の組み合わせを比較できない場合は、それで問題ありません。
function - カスタム関数内に格納された値
私のプログラムは data.frame を取り、数値を計算します。ある時点で、j 番目の列の値に、列名 (実際には種の名前 - 生態学的インデックス) に依存する定義済みの値が乗算されます。これまでのところ、列名を一致させることにより、2 番目の data.frame を介してこれらの値を提供してきました。関数内で固定変数値を統合する効率的な方法は何ですか? 2 番目の data.frame ファイルを必要とせずに、プログラムをできるだけ移植できるようにしたいと考えています。
編集
これが関数です。外部ソースに依存しないように、2 行目 (index <- read.table...) を改善しようとしています。
私が試した別の解決策は、きれいに見えないかもしれませんが、仕事を成し遂げます。dput(index) を使用して永続オブジェクトを作成し、それを関数に挿入します。