問題タブ [dataframe]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - データフレームのリストを行ごとに1つのデータフレームに結合します
ある場所で、本当に単一のビッグデータフレームに変換したいデータフレームのリストで終わるコードがあります。
私は、似ているがより複雑なことをしようとしていた以前の質問からいくつかの指針を得ました。
これが私が始めているものの例です(これは説明のために大幅に簡略化されています):
私は現在これを使用しています:
r - 列で指定された回数、data.frame の各行を繰り返します。
上記の data.frame の最初の 2 列で各行を展開し、列「freq」で指定された回数だけ各行が繰り返されるようにする最も簡単な方法は何ですか?
つまり、次のようになります。
これに:
sql - 2 つ以上のフィールド/変数に対する SELECT DISTINCT に相当する R
2 つ以上の列を持つデータフレーム df があるとします。2 つ以上の列unique()
の一意の組み合わせのサブセットを作成するために、または他の R 関数を使用する簡単な方法はありますか?
sqldf()
簡単なクエリを使用して作成できることはわかってい"SELECT DISTINCT var1, var2, ... varN"
ますが、これを行う R の方法を探しています。
データフレームに強制されたftableを試してフィールド名を使用することが思いつきましたが、データセットに存在しない組み合わせのクロス集計も取得します。
r - 複数の条件を持つdata.frameのサブセット
私のデータが次のようになっているとします。
分析物と日付の部分一致(つまり、年だけが必要)でサブセット化できるようにしたい。私はこれを試してきましたが、それが正しくないことはわかっています。
助言がありますか?
r - 関数でサブセットを使用する場合、Rエラーの約束はすでに評価中ですが、スクリプトでエラーはありません
次の関数を実行すると、奇妙なエラーが発生します。
次のデータを使用します。
私が得るエラーは次のとおりです。
このエラーmydata2
は、データのサブセットを取得する行で発生します。代わりにインタプリタで関数の各行を実行すると、エラーが発生しなくなったため、デバッグできないようです。何が得られますか?
r - 2 つの data.frame を比較して、data.frame 2 に存在しない data.frame 1 の行を見つけます。
次の 2 つの data.frames があります。
a1 にある行と a2 にない行を見つけたい。
このタイプの操作用の組み込み関数はありますか?
(ps:私はそれに対する解決策を書きました。誰かがすでにより巧妙なコードを作成したかどうか、私は単に興味があります)
これが私の解決策です:
sorting - Rのrank()関数を使用して新しいties.methodを作成するにはどうすればよいですか?
このデータフレームを人口と日付で並べ替えようとしているので、order()
andrank()
関数を使用しています。
ties.method = "first"
問題はありませんが、最終的にこのデータフレームを作成しています。
しかし実際には、次のように、同じ人口ランクに対して同じランクのデータフレームが必要です。
Rでこの問題を解決するにはどうすればよいですか?カスタムties.method()
または別のRトリックで?
r - Rの列を置き換える方法は?日付のある奇妙な行動
珍しい日付形式を標準の日付に変換しようとしています。基本的に、次のようにフォーマットされた半年ごとの頻度の期間を含むデータセットがあります。206は2006年の後半を示し、106は前半を示します。それを2006-06-01にそれぞれ2006-01-01に再配置するために、私は小さな関数を書きました:
あなたは今笑うかもしれません:)。とにかく、その機能は機能し、ここで問題が発生します。この関数をdata.frameの時間列に適用したいと思います。私は次のことを試しました:
これは、私が望むものに最も近い結果を返しました:structure.13665..class .... Date .. 1 2006-06-01
など..明らかに、私の列の名前を保持したいのですが、さらに良いのは、新しくフォーマットされた日付を元のdfに追加することです。さらに、私は試しました:
[1] 13300 13514 13665
私がやりたいのは、珍しい206などの形式を2006-06-01(機能する)に変更し、mydf(機能しない)に列を追加することだけです。
事前に提案をお願いします!
r - 単一列のデータフレームから行を削除する
単一列のデータフレームから最後の行を削除しようとすると、データフレームの代わりにベクトルが返されます。
私が探している動作は、2列のデータフレームでこのコマンドを使用するとどうなるかです。
私のコードは一般的であり、データフレームに1つまたは複数の列が含まれるかどうかは事前にわかりません。この問題の簡単な回避策はありますか?列がいくつあっても最後の行を削除できますか?
r - 文字ベクトルから CSV データを解析してデータ フレームを抽出するにはどうすればよいですか?
R の read.table および read.csv 関数は、区切りデータを含むファイルまたは URL を解析し、R データ フレームを生成するために使用されます。ただし、CSV で区切られたデータ (列とレコードの区切り記号としてコンマと \n を使用) を含む文字ベクトルが既にあるので、ファイルまたは URL から読み取る必要はありません。この文字ベクトルを最初にディスク上のファイルに書き込んで読み戻さずにread.table
、 、read.csv
、またはに渡すにはどうすればよいですか? scan()
ディスクへの書き込みは可能ですが、この不要なラウンドトリップを必要とせず、文字ベクトルから直接データを読み取ることができるソリューションを探しています。