問題タブ [data-manipulation]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 列を行に変換する
たとえば、このデータがあります
しかし、これらは3列です。次のようになります。
私が必要としているのは、次のようなテーブルです。Row-column は RowNrs で、Column-column は ColumnNrs であり、Data は敬意を表する場所です
「データセット」をこのテーブルに操作する方法はありますか?
r - Rの他のケースに基づいて新しい変数を作成するためのループ(非常に基本的)
ID
、group
、およびの 3 つの変数を持つデータフレームがありnominated_ID
ます。group
にnominated_ID
属する を知りたいです。
それぞれのケースで、 を取りnominated_ID
、それが と等しいケースを見つけ、元のケースの変数を一致したケースの変数と等しくID
設定すると想像しています。(一致しない場合はNAに設定)nominated_Group
group
これがループなしで実行できても驚かないので、解決策についてはオープンマインドです。どうもありがとうございました。投稿する前に、同様の質問を探してみたことを知っておいてください。
r - Rでの単純なデータ操作
@Anikoは、私の問題を表示する1つの方法は、頂点がグループおよび変数group
と呼ばれnominated_group
、これら2つのグループ間のエッジを示すグラフの連結成分を見つける必要があることを指摘しています。parent_Group
私の目標は、連結成分にインデックスを付ける変数を作成することです。または私が前にそれを置いたように:
、、、、、およびの4つの変数を持つデータフレームがID
あります。 group
nominated_ID
nominated_Group
姉妹グループについて考えてみましょう。データにgroup==Aとnomination_group==Bのケースが少なくとも1つある場合、またはその逆の場合、グループAとBは姉妹グループです。
parent_group
姉妹グループのセットごとに一意の値をとる変数を作成したいと思います。言い換えれば、異なるparent_group
sのケース間で指名が行われるべきではありません。連番を作るのparent_group
は良い考えのようです。
私がすでにここで受けた助けに感謝します!ここでは実際に貢献することはできませんが、stats.exchangeとウィキペディアで前払いしようとしていることに注意してください。
私の偽のデータでは、AとBは姉妹グループです。これを実現するには、ID=4またはID=5のいずれの場合でも十分です。各グループは、独自の姉妹グループでもあります。目標であるの作成は、 AまたはBのすべてのケースで1つ、グループCでもうparent_group
1つになるはずです。parent_group
parent_group
r - nan値の行を削除します
たとえば、私はこのデータを持っているとしましょう:
ここで、NaN値を含む行(行1と4)を削除したいと思います。ただし、100.000以上の行のデータセットの場合、これらの行がどこにあるかわからないため、関数を使用してそれらを検索し、削除する必要があります。完全な行。
誰かが私を正しい方向に向けることができますか?
r - データセットの行の削除がうまくいかない
次のデータセットがあります。
ここで、数値機能 == 0 のすべての行を削除したいと思います (ここには何もありませんが、他のデータセットにはあります) 次のコマンドを使用すると、完全なデータセットが空になります。何が間違っていましたか?
c# - 2 つの大きなファイルの処理と結合
2 つの大きなファイル (125 MB 以上) を読み込む必要があります。各ファイルには、同様のデータを持つレコードが含まれています。両方にあるレコードを見つける必要があり、レコードのフィールドが一致しない場合は、ファイル 2 のレコードをファイル 1 のレコードに含まれるフィールドで上書きする必要があります。
たとえば、最初のファイルには次のフィールドがあります。
2 番目のファイルには、次のフィールドがあります。
したがって、ファイル 1 のレコードがファイル 2 のレコードと同じ ACCT 番号を持っている場合、ファイル 2 の Bal、Int、および Rate は、ファイル 1 の Bal、Int、および Rate の値で上書きする必要があります。
一部のレコードは各ファイルに含まれません。作成する必要がある出力ファイルは、ファイル 2 のすべてのレコードです。レコードがファイル 1 にもない場合は、そのままファイルに書き込みますが、変更が必要なレコードが含まれます。
さまざまなオプションを試しましたが、ほとんどは大きなファイルを処理するのに十分効率的ではありません. この問題で取るべき適切な方向は何ですか? 助けてくれてありがとう。
r - リスト内のデータフレームの操作:変数を削除し、新しい変数を追加します
df1とdf2の2つのデータフレームでリストデータを定義します
各データフレームに変数aをドロップしたいと思います。次に、外部データフレームの各データフレームのIDを使用して、次のような変数を追加します。
不要な変数を削除するために、運がなくてもこれを試しました。
IDを追加する方法もわかりません。
私も、おそらくもっと適切に試しました:
私が混乱しているstr(out[1])
のは、リストをstr(out[[1]])
返し、データフレームを返すことです。それはそれと関係があるのではないかと思います。
list - データ フレームのリスト内のデータ フレーム内の変数のセル エントリを編集する
定義:
各データ フレームの列 b から M 文字を削除したいと考えています。
シンプルなフレームワークでは:
しかし、ネストされたものでは、どのように進めるのでしょうか? 申し訳ありませんが、ここに 1 つの試みがあります。
r - 各変数で異なる関数を使用してグループごとにデータ フレームを折りたたむ
定義
st
私のデータには因数がないため、因数を文字に変換します。
V1を維持してデータフレームを「折りたたむ」ことを希望します:
- V2の最大
- V3の平均
- V4 のモード (この値は実際には V1 グループ内では変更されないため、最初、最後なども変更される可能性があります。)
これは一般的な質問であることに注意してください。たとえば、私のデータセットははるかに大きく、折りたたむときにさまざまな関数 (さまざまな変数に対して last、first、min、max、variance、st.dev. など) を使用したい場合があります。したがって、関数の引数は非常に長くなる可能性があります。
この場合、次の形式の出力が必要です。
r - グループごとに最も頻繁に発生するものをキャプチャする変数を作成します
定義:
st
stによるfreq
最も頻繁な観測を含む3番目の変数を作成したいv1
id