“data-manipulation”の関連問題_Stack Overflow日本語サイト

0 投票する

4 に答える

1469 参照

r - 列を行に変換する

たとえば、このデータがあります

しかし、これらは3列です。次のようになります。

私が必要としているのは、次のようなテーブルです。Row-column は RowNrs で、Column-column は ColumnNrs であり、Data は敬意を表する場所です

「データセット」をこのテーブルに操作する方法はありますか?

r data-manipulation

2011-04-29T08:37:24.847

0 投票する

4 に答える

909 参照

r - Rの他のケースに基づいて新しい変数を作成するためのループ（非常に基本的）

ID、group、およびの 3 つの変数を持つデータフレームがありnominated_IDます。groupにnominated_ID属するを知りたいです。

それぞれのケースで、を取りnominated_ID、それがと等しいケースを見つけ、元のケースの変数を一致したケースの変数と等しくID設定すると想像しています。（一致しない場合はNAに設定）nominated_Groupgroup

これがループなしで実行できても驚かないので、解決策についてはオープンマインドです。どうもありがとうございました。投稿する前に、同様の質問を探してみたことを知っておいてください。

r loops vectorization data-manipulation

2011-05-08T00:17:13.483

0 投票する

1 に答える

200 参照

r - Rでの単純なデータ操作

@Anikoは、私の問題を表示する1つの方法は、頂点がグループおよび変数groupと呼ばれnominated_group、これら2つのグループ間のエッジを示すグラフの連結成分を見つける必要があることを指摘しています。parent_Group私の目標は、連結成分にインデックスを付ける変数を作成することです。または私が前にそれを置いたように：

、、、、、およびの4つの変数を持つデータフレームがIDあります。 groupnominated_IDnominated_Group

姉妹グループについて考えてみましょう。データにgroup==Aとnomination_group==Bのケースが少なくとも1つある場合、またはその逆の場合、グループAとBは姉妹グループです。

parent_group姉妹グループのセットごとに一意の値をとる変数を作成したいと思います。言い換えれば、異なるparent_groupsのケース間で指名が行われるべきではありません。連番を作るのparent_groupは良い考えのようです。

私がすでにここで受けた助けに感謝します！ここでは実際に貢献することはできませんが、stats.exchangeとウィキペディアで前払いしようとしていることに注意してください。

私の偽のデータでは、AとBは姉妹グループです。これを実現するには、ID=4またはID=5のいずれの場合でも十分です。各グループは、独自の姉妹グループでもあります。目標であるの作成は、 AまたはBのすべてのケースで1つ、グループCでもうparent_group1つになるはずです。parent_groupparent_group

r vectorization data-manipulation

2011-05-10T19:03:32.290

0 投票する

2 に答える

55859 参照

r - nan値の行を削除します

たとえば、私はこのデータを持っているとしましょう：

ここで、NaN値を含む行（行1と4）を削除したいと思います。ただし、100.000以上の行のデータセットの場合、これらの行がどこにあるかわからないため、関数を使用してそれらを検索し、削除する必要があります。完全な行。

誰かが私を正しい方向に向けることができますか？

r nan data-manipulation

2011-05-11T09:12:54.730

0 投票する

3 に答える

785 参照

r - データセットの行の削除がうまくいかない

次のデータセットがあります。

ここで、数値機能 == 0 のすべての行を削除したいと思います (ここには何もありませんが、他のデータセットにはあります) 次のコマンドを使用すると、完全なデータセットが空になります。何が間違っていましたか?

r row data-manipulation

2011-05-26T08:15:21.883

0 投票する

2 に答える

123 参照

c# - 2 つの大きなファイルの処理と結合

2 つの大きなファイル (125 MB 以上) を読み込む必要があります。各ファイルには、同様のデータを持つレコードが含まれています。両方にあるレコードを見つける必要があり、レコードのフィールドが一致しない場合は、ファイル 2 のレコードをファイル 1 のレコードに含まれるフィールドで上書きする必要があります。

たとえば、最初のファイルには次のフィールドがあります。

2 番目のファイルには、次のフィールドがあります。

したがって、ファイル 1 のレコードがファイル 2 のレコードと同じ ACCT 番号を持っている場合、ファイル 2 の Bal、Int、および Rate は、ファイル 1 の Bal、Int、および Rate の値で上書きする必要があります。

一部のレコードは各ファイルに含まれません。作成する必要がある出力ファイルは、ファイル 2 のすべてのレコードです。レコードがファイル 1 にもない場合は、そのままファイルに書き込みますが、変更が必要なレコードが含まれます。

さまざまなオプションを試しましたが、ほとんどは大きなファイルを処理するのに十分効率的ではありません. この問題で取るべき適切な方向は何ですか? 助けてくれてありがとう。

c#file-io data-manipulation

2011-06-17T14:41:54.317

0 投票する

2 に答える

1712 参照

r - リスト内のデータフレームの操作：変数を削除し、新しい変数を追加します

df1とdf2の2つのデータフレームでリストデータを定義します

各データフレームに変数aをドロップしたいと思います。次に、外部データフレームの各データフレームのIDを使用して、次のような変数を追加します。

不要な変数を削除するために、運がなくてもこれを試しました。

IDを追加する方法もわかりません。

私も、おそらくもっと適切に試しました：

私が混乱しているstr(out[1])のは、リストをstr(out[[1]])返し、データフレームを返すことです。それはそれと関係があるのではないかと思います。

r lapply data-manipulation data-management

2011-06-18T21:31:35.580

0 投票する

3 に答える

433 参照

list - データフレームのリスト内のデータフレーム内の変数のセルエントリを編集する

定義：

各データフレームの列 b から M 文字を削除したいと考えています。

シンプルなフレームワークでは:

しかし、ネストされたものでは、どのように進めるのでしょうか? 申し訳ありませんが、ここに 1 つの試みがあります。

list r data-manipulation data-management

2011-06-19T00:08:38.423

0 投票する

2 に答える

2504 参照

r - 各変数で異なる関数を使用してグループごとにデータフレームを折りたたむ

定義

st

私のデータには因数がないため、因数を文字に変換します。

V1を維持してデータフレームを「折りたたむ」ことを希望します:

V2の最大
V3の平均
V4 のモード (この値は実際には V1 グループ内では変更されないため、最初、最後なども変更される可能性があります。)

これは一般的な質問であることに注意してください。たとえば、私のデータセットははるかに大きく、折りたたむときにさまざまな関数 (さまざまな変数に対して last、first、min、max、variance、st.dev. など) を使用したい場合があります。したがって、関数の引数は非常に長くなる可能性があります。

この場合、次の形式の出力が必要です。

r dataframe collapse data-manipulation data-management

2011-06-28T17:08:09.247

0 投票する

3 に答える

3024 参照

r - グループごとに最も頻繁に発生するものをキャプチャする変数を作成します

定義：

st

stによるfreq最も頻繁な観測を含む3番目の変数を作成したいv1id

r count frequency data-manipulation data-management

2011-06-28T21:38:20.517

問題タブ [data-manipulation]

Reference