“data-manipulation”の関連問題_Stack Overflow日本語サイト

0 投票する

6 に答える

103323 参照

r - 区切られた文字列を列に分割し、新しい行として挿入します

私は次のようなデータフレームを持っています：

各アルファベットは、コンマで区切られた文字です。各コンマでV2を分割し、分割された文字列を新しい行として挿入したいと思います。たとえば、必要な出力は次のようになります。

strsplit()最初にV2を吐き出し、次にリストをデータフレームにキャストするために使用しようとしています。うまくいきませんでした。どんな助けでもありがたいです。

2013-03-11T19:47:55.807

0 投票する

1 に答える

339 参照

r - ロングテーブルをワイドテーブルに変更

次のような長いテーブルがあるとします。

列Aと列Bの各要素が列のタイトルになるように、長い表を幅の広い形式に変更したいと考えています。各行は、要素が存在するかどうかを示す 1 または 0 である必要があります。列 C と D は同じままです。目的のテーブルは次のようなものです。

r data-manipulation

2013-03-15T20:59:14.190

0 投票する

3 に答える

7544 参照

r - 指標に基づく条件付き合計

私はこのようなデータフレームを持っています：

値に基づいて列を合計するにはどうすればよいIndですか？の場合Ind==1、列からの合計A、の場合Ind==2、列からの合計B。たとえば、最初の4行の出力は、である必要があります10+10+1+19=30。ここで、最初の10はにA、2番目の10はにB、3番目の1はにB、4番目の19はにありAます。

r sum data-manipulation

2013-03-20T16:32:01.583

0 投票する

1 に答える

248 参照

r - 毎日の時系列を作成するための R でのスケーラブルな繰り越し

現在定期的にのみ観測されているものから、毎日の時系列データセットを作成しようとしています。1 つのケースで必要な操作を正常に実行できますが、データセット全体にスケーリングする方法がわかりません。例えば：

これは、間隔にわたる単位の観測です:

START と END の日付の範囲全体で、各ユニットを取得し、"STATUS" と "TERMINATE" の値を (大規模なデータセット内の他の N 個の共変量と共に)毎日複製したいと思います。1枚のレコードのためにそれを行う....

最初の行の観測値は START から END の範囲で複製され、新しいベクトルが作成されます: 全期間の日次時系列です。行 2 に対してこれを行い、分析の UNIT によって D などにバインドしたいと思います。一般化しようとして失敗したため、na.locf を使用して for ループを作成しました。

単一レコードの「ソリューション」の明らかな問題は、「TERMINATED」日付の処理です。na.locf を使用する直前に、日付ステータスが失われます。

これをもっとよく見る方法があることを願っています。

r bigdata zoo data-manipulation

2013-03-30T02:07:12.373

0 投票する

2 に答える

407 参照

r - 複数のデータフレームをランク付けし、R でそれらを合計する

それぞれ2列の10個のデータフレームがあり、データフレームをa、b、c、d、e、f、g、h、i、jと呼んでいます。

各データフレームの最初の列はシーケンスの s と呼ばれ、2 番目の列は各シーケンスに対応する p 値の p と呼ばれます。s 列には、10 個のデータフレームすべてで同じシーケンスが含まれています。基本的に唯一の違いは p 値です。以下は、600,000 行のデータフレーム a の短いバージョンです。

各データフレームを p 値でランク付けしたい場合、最小の p 値はランク 1 になり、等しい p 値は同じランクになるはずです。各最終データフレームは、次の形式にする必要があります。

私はこれを使って1つをしました：

r<-rank(a$p)

cbind(a$s,r)

しかし、私はループにあまり詳しくなく、これを自動的に行う方法がわかりません。最終的には、s 列があり、次の列に、特定のシーケンスごとにすべてのデータフレームのすべてのランクのランク合計がある最終ファイルが必要です。SO基本的にこれ：

助けてください、ありがとう！

r sum ranking data-manipulation

2013-03-30T21:26:35.690

0 投票する

1 に答える

177 参照

sas - 外部テキストファイルを参照して、SAS でデータセットをサブセット化する

私は、医薬品に対する反応に関するデータを含む FDA のデータセットを使用しています。薬の名前でデータをサブセット化しようとしています。関心のある薬物名を含む外部テキストファイルがあります。関心のある薬物で構成されるデータのサブセットを作成したいと考えています。外部テキストファイルのタイトルは SSRIFULL.txt で、変数名は DRUGNAME です。私は露骨に間違っていた多くのことを試しました

すなわち

データ SSRIFULL2;

---- SSRIFULL を設定します。

---- Drugname ~= "P:\APPRENTICESHIP\SSRI_LIST.txt" の場合、削除します。

走る;

そして、この問題に関する直接の文献を見つけることができません。truncover または proc sql に関するトピックをもっと調べるべきですか? テキストファイルには、約 20 種類の薬物のリストが含まれています。私はある種のインラインコードにもオープンですが、何らかの理由でSASはこれを好まない...

データ SSRIFULL2;

---SSRIFULL を設定します。

------IF (AGE >19) OR (AGE = .) Then Delete;

------If (DRUGNAME ~= 'クロミプラミン' OR 'フルボキサミン' または 'パキシル' または 'パロキセチン' または 'プロザック'

------または「フルオキセチン」または「セロクエル」または「ウェルブトリン」または「ブプロピオン」または「ゾロフト」または「セルトラリン」

------OR 'Zyban') 次に削除します。

走る;

おそらく明らかなように、私は SAS の経験があまりありません。この時点で、このデータセットを分析に使用できるようにしようとしています。事前に助けてくれてありがとう

sas subset data-manipulation

2013-04-02T23:15:42.187

0 投票する

1 に答える

1404 参照

r - リスト内のシーケンスオブジェクトをループしますか?

TraMineR24 個のシーケンスオブジェクトを含むリストがあります。次に、これらの各シーケンスオブジェクト (各オブジェクト内のみ) の最適一致距離を計算し、24 個の OM 距離オブジェクト (距離行列) で構成される新しいリストに格納します。

データセットはここにあります。

ステップ (1) は問題なく動作しますが、ステップ (2) に進むと、次のように表示されます。

sequence_objectsはシーケンスオブジェクトではなく、シーケンスオブジェクトのリストであるため、これは当然です。

seqsubmこの関数をシーケンスオブジェクトのリストに適用するにはどうすればよいですか?

r data-manipulation traminer

histelheim

2013-04-05T16:05:05.530

0 投票する

1 に答える

113 参照

matlab - MatLabで長方形に当たるランダムな線を選ぶ方法

ランダムな開始点と終了点を作成しています。原点に配置された長方形と交差/交差する人をプロットしたい。図に示すように、コードにいくつかの行が欠けていることがわかりました。その後、トラックが長方形にぶつかったかどうかを数えたいと思います。たとえば、トラックは上から来て、右側から出ました。

私のコードは

どんなアイデアでも大歓迎です！

matlab plot counter data-manipulation

2013-04-14T12:37:36.667

問題タブ [data-manipulation]

Reference