問題タブ [data-manipulation]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
6 に答える
103323 参照

r - 区切られた文字列を列に分割し、新しい行として挿入します

私は次のようなデータフレームを持っています:

各アルファベットは、コンマで区切られた文字です。各コンマでV2を分割し、分割された文字列を新しい行として挿入したいと思います。たとえば、必要な出力は次のようになります。

strsplit()最初にV2を吐き出し、次にリストをデータフレームにキャストするために使用しようとしています。うまくいきませんでした。どんな助けでもありがたいです。

0 投票する
1 に答える
339 参照

r - ロングテーブルをワイドテーブルに変更

次のような長いテーブルがあるとします。

列Aと列Bの各要素が列のタイトルになるように、長い表を幅の広い形式に変更したいと考えています。各行は、要素が存在するかどうかを示す 1 または 0 である必要があります。列 C と D は同じままです。目的のテーブルは次のようなものです。

0 投票する
3 に答える
7544 参照

r - 指標に基づく条件付き合計

私はこのようなデータフレームを持っています:

値に基づいて列を合計するにはどうすればよいIndですか?の場合Ind==1、列からの合計A、の場合Ind==2、列からの合計B。たとえば、最初の4行の出力は、である必要があります10+10+1+19=30。ここで、最初の10はにA、2番目の10はにB、3番目の1はにB、4番目の19はにありAます。

0 投票する
1 に答える
248 参照

r - 毎日の時系列を作成するための R でのスケーラブルな繰り越し

現在定期的にのみ観測されているものから、毎日の時系列データセットを作成しようとしています。1 つのケースで必要な操作を正常に実行できますが、データセット全体にスケーリングする方法がわかりません。例えば:

これは、間隔にわたる単位の観測です:

START と END の日付の範囲全体で、各ユニットを取得し、"STATUS" と "TERMINATE" の値を (大規模なデータセット内の他の N 個の共変量と共に)毎日複製したいと思います。1枚のレコードのためにそれを行う....

最初の行の観測値は START から END の範囲で複製され、新しいベクトルが作成されます: 全期間の日次時系列です。行 2 に対してこれを行い、分析の UNIT によって D などにバインドしたいと思います。一般化しようとして失敗したため、na.locf を使用して for ループを作成しました。

単一レコードの「ソリューション」の明らかな問題は、「TERMINATED」日付の処理です。na.locf を使用する直前に、日付ステータスが失われます。

これをもっとよく見る方法があることを願っています。

0 投票する
2 に答える
407 参照

r - 複数のデータ フレームをランク付けし、R でそれらを合計する

それぞれ2列の10個のデータフレームがあり、データフレームをa、b、c、d、e、f、g、h、i、jと呼んでいます。

各データ フレームの最初の列はシーケンスの s と呼ばれ、2 番目の列は各シーケンスに対応する p 値の p と呼ばれます。s 列には、10 個のデータ フレームすべてで同じシーケンスが含まれています。基本的に唯一の違いは p 値です。以下は、600,000 行のデータ フレーム a の短いバージョンです。

各データフレームを p 値でランク付けしたい場合、最小の p 値はランク 1 になり、等しい p 値は同じランクになるはずです。各最終データ フレームは、次の形式にする必要があります。

私はこれを使って1つをしました:

r<-rank(a$p)

cbind(a$s,r)

しかし、私はループにあまり詳しくなく、これを自動的に行う方法がわかりません。最終的には、s 列があり、次の列に、特定のシーケンスごとにすべてのデータ フレームのすべてのランクのランク合計がある最終ファイルが必要です。SO基本的にこれ:

助けてください、ありがとう!

0 投票する
1 に答える
177 参照

sas - 外部テキスト ファイルを参照して、SAS でデータ セットをサブセット化する

私は、医薬品に対する反応に関するデータを含む FDA のデータ セットを使用しています。薬の名前でデータをサブセット化しようとしています。関心のある薬物名を含む外部テキスト ファイルがあります。関心のある薬物で構成されるデータのサブセットを作成したいと考えています。外部テキスト ファイルのタイトルは SSRIFULL.txt で、変数名は DRUGNAME です。私は露骨に間違っていた多くのことを試しました

すなわち

データ SSRIFULL2;

---- SSRIFULL を設定します。

---- Drugname ~= "P:\APPRENTICESHIP\SSRI_LIST.txt" の場合、削除します。

走る;

そして、この問題に関する直接の文献を見つけることができません。trunco​​ver または proc sql に関するトピックをもっと調べるべきですか? テキスト ファイルには、約 20 種類の薬物のリストが含まれています。私はある種のインラインコードにもオープンですが、何らかの理由でSASはこれを好まない...

データ SSRIFULL2;

---SSRIFULL を設定します。

------IF (AGE >19) OR (AGE = .) Then Delete;

------If (DRUGNAME ~= 'クロミプラミン' OR 'フルボキサミン' または 'パキシル' または 'パロキセチン' または 'プロザック'

------または「フルオキセチン」または「セロクエル」または「ウェルブトリン」または「ブプロピオン」または「ゾロフト」または「セルトラリン」

------OR 'Zyban') 次に削除します。

走る;

おそらく明らかなように、私は SAS の経験があまりありません。この時点で、このデータ セットを分析に使用できるようにしようとしています。事前に助けてくれてありがとう

0 投票する
1 に答える
1404 参照

r - リスト内のシーケンス オブジェクトをループしますか?

TraMineR24 個のシーケンス オブジェクトを含むリストがあります。次に、これらの各シーケンス オブジェクト (各オブジェクト内のみ) の最適一致距離を計算し、24 個の OM 距離オブジェクト (距離行列) で構成される新しいリストに格納します。

データセットはここにあります。

ステップ (1) は問題なく動作しますが、ステップ (2) に進むと、次のように表示されます。

sequence_objectsはシーケンス オブジェクトではなく、シーケンス オブジェクトのリストであるため、これは当然です。

seqsubmこの関数をシーケンス オブジェクトのリストに適用するにはどうすればよいですか?

0 投票する
1 に答える
113 参照

matlab - MatLabで長方形に当たるランダムな線を選ぶ方法

ランダムな開始点と終了点を作成しています。原点に配置された長方形と交差/交差する人をプロットしたい。図に示すように、コードにいくつかの行が欠けていることがわかりました。その後、トラックが長方形にぶつかったかどうかを数えたいと思います。たとえば、トラックは上から来て、右側から出ました。

私のコードは

どんなアイデアでも大歓迎です!