問題タブ [rowsum]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - data.frame または matrix の合計行
行が観測値で、列が遺伝子マーカーである非常に大きなデータフレームがあります。Rを使用して、観測ごとに選択した数の列の合計を含む新しい列を作成したいと思います.
200 列と 100 行がある場合、列 43 から 167 までの合計で 100 行の新しい列を作成したいと思います。列には 1 または 0 のいずれかがあります。各行で、遺伝子マーカーが最も多い個人を並べ替えることができます。
私はそれが何かに近いと感じています:
arrays - R で 3 次元配列の行の合計を効率的に計算する
配列を考えてみましょうa
:
結果が次のようになるように、3 番目の次元によってインデックス付けされた行列の行の合計を効率的に計算するにはどうすればよいでしょうか。
??
列の合計は、次の'dims'
引数を介して簡単に計算できcolSums()
ます。
rowSums()
しかし、 の解釈と の解釈が異なるため、目的の結果を達成するために配列で使用する方法を見つけることができませ'dims'
んcolSums()
。
以下を使用して、必要な行の合計を簡単に計算できます。
しかし、それはループを隠しているだけです。必要な行の合計を計算する効率的で真にベクトル化された方法は他にありますか?
function - Rの行の特定の値の出現数を計算するにはどうすればよいですか?
私はかなりトリッキーな問題を抱えていますが、それは解決できないようです。
大規模なデータセット(23277行、151列)があります。各列には、世界のイベントに割り当てられた確率を表す0:100(両端を含む)の値があります。
各個人のスコアを計算する一環として、データセット内の各値の出現をカウントする必要があります。
最初に適用しようとしましたが、NAとサブセットを無視する必要があるため、次のことを試しました。
エラーメッセージが表示されました:sum(ans.samp [ans == 0])'は関数、文字、または記号ではありません
私はこのプロセスをsapply、vapply、tapply、do.callで繰り返しましたが無駄になりました。
ベクトル化されたソリューションをあきらめて、次のforループを作成しました。
ただし、これを機能させた後は、サンプル内のOの合計のみが返されます。
時間のプレッシャーにさらされているので、これについて助けていただければ幸いです。将来、Rでこのような問題を解決できるようになりたいと思います。
再現性のために含まれているサンプルデータ:
任意の洞察をいただければ幸いです。
上記の小さなデータセットでのいくつかの試みから、数値は各行に対して計算されているように見えますが、resオブジェクトを返すと、最終的な値が得られるだけです。どうすればこれを修正できますか?
r - R:2つのベクトルによって制約されたcolSumsとrowSumを含む行列
行列OUTを見つけるためのよりエレガントな(コードが少ない)方法はありますか?
colSums(OUT)<= aおよびrowSums(OUT)<= bの場合、
与えられたORD=充填の順序
sum(OUT)->最大化
数独のような問題(番号は一意ではなく、充填順序が指定されているため、実際には数独ではありません)。この問題にはもっと簡単な解決策があると思います。
編集:ありがとう!そして最後に私はこれで終わりました(非常に単純な問題のためのかなり長いコード;):
r - 条件を満たす値の行単位のカウント
一部の列が基準を満たす回数 ( ==
、<
、 など>
) の新しい変数を生成したいと考えています。関数は を処理する必要がありNA
ます。
一部の値が欠落しているサンプル データ:
< 16
この例では、列「x」、「y」、「z」の各行の値の数を合計する変数「less16」が必要です。最初の数行の望ましい結果:
rowSum
、sum
、which
、を使用してfor
ループを試しましたが、これまでのところすべて役に立ちませんでした。アドバイスをいただければ幸いです。前もって感謝します。if
else
r - R:行の合計のグループ化ベクトルとして行を使用します
次のようにデータセットをレイアウトした場合:
各行を合計したいので、食品グループをさまざまなカテゴリに定義できます。そこで、グループ行を定義ベクトルとして使用したいと思います。
つまり、food1とfood2はグループ1にあり、food3はグループ2にあり、food4はグループ3にあります。
次のような理想的な出力:
このrowsum()ベースの関数を使用してみましたが、運が悪かったので、代わりにddply()を使用する必要がありますか?
コメントからのデータ例:
r - R の行合計から inf を省略する
そのため、行列の行を合計しようとしていますが、その中に inf があります。inf を省略して行を合計するにはどうすればよいですか?
r - R プログラミング - 共通の値を持つ行の要素の合計
こんにちは、ご支援いただきありがとうございます。
(追加の洞察のためにコメントセクションに注意してください。つまり、以下の例のコスト列がこの質問に追加されました。サイモンは素晴らしい答えを提供しますが、コスト列自体は彼からのデータ応答に表されていませんが、彼が提供する機能はコスト列で動作します)
私はデータセットを持っています。それを「データ」と呼びましょう。これは次のようになります
私がやりたいのは、同じ NAME 値を持つレコードの PAID (および COST) 要素を合計し、(この例のように) 行数を 2 に減らして、新しいデータ フレームが次のようになるようにすることです。
日付に関する限り、合計プロセスでどれが生き残るかはあまり気にしません。
rowSums(data) まで取得しましたが、その使用方法が正確にはわかりません。どんな助けでも大歓迎です。
r - R - 別の列の条件によって定義された間隔の間で列内のオブジェクトを合計する方法
これは、次の質問への応用です:別の列によって定義された間隔の間の列内のオブジェクトを合計します。
私が知りたいのは、Bの値を合計したい場合に答えを調整する方法です.orまたはor((A[i+1]-A[i]==0)
は行(A[i+1]-A[i]==1)
インデックスです。したがって、基本的に同じ値+/- 1を持つAsのB行を合計しますが、同じ行を 2 回合計しませんか?(A[i]-A[i-1]==0)
(A[i]-A[i-1]==1))
i
ループ関数を作成しようとしましたが、データ フレームで行インデックスを使用するとスタックします。例:次のデータフレームが与えられた場合
取得したいのは、次のデータ フレームです。
さらに、次のような大きなデータ フレームがある場合:
結果を次のように表示したい (列 m の値が最大の行を選択した):