問題タブ [tapply]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - なぜtapplyはサブセットをNAとして取り、それらを完全に除外しないのですか?
質問があります。平均バーとエラーバーを使用して棒グラフを作成します。ここでは、2つの要素でグループ化されています。平均と標準誤差を取得するために、関数tapplyを使用しました。
しかし、要因の1つとして、1つのレベルを下げたいと思います。
だから私がしたことはした:
次に、平均と標準誤差を取得するために、これを使用します。
そして、何か奇妙なことが起こります。FSは計算されませんが、NAのあるテーブルに入れられます。
これは必要ありません。これをbarplot2(パッケージgplots)で使用すると、FS用の空のバーが表示されますが、そのバーはまったく存在しないはずです。
それで、どんな使用法も素晴らしい棒グラフを得るための解決策または他の方法を持っていますか:)。とにかくありがとう!
r - テーブルの再形成のパフォーマンス
このようなテーブルからどのように移動できますか:
こんな方に?パッケージ reshape2 の dcast を使用してみました。正常に動作しますが、データセットが非常に大きいため、少し遅くなります。それをより速く行う別の方法はありますか?
ありがとうございました!
r - glm をベクトル化し、すべての情報を抽出する
いくつかのグループを持つデータセット「キーワード」があります。glm を各グループに個別に適用して、グループごとに 1 つのフィットを持つ glm フィットのリストを作成したいと考えています。
forループでこれを行うこともできますが、それは R の精神ではありません。代わりに、 by関数を使用して実行しようとしました。
問題は、glmは通常、あらゆる種類のグッズを抽出できる glm クラス オブジェクトを返すのに対し、byはリストを返すことです。
フィットのパラメーターを除いて、すべての情報が失われています。リストに関するすべての情報を強制的に保持する方法はありますか?
ps、plyrツールボックスを使用してみましたが、キーワードにスペースが含まれているために動かなくなりました。
pps、この投稿には「by」というタグを付ける必要がありますが、そのタグを作成できません (stackoverflow の新機能)。
r - 因子の組み合わせによって定義されるdata.frameの特定のサブセットにカウンターを割り当てる方法は?
私の質問は、いくつかの因子変数を持つデータフレームがあります。ここで、このデータフレームに新しいベクトルを割り当てます。これにより、これらの因子変数のサブセットごとにインデックスが作成されます。
私に次のようなものを与えます:
そして、私が欲しいのは、各因子の組み合わせの発生をカウントする組み合わせカウンターです。このような
これまでのところ、tapplyを使用して、すべての因子の組み合わせに対してカウンターを取得することを考えました。これは正常に機能します。
しかし、非効率的なループを使用せずに、データフレーム内の組み合わせにカウンターリスト(リストされていないなど)を割り当てる方法がわかりません:)
r - 順序付けられた因子でタップする
因子レベルが欠落している場合、次の方法でテーブルを使用できます。
これは、頻度がゼロでリストされたレベル「2」のテーブルを返します。
「マーク」に関連付けられた「スコア」のセットがあり、欠落しているレベル (ここでは 2) がなかったtapply
場合、各レベルのスコアの合計を生成するために使用できます。
「不足している」因子レベルのケースにタッププライを適応させることはできますか? それとももっと良い方法がありますか?
r - 時系列からの曜日の週パーセント
週の平均に対する「曜日のパーセント」を抽出する必要がある毎日の時系列データがあります。たとえば、最初の週がmean = 100
で、今週の日曜日の値が 20 の場合、日曜日は 0.2 になります。
ここにいくつかのランダムなデータがあります:
pecent
上記で説明した値であるという新しい列が必要です。いくつかの列を追加してから使用しようとしましtapply
たが、失敗しました。どんな助けにも感謝します!
r - by()関数は成長リストを作成しますか
by
関数は、一度に1つの要素を増やすリストを作成しますか?
因子列でグループ化された約400万の観測値を持つデータフレームを処理する必要があります。状況は以下の例のようになります。
これでtapply
、列の1つに適切な時間がかかります。
しかし、私がこれを行う場合:
それはほぼ同時にどこでも終了しません(私は1分後にあきらめました)。
もちろん、上記の例でtapply
は使用できますが、実際には複数の列を一緒に処理する必要があります。これを行うためのより良い方法は何ですか?
r - na.rm を引数として tapply に渡す方法は?
パラメータ用の1列とグループ識別子用の1列を持つデータフレームから平均とsdを計算したいと思います。を使用する場合、どのように計算できtapply
ますか? を使用できますが、 を使用する場合、 をステートメントにsd(v1, group, na.rm=TRUE)
収めることができません。
オプションはありません。たくさんのパラメーターがあり、1 つの欠損値を持つすべての行を除外するときに、データフレームの半分を失うことなく、それらを段階的に実行する必要があります。na.rm=TRUE
tapply
omit.na
by
発言についても同様です。
これを行う方法はありますか?
r - winbugs の tapply に相当するもの
各州の平均を計算する必要があります。Rでは、これを使用してこれを行いました
tapply(y,state,mean)
.
次に例を示します。
ここで、y は近似値のベクトルを表し、状態は因子である従属変数を表します。
Winbugsでこれを行うにはどうすればよいか疑問に思っています。それについて何か考えはありますか?
r - Rのデータフレームでtapply関数を使用する
これが私のデータフレームdfです:
1 1 1
2 1 2
3 2 3
そして、私は結果を得る:
2
3
コードで:
tapply(df $ y、df $ x、sum)
しかし、私は得ることを期待しています
3
3
私のコードに何か問題がありますか?