問題タブ [tapply]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - より大きな行列から、複数の場所から 4 つのサブ場所のセットの平均値を計算します
円管の肉厚測定のデータ解析を行っています。次のマトリックスがあります。
Sub.location 列には、値 A、B、C、D があります。これらは、同じ測定位置での測定値ですが、断面内の異なる位置での測定値です。したがって、チューブに沿って 0、90、180、270 度です。
時間の経過とともに肉厚の減少が最も大きい測定箇所を明らかにするプロットを作成したいと考えています。
これを行うには、まず、各測定位置でのチューブの壁厚の平均値を、一意の間隔ごとに計算します (実行時間は間隔に結合されます)。
私は次の式でこれをやってみました:
これはうまくいかないようです。これを使用していくつかの値の標準偏差も計算し、プロットを簡単に作成できるようにするため、tapply 関数を保持したいと思います。
この問題に取り組む方法について誰かアドバイスはありますか?
r - 同じ結果を得るために、tapply を集計に変更できますか?
この場合、tapply を集計に変更して同じ結果を得るにはどうすればよいですか?
r - 特定の行に多くの行を変換する
このデータを変換したいと思います:
その形式では、複数の遺伝子型を持つ「E」サンプルでタグ付けし、同じ遺伝子型を持つサンプルを 2 回統合します。
多くのリージョン (Region1 - Regionx) を含む 1 つのリストがあります。Rソフトウェアで行うことは可能ですか? どうもありがとう。
r - さまざまな因子レベルの適用ファミリを使用した要約統計量
さまざまな因子レベルの要約統計量を見つけようとしています。
これで、さまざまな値がcompany
得られました。さまざまな値についてステートメントを繰り返すことができます。ddply
apply family ( , tapply
, )を使用して自動化できることはわかっていますがsapply
、うまくいきません。
r - Rでグループごとに日付データを要約する方法
次のサンプル データを次のように新しいデータフレームにまとめたいと思います。
母集団、サンプルサイズ (N)、完了率 (%)
サンプル サイズは、各母集団のすべてのレコードの数です。table コマンドまたは tapply を使用してこれを行うことができます。完了率は、「終了日」のあるレコードの割合です (「終了日」のないすべてのレコードは完了していないと見なされます。ここで迷っています!
サンプルデータ
r - 2 つの要素に基づいて Z スコアを計算したいのですが、これを行う方法はありますか?
性別と年齢層 (4 つの要因) の 2 つの要因に基づいて、合計スケールの z スコアを計算したいと思います。
Rでそれを行うにはどうすればよいですか?私はRを初めて使用し、学習を始めたばかりで、出会いました
しかし、結果はデータ フレームではありません。どうすればデータフレームに変換できますか? それとも他に方法はありますか?
python - Python Pandas の R の tapply() に相当
動物のタグ ID (1,2,3)、タイプ (A,B)、および各「食事」で与えられる飼料の量 (kg) で構成される、3 匹の動物の給餌データを含むデータセットがあります。
unique('Animal')
ベースRでは、以下を使用して、行、列、および行列の対応するセルのunique('FeedType')
累積を持つ以下の行列を簡単に出力できますAmount (kg)
tapply()
Python Pandas データフレームに同等の機能はありますか? パンダでこれを達成するための最もエレガントで最速の方法は何ですか?
Amount
PS どの列、この場合は、集計を実行するかを指定できるようにしたいと考えています。
前もって感謝します。
編集:
2つの回答で両方のアプローチを試しました。216,347 行 15 列の実際の Pandas データ フレームでのパフォーマンス結果:
与えます:
したがって、私の場合、pivot_table() の方が高速に動作します。