私はRの初心者で、データフレーム内の値のパーセンテージを計算する可能性が必要ですが、他の列の値によって「グループ化」されることがよくあります。
メディアタイプ、バージョン、コレクション (= 年)、およびカウント (今年) を含む約 1000 行のデータ フレームがあります。それらをフィルタリングして、特定のメディアタイプのみを取得できます。
trSpdf <- trS[trS$Mediatype == 'application/pdf',]
次の出力例を取得します。
> trSpdf
Mediatype Version Collection Count
39 application/pdf -1 co2008 2.0
40 application/pdf -1 co2009 5.0
43 application/pdf 1 co2008 1.0
44 application/pdf 1 co2009 1.0
48 application/pdf 1.1 co2008 16.0
52 application/pdf 1.2 co2008 20.0
53 application/pdf 1.2 co2009 90.0
... (continuing) ...
私が望むのは、このコレクションのすべてのバージョンと比較して、各コレクション (= 年) の各バージョンの割合を計算することです。この例では、結果は次のようになります。
5.12% of all versions in co2008 were version -1 (2.0 / total sum for co2008)
2.56% of all versions in co2008 were version 1 (1.0 / total sum for co2008)
...
93,75% of all versions in co2009 were version 1.2 (90.0 / total sum for co2009)
...
これを解決する方法についての回答を事前に感謝します。