0

私は R についてもう少し理解しようとしており、Kaggle でこの非常に優れたスクリプトに出くわしました: https://www.kaggle.com/msjgriffiths/d/kaggle/sf-salaries/explore-sf-salary-data/コード

私はRの初心者で、ポスターが使用したコードの一部を理解するのに苦労しています。これは以下に要約されています:

data_csv <- read_csv("../Salaries.csv", na=c("Not Provided"))
data <- data_csv
glimpse(data_csv)
non_numeric_vars <- names(data)[!sapply(data, is.numeric)]
data %>%
  select(one_of(non_numeric_vars)) %>%
summarise_each(funs(unique_vars = length(unique(.))))

私が理解していない選択は、funs上記のコードの関数です。dplyr の R ドキュメントを読むと、3 つの引数で指定された関数のリストが必要であると書かれています。3 つの引数はどこにありますか、またはこのスレッドに従ってパイプされていますか What does %>% mean in R ?

また、ドキュメントを見つけようとしましunique_varsたが、何も思いつきませんでした。この変数の詳細については、どこで確認できますか?

funs {dplyr}    R Documentation Create a list of functions calls.

Description

funs provides a flexible way to generate a named list of functions for input to other functions like summarise_each.

Usage

funs(...)

funs_(dots) Arguments

dots,...     A list of functions specified by: Their name, "mean" The function itself, mean A call to the function with . as a dummy parameter, mean(., na.rm = TRUE) Examples

funs(mean, "mean", mean(., na.rm = TRUE))

# Overide default names funs(m1 = mean, m2 = "mean", m3 = mean(., na.rm = TRUE))

# If you have function names in a vector, use funs_ fs <- c("min", "max") funs_(fs)

彼のコードを実行した後の結果は次のとおりです。unique_vars 変数が結果のどこに含まれているかはわかりません。

## Source: local data frame [1 x 6]
## 
##   EmployeeName JobTitle Benefits Notes Agency Status
##          (int)    (int)    (int) (int)  (int)  (int)
## 1       110811     2159    98648     1      1      3
4

1 に答える 1

0

funs3 つの引数は必要ありません。ドキュメントで、それが言う場所

によって指定される関数のリスト: それらの名前、「平均」 関数自体、平均 を使用した関数の呼び出し。ダミーパラメータとして、 mean(., na.rm = TRUE)

これは、引数を にフォーマットする 3 つの異なる方法ですfuns。への各引数funsは、関数として解釈されます。

unique_vars = length(unique(.))length(unique(.))「unique_vars」と呼ばれる列として要約の出力にラベルを付けます。

于 2016-05-14T18:11:49.040 に答える