1

RやPythonの代わりにJuliaを使って学んでいます。

私はPythonステートメントを持っています:

df = pd.read_csv('{0}/{1:03.0f}.csv'.format(directory, int(id)))

そして使用しています

filename = length(string(id)) == 1 ? "00"*string(id) : 
           length(string(id)) == 2 ? "0"*string(id) : string(id)
df = readtable(directory*"/"*filename*".csv")

私はこれがとても好きですが、もっと簡単な方法はありますか?

同様に Python では、df.describe() を使用してデータフレーム統計の概要 (R) を取得できます。Juliaにはまだ同等のものがありますか?

4

2 に答える 2

2

@sprintf次のようにマクロを使用できます。

julia> @sprintf("%s/%03d.csv","foo",1)
"foo/001.csv"

describe次の関数を使用して、DataFrame の概要を取得できます。

julia> using RDatasets

julia> iris = data("datasets","iris");

julia> describe(iris)

Min      1.0
1st Qu.  38.25
Median   75.5
Mean     75.5
3rd Qu.  112.75
Max      150.0
NAs      0
NA%      0.0%

Sepal.Length
Min      4.3
1st Qu.  5.1
Median   5.8
Mean     5.843333333333332
3rd Qu.  6.4
Max      7.9
NAs      0
NA%      0.0%

Sepal.Width
Min      2.0
1st Qu.  2.8
Median   3.0
Mean     3.0573333333333337
3rd Qu.  3.3
Max      4.4
NAs      0
NA%      0.0%

Petal.Length
Min      1.0
1st Qu.  1.6
Median   4.35
Mean     3.758000000000001
3rd Qu.  5.1
Max      6.9
NAs      0
NA%      0.0%

Petal.Width
Min      0.1
1st Qu.  0.3
Median   1.3
Mean     1.1993333333333331
3rd Qu.  1.8
Max      2.5
NAs      0
NA%      0.0%

Species
Length  150
Type    UTF8String
NAs     0
NA%     0.0%
Unique  3
于 2013-10-10T00:11:31.633 に答える