最近、Excel の Chart の代わりとして、データの視覚化を学ぶ時間ができました。私の選択は R (ggplot2 を使用) で、学習を開始しました。
ジョセフ・アドラーは「R の要約」で次のように述べています。
通常、Perl などのツールを使用して、大きなファイルを R で使用する前に前処理します。
Perl、Python、Ruby などのスクリプト言語を使用して、大規模で複雑なテキスト ファイルを前処理し、それらを消化可能な形式に変換することをお勧めします。(ちなみに、私は通常、フィールド名と長さのリストを Excel に書き出してから、Excel の数式を使用して R または Perl コードを作成し、それらをロードします。
その根底にあるのは、Unix の哲学です。つまり、各ツールにそれぞれの仕事をうまくさせ、それらを連携させます。したがって、長期的には、次のことを学ぶ予定です。
- 視覚化のためのR、および
- 将来のデータ処理用の別のプログラミング言語。
どの言語を学ぶべきかという疑問が生じます。
私はコンピュータ サイエンスのバックグラウンドを持っていませんが、Perl は私には難しすぎます。オンラインで検索したところ、Haskell と Clojure が非常に興味深いことがわかりました。ここにはプログラマー+統計学者がたくさんいるので知りたいのですが、大規模なデータ処理の目的でRに適しているのはどれですか?
ニック