SAS と Hadoop の統合を理解しようとしています。私が理解していることから、proc sql のような SAS プロセスは SAS データセットに対してのみ機能し、hadoop ノード上のテキスト ファイルに対して proc sql を発行することはできません。それが正しいか?
はいの場合、ETL ジョブを使用して、最初に HDFS からデータを取得し、SAS テーブルに変換する必要があります。しかし、そうすると Hadoop の並列処理能力が失われてしまいますよね?
では、SAS と Hadoop を統合し、Hadoop の並列処理能力を引き続き使用するには、どのような方法が理想的でしょうか?
SAS 内からマップ リデュース ジョブを呼び出せることは承知していますが、SAS でマップ リデュース ジョブを記述できますか? ないと思います。