私はHadoopを初めて使用し、データウェアハウジングと分析の面でそれを学ぼうとしています。
特に1.学習を開始するために必要なマシン/ノードの数2.Windowsでセットアップすることをお勧めしますか?3.インストールする必要のあるソフトウェア4.テスト/サンプルデータの可用性
また、HiveでBIアクションを実行するための最良の方法についてアドバイスをもらいたいと思います。
ありがとうございました。
私はHadoopを初めて使用し、データウェアハウジングと分析の面でそれを学ぼうとしています。
特に1.学習を開始するために必要なマシン/ノードの数2.Windowsでセットアップすることをお勧めしますか?3.インストールする必要のあるソフトウェア4.テスト/サンプルデータの可用性
また、HiveでBIアクションを実行するための最良の方法についてアドバイスをもらいたいと思います。
ありがとうございました。
Hadoop 機構にもっと興味がある場合は、cloudera VM をダウンロードすることをお勧めします。すぐに開始するもう 1 つの方法は、Amazon EMR (elastic mapreduce) を使用することです。そこにインタラクティブなハイブクラスターを作成し、S3 に保存されたデータセットで遊んでみるオプションがあります。
ノード数について - 目標によって異なります。Hadoop のパフォーマンスを「感じる」ことに興味がある場合は、少なくとも 4 ~ 6 ノードを試してください。
組織の内部 Hadoop/Hive クラスターにアクセスできない場合は、上記のどちらの方法も有効です。この場合でも、共有環境を使用する前に、彼らと一緒に実践することをお勧めします。