データ ウェアハウジングとビジネス インテリジェンスのためのさまざまなテクノロジを検討していて、Hadoop という急進的なツールにたどり着きました。Hadoop は、BI の目的のために正確に構築されているようには見えませんが、この分野での可能性を秘めているという参考文献があります。( http://www.infoworld.com/d/data-explosion/hadoop-pitched-business-intelligence-488 )。
私がインターネットから得た情報はほとんどありませんが、従来の BI ソリューションの分野で Hadoop が破壊的なテクノロジーになる可能性があることを私の直感は教えてくれます。このトピックに関する情報は本当に少ないので、Oracle Exadata や vertica などの従来のバックエンド BI インフラストラクチャと比較して、BI ツールとしての Hadoop の可能性に関するすべてのグルの考えをここに集めたいと思いました。はじめに、次の質問をしたいと思います -
- 設計上の考慮事項- Hadoop を使用した BI ソリューションの設計は、従来のツールとどのように異なりますか? Hadoopでスキーマを作成できないと読んだので、違うはずです。また、Hadoop の ETL ツールを完全に排除できることが大きな利点になるとも読みました (これは本当ですか?) BI ソリューションを得るには、Hadoop + pig + mahout が必要ですか??
ありがとうございます。それでは、お元気で!
編集 - 複数の質問に分割します。私が最もインプだと思うものから始めます。