BIの顧客がいて、販売トランザクションから生成された販売データベーステーブルに毎月約4,000万行を生成しています。彼らは、5年間の履歴データを使用して販売データマートを構築したいと考えています。つまり、このファクトテーブルには約2億4000万行が含まれる可能性があります。(40 x12か月x5年)
これはよく構造化されたデータです。
Imがこの量のデータに直面したのはこれが初めてであり、Inforbrightやその他のツールのような垂直データベースツールを分析するために私を連れて行きました。しかし、それでもこの種のソフトウェアでは、単純なクエリの実行に非常に長い時間がかかります。
これでHadoopを確認しましたが、いくつかの記事を読んだ後、Hadoopはファクトテーブルを作成するための最良のオプションではないと結論付けました。私の理解では、非構造化データを処理することを目的としているためです。
だから、私の質問は:この課題を構築するための最良の方法は何でしょうか?、私は適切なテクノロジーを探していませんか?このような大きなファクトテーブルで取得できる最高のクエリ応答時間はどれくらいですか?..または私はここで実際の壁に直面していますか?唯一のオプションは集約されたテーブルを構築することですか?