私は販売員向けのアプリケーションを開発しています。アプリケーションでビッグ データを管理する方法がわかりません。以下にシナリオを示します。
次の基準に基づいて場所を分割しています。
国 => 州 => 都市 => 領土 => エリア => アウトレット。
毎日の売上を管理するための私のテーブル構造は、大まかに以下に詳述されています。
コンセント ID - 1,2,3,4,5,6 ...
ユーザー ID - EMP001、EMP002、EMP003、EMP004、EMP005、EMP006 ...
製品 ID - 78,54,21,11,09,83 ..
数量 - 12,34,67,43,70,03 ..
日時 - 2014 年 1 月 5 日 – 11.00、2014 年 1 月 5 日 – 12.00、2014 年 1 月 5 日 – 14.00 ..
およびその他のフィールド。上記のデータ構造に基づいて、リアルタイムで表示される多くのレポートがあります。
毎日 100 万行の挿入があります。NO-SQL データベースとして Casandra を絞り込みました。
今、リアルタイム分析を照会および管理できるデータベースが必要です。Hbase、Pig、Hive、Presto DB、Impala、Sharp、Shark などのオープン ソース ツールについて聞いたり読んだりします。
現在、リアルタイム分析と製品販売予測のアプリケーションに最適なものを判断できません。
皆様のご支援とご指導をよろしくお願いいたします。
ありがとう