さまざまな大規模な調査に対する何百万もの回答を保存する調査エンジンを作成中です。
それぞれ 10 ~ 100 人のユーザーを持つさまざまな機関があります。それぞれが 3000 以上の質問の調査を管理できます。代理店も複数出ます。
各機関がそれぞれ 3000 以上の応答を持つ数十万のセッションを持つ場合、セッションとその応答データを取得してさまざまな分析 (集計など) を実行するのに Hadoop が適していると思います。
セッション、調査の質問、および回答は、現在すべて sql データベースに保持されています。それを維持して、データを並列に配置しようと考えていました。したがって、エージェンシーの下で新しいセッションが取得されると、データセット全体が呼び出されたときに含まれるように、hadoop の「ファイル」に追加されます。
この実装は Hadoop でうまく機能しますか、それともまだリレーショナル データベースの制限内に収まっていますか?