Hadoop、Cassandra、MongoDB などのさまざまなシステムにさまざまなデータ セットがあります。しかし、私たちの分析チームは、さまざまなシステムからつなぎ合わせたデータを取得したいと考えています。たとえば、人口統計を含む顧客情報はあるシステムにあり、その取引は別のシステムにあります。分析は、米国のユーザーからのトランザクション量などのデータを取得するためにクエリを実行できる必要があります。さまざまなシステムとやり取りするための簡単な方法を提供するアプリケーションを開発する必要があります。最善の方法は何ですか?
別の要件: MongoDB のようなシステムでカスタム ワークスペースを提供したい場合、簡単に配置できます。あるシステムから別のシステムにオンデマンドでデータをプルするための最良の戦略は何ですか?
この種の問題を解決するために使用されるポインタまたは一般的なアーキテクチャは、非常に役立ちます。