私は概念実証タスクに取り組んでいます。タスクは、Hadoop テクノロジを使用して製品の機能を実装することです。
機能は非常にシンプルです。「ネットワークの問題」に関する詳細を挿入できる UI があります。このような問題に関するすべての詳細が取得され、Oracle DB のテーブルに挿入されます。次に、このテーブルのデータを処理し、ヘルス スコアを計算します。
従来の Db の代わりに Hadoop を使用する必要があります。HDFS上のImpala? または Hbase の Impala ? またはHbase?
POC の実装に cloudera VM を使用しています。
私の理解によると、Hbase は NoSQL 分散データベースであり、実際には HDFS 上のレイヤーであり、データにアクセスするための Java API を提供します。Impala は、Hbase 経由または直接 HDFS 経由でデータにアクセスするための JDBC アクセスも提供するツールです。私はhadoopに非常に慣れていません。誰か助けてもらえますか?