Hadoop クラスターで Hive を使用して、Presto を使用して Hadoop に保存されているデータの分析を行うことを検討していますが、まだいくつかのことについて混乱しています。
- ファイルはHadoopに保存されます(ある種のファイルマネージャー)
- Hive には、Hadoop からのデータを格納するためのテーブルが必要です (データ マネージャー)
- Hadoop と Hive の両方がデータを別々に保存しますか、それとも Hive は Hadoop のファイルを使用するだけですか? (ハード ディスク容量などに関して?) -> Hive は Hadoop からデータをテーブルにインポートし、Hadoop をそのままにしておきますか、それともどうすればこれを確認できますか?
- Presto は、Hive なしで Hadoop だけで直接使用できますか?
私の質問に答えてくれてありがとう:)