私のラムダ アーキテクチャでは、不変データを格納するために HDFS と Cassandra のどちらを使用するかについて議論しています。オンライン リクエストなどに対応するには Cassandra が必要なので、技術スタックの必須部分です。現在、必要がなければ、スタックに新しいツール (HDFS) を導入したくありません。私の質問は、HDFS を使用せず、Cassandra を使用して不変データもホストする場合、何が欠けているのでしょうか。
編集:
HDFS は分散ファイルシステムであり、Cassandra は NoSQL DB であることを理解しています。それでも、どちらもデータ レプリケーションをサポートし、どちらも高スループットの書き込みをサポートします。さらに、Cassandra は低潜在データ検索をサポートします。では、HDFS が私に多くのリフトを提供しないと言っているのは正しいでしょうか?