HDFS ベースのストレージ クラスターの実行と、Cloudera リリースを通じてマウント可能な HDFS システムを使用する簡単な方法を検討しています。
最初の質問は、これによりデータの自動重複排除が提供されるかということです。
重複排除が行われるかどうかを尋ねる 2 番目の質問は、すべてのユーザーが特定の重複排除されたブロックを含むファイルを削除した場合、実際にそのブロックをストレージから削除するのか、それともそのユーザーのインデックス/参照だけを削除するのかということです。
最後に、この方法には Rainstor 圧縮方法が含まれますか?
ご意見ありがとうございます