RedHat が Hadoop のバックエンドとして機能する GlusterFS を使用して、1 つの可能な解決策を考え出したのを見てきました。この場合、namenode/datanode アーキテクチャを利用して glusterfs に置き換えることができますが、Hadoop Mapreduce の API 互換性は維持されています。
パフォーマンスがネイティブ HDFS と比べてどうなのか気になりませんか? それは本当に生産準備ができていますか?Hadoop エコシステムもすべてサポートしていますか? たとえば、Solr Cloud、Spark、Impala など。