1

私は NoSQL が初めてで、ファイル ストレージにHBaseを使用しようとしています。ファイルを HBase にバイナリとして保存します。

統計は必要ありません。ファイルストレージのみが必要です。

推奨されますか? I/O 速度が気になります。

ストレージに HBase を使用する理由は、HDFSを使用する必要があるためですが、クライアント コンピューターで Hadoop を構築することはできません。そのため、クライアントが HDFS に接続してファイルを取得するのに役立つライブラリをいくつか見つけようとしていました。しかし、私はそれを見つけることができず、接続ライブラリの代わりに HBase を選択しました。

このような場合、どうすればよいですか?

4

3 に答える 3

0

確かに、HBase を使用してファイルを保存できます。これはおそらく理想的ではなく、ファイル サイズの分布に基づいて、設定の一部を微調整する必要がある場合があります。HDFS と比較すると、多数のファイルの場合、おそらくはるかに優れた代替手段です。

注意すべき設定:

  • 最大領域サイズ: これを 4GB まで上げたいと思うでしょう。
  • 最大セル サイズ: この制限を無効にするには、これを 0 に設定します。

他の種類の代替手段 (MapR など) も検討する必要があるかもしれません。

于 2011-07-21T20:20:33.913 に答える
0

Hadoop については知りませんが、MongoDB には分散ファイル ストレージ用に設計された GridFS があり、水平方向にスケーリングしたり、「無料」でレプリケーションを取得したりできます。

http://www.mongodb.org/display/DOCS/GridFS

MongoDB にファイルをチャンクに保存するとオーバーヘッドが発生するため、負荷が低から中程度で、応答時間を短くする必要がある場合は、おそらくファイル システムを直接使用する方がよいでしょう。パフォーマンスは、ドライバーの実装によっても異なります。

于 2011-07-21T00:40:58.513 に答える
0

HDFS を通常のファイル システムとしてマウントする機能が役立つと思います。http://wiki.apache.org/hadoop/MountableHDFS

于 2011-07-21T10:11:51.843 に答える