0

現在、ユーザーがドキュメントをアップロードするアプリケーションを持っています (pdfs/excel/word、いくつかの画像)。できるビッグデータ(Hadoop-MangoDB)ソリューションを探しています

  1. 何千ものpdf、word、excelファイルを保存します(サイズも大きくなっています)

  2. 画像のメタ情報を検索

  3. 全文検索 (ほとんどリアルタイム)

  4. 検索の高速化

ご意見をお聞かせください

4

1 に答える 1

0

apache Hbaseも見てください..あなたのユースケースに役立つかもしれません..それはHdfsの上で実行され、ランダムなリアルタイムの読み取り/書き込みアクセスを提供するNOSQLデータベースです..Apache Hiveを次のように見ることができますHbase とは異なり、リアルタイム処理用ではありませんが、Hadoop クラスター上に SQL のようなインターフェイスを備えたデータ ウェアハウスを提供します。事前の処理の種類..SQL のバックグラウンドを持っている場合に役立ちます。

于 2012-06-12T20:46:38.727 に答える