0

これがばかげた質問である場合は、ご容赦ください。

単一ノードに Cloudera Manager をインストールしています。

Web アプリケーションでの要求と応答のログ記録に Hbase と Hadoop を使用しようとしています。

ログを使用して最新のユーザー アクティビティを一覧表示しようとしています。

行は、以下のテーブル構造を使用して追加されます。

1 列ファミリー、RowId、11 列。すべての値を文字列として保存します。かなりシンプルで、mysql テーブルに似ています。

RowId
entry:addedTime
entry:value
entry:ip
entry:accessToken
entry:identifier
entry:userId
entry:productId
entry:object
entry:requestHeader
entry:completeDate
entry:tag

ここで、Hbase から行を取得するために、

SingleColumnValueFilter("entry", "userId", "=", binary:"25", true, true)

今、私はこれを注文するのに苦労しています

entry:completeDate DESCENDING

ページネーションまたは無限スクロールのために 25 行までに制限します。

私の質問、

Hbase は、Hadoop エコシステムで利用できる唯一のリアルタイム クエリ データベースですか?

間違った理由で Hbase を使用していますか? 私のテーブル構造は正しいですか?

私はスタートアップで働いており、これらは BigData に移行するための小さなステップです。BigData は多くの誇大広告を作成しましたが、Hadoop は最新の Linux でサポートされておらず、複雑すぎるように見えます。

ヘルプや提案をいただければ幸いです。

どうもありがとう、

カーシック

4

0 に答える 0