これがばかげた質問である場合は、ご容赦ください。
単一ノードに Cloudera Manager をインストールしています。
Web アプリケーションでの要求と応答のログ記録に Hbase と Hadoop を使用しようとしています。
ログを使用して最新のユーザー アクティビティを一覧表示しようとしています。
行は、以下のテーブル構造を使用して追加されます。
1 列ファミリー、RowId、11 列。すべての値を文字列として保存します。かなりシンプルで、mysql テーブルに似ています。
RowId
entry:addedTime
entry:value
entry:ip
entry:accessToken
entry:identifier
entry:userId
entry:productId
entry:object
entry:requestHeader
entry:completeDate
entry:tag
ここで、Hbase から行を取得するために、
SingleColumnValueFilter("entry", "userId", "=", binary:"25", true, true)
今、私はこれを注文するのに苦労しています
entry:completeDate DESCENDING
ページネーションまたは無限スクロールのために 25 行までに制限します。
私の質問、
Hbase は、Hadoop エコシステムで利用できる唯一のリアルタイム クエリ データベースですか?
間違った理由で Hbase を使用していますか? 私のテーブル構造は正しいですか?
私はスタートアップで働いており、これらは BigData に移行するための小さなステップです。BigData は多くの誇大広告を作成しましたが、Hadoop は最新の Linux でサポートされておらず、複雑すぎるように見えます。
ヘルプや提案をいただければ幸いです。
どうもありがとう、
カーシック