問題タブ [hbase]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
7 に答える
43982 参照

hadoop - Hive は HBase と比べてどうですか?

最近リリースされた ( http://mirror.facebook.com/facebook/hive/hadoop-0.17/ ) Hive と HBase のパフォーマンスの比較に興味があります。Hive で使用される SQL に似たインターフェイスは、実装した HBase API よりもはるかに優れています。

0 投票する
6 に答える
19479 参照

hadoop - Hbase/Hadoopクエリヘルプ

私は友人と一緒に、Hbaseを利用してデータを保存するプロジェクトに取り組んでいます。良いクエリの例はありますか?SQLランドで単純なクエリを記述できる場合、RowResultのリストを反復処理するために大量のJavaコードを記述しているようです。私は何かが足りないのですか?それとも、Hbaseに何かが欠けていますか?

0 投票する
5 に答える
1589 参照

ruby-on-rails - 数十億のレコード アプリのフロントエンドとしての Ruby On Rails/Merb

Ruby on Rails または Merb で記述された、数十億のレコードを持つデータを処理するアプリケーションのバックエンド ソリューションを探しています。私は分散モデルを使用することになっていると感じていますが、現時点では

HBaseHadoop

カウチデブ

私が見た HBase ソリューションの問題 -- Ruby のサポートはあまり強力ではなく、Couchdb はまだバージョン 1.0 に達していません。

このような大量のデータに何を使用するかについての提案はありますか?

データは、時には一度に 30 ~ 40Mb のかなり高速なインポートを必要としますが、インポートはチャンクで行われます。そのため、データの約 95% は読み取り専用になります。

0 投票する
2 に答える
8934 参照

rdbms - Hbase スキーマの設計方法

この RDBM テーブル ( Entity-attribute-value_model ) があるとします。

スケーリングの問題により、HBase を使用したいと考えています。

Hbase テーブルにアクセスする唯一の方法は、主キー (カーソル) を使用することです。特定のキーのカーソルを取得し、行を 1 つずつ反復できます。

問題は、私の場合、3 つの列すべてを反復できるようにしたいということです。例えば ​​:

  • 指定されたエンティティIDについて、そのすべての属性と値を取得したい
  • 特定の属性名と値に対して、すべてのentitiIDSが必要です...

したがって、私が持っていた1つのアイデアは、データを保持する1つのHbaseテーブル(エンティティIDをプライマリインデックスとして持つテーブルDATA)と、2つの「インデックス」テーブルを構築することです。

各インデックス テーブルは、DATA テーブルのポインター (entityID) のリストを保持します。

それは合理的なアプローチですか?それともHbaseの概念の「乱用」ですか?

このブログで、著者は次のように述べています。

HBase では、主キーによる get 操作と行範囲のスキャン (カーソルを考えてください) が可能です。(スケールとセカンダリ インデックスの必要性の両方がある場合でも、心配する必要はありません。Lucene が助けてくれます! しかし、それは別の投稿です。)

Lucene がどのように役立つか知っていますか?

-- よなたん

0 投票する
2 に答える
6308 参照

database-design - Hadoop Hbase:列ファミリーをテーブル全体に分散させるかどうか

Hbaseのドキュメントでは、物理的なストレージは列ファミリーによって行われるため、同様の列を列ファミリーにグループ化する必要があることが明確になっています。

しかし、列グループごとに別々のテーブルを持つのではなく、2つの列ファミリーを同じテーブルに配置することはどういう意味ですか?この方法でテーブルを「パーティション化」する方が理にかなっている特定のケースと、1つの「ワイド」テーブルがより適切に機能するケースはありますか?

個別のテーブルは個別の「行領域」になるはずです。これは、一部の列ファミリー(全体として)が非常にまばらな場合に役立ちます。逆に、列のファミリをまとめておくと有利なのはいつですか。

0 投票する
2 に答える
4078 参照

php - thrift を使用して HBase に php 配列を書き込む

Thrift php クライアントがあり、HBase テーブルに書き込みたいのですが、次のことを行っています。

問題は、HBase に挿入するときに、配列である値が、配列の要素を格納する代わりに「配列」に変換されることです。リストを配列(またはバイト配列)として保存するにはどうすればよいですか

0 投票する
3 に答える
776 参照

store - 列ストアデータベースのセカンダリインデックス

セカンダリインデックスをサポートする列ストアデータベースはありますか?HBaseがそうすることは知っていますが、まだありません。

ハガイ書。

0 投票する
2 に答える
6550 参照

ruby-on-rails - ActiveRecordアダプターの作成

現在存在しないので、 HBaseデータベース用に独自のActiveRecordアダプターを作成したいと思います。しかし、私はしばらくオンラインで検索していて、ActiveRecordアダプターの作成方法に関する優れたリソースを見つけることができません。これをどのように行いますか、または推奨できるリンクはありますか?