0

特定の列の値の部分文字列に基づいて、HBase データベースの行をグループ化する必要があります。

その列の値は次のようにフォーマットされます。

[text1]_[text2]_[text3]

例:

row1: abc_aaa_ababab
row2: abc_aaa_cdcdcd  
row3: abc_bbb_fgfgfg  
row4: def_ccc_ababab  
row5: hij_ccc_jkjkjk

[text2] の可能なすべての値 (aaa、bbb、ccc など) を一覧表示するにはどうすればよいですか?

各行のすべての列を一度に取得する必要はありません。ユーザーにはさまざまな [text2] が表示され、"bbb" を選択すると、"bbb" を含む行のみが取得されます。FuzzyRowFilter を使用して後半を行うことができると考えています。

しかし、[text2] の値をリストする方法がわかりません。既存のフィルター、おそらくカスタム フィルターまたは別のアプローチを使用して実行できますか?

注: データベース スキーマは顧客によって作成されます。変更は可能ですが、面倒なプロセスです。したがって、スキーマの再設計に関する提案は価値がありますが、概説されたスキーマの使用に比べれば二次的なものです。

4

1 に答える 1

0

このスキーマを使用すると、検索ごとに完全なテーブル スキャンが必要になるため、非常に非効率的です。

考えられるすべての部分文字列を行 ID にマッピングしたテーブルを追加します。

于 2013-04-07T19:16:52.733 に答える