SingleColumnValueFilter を使用して hbase スキャンを実行し、他のパラメーターを追加しないと、40000 行が返されます。
例: table.scan(filter="SingleColumnValueFilter('info','collection',=,'substring:tweets_brazilFire')")
例: table.scan(filter="SingleColumnValueFilter('info','collection',=,'substring:tweets_brazilFire')", columns=['field:body_s'])
列をスキャンに追加すると、1967178 行になります。
私はここで混乱しています。列は他の行に存在しますが、指定した列の値がありませんでした。スキャンは、フィルターを通過した列と行のみを返すという両方の条件を適用すべきではありませんか?
これにはpython happybaseを使用しています。
あなたの提案を教えてください。
ありがとう