IN クエリを半左結合に置き換える必要があることは知っていますが (例: Hive does not support in, exists. How do I write the following query? )、それを WHERE 句と組み合わせる方法がわかりません。 :
SELECT *
from foo
WHERE userId IN
(SELECT distinct(userId) FROM foo WHERE x=true ORDER BY RAND() LIMIT 100);
ありがとう。
編集:クエリを変更しました。目的は、エントリのランダム サンプルを作成することです (統計的に)。