BigQueryの精度を向上させるための問題があります。使用例は次のとおりです。16億レコードのテーブルを使用していますが、このテーブルはそれほど大きくないため、一意のユーザーを見つけようとしています。
最初は「カウントディスティンク」を使用することを考えましたが、ドキュメントに大量のデータが記載されているため、推定結果が得られます。これを改善するために、「countdistinct」ステートメントの代わりに「count+groupby」を試します。しかし、bigqueryの結果は応答が大きすぎます。最初にUserIDでグループ化し、このアイデアを継続しましたが、データの数を減らし、特定のキャンピングを選択し、データの量を大幅に減らしました。しかし、結果は同じで、応答が大きすぎます。
bigQueryで正確に、ユニークユーザーを獲得する方法についてのアイデアや意見はありますか?