Hive クエリの where 句内でネストされた選択を行う必要があります。サンプル コード スニペットは次のようになります。
select *
from TableA
where TA_timestamp > (select timestmp from TableB where id="hourDim")
上記のスクリプトの実行中にエラーが発生したため、これは可能ですか、それともここで何か間違ったことをしていますか?!
私がやろうとしていることをさらに詳しく説明するために、タイムスタンプ付きの統計を公開する cassandra キースペースがあります。定期的に (たとえば、1 時間ごと)、この統計はハイブを使用して集計され、集計されると、そのデータは対応する時間とは別に保存されます。そのため、クエリを 2 回目に実行する (および連続して実行する) 場合、クエリは新しいデータに対してのみ実行する必要があります (タイムスタンプ > previous_execution_timestamp)。最新の実行されたタイムスタンプを別のハイブテーブルに保存し、その値を使用して生の統計を除外することでそれを実行しようとしています。
ハイブを使用してこれを実現できますか?!