問題タブ [presto-jdbc]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
hive - presto で Avro テーブルからデータを選択できない
プレストを使用して、ハイブに Avro テーブルを作成しました。以下のクエリを使用して
presto テーブルが正常に作成されていることがわかります。しかし、テーブルの内容を照会/表示しようとすると、以下のエラーが表示されます:
ユーザーが avro スキーマを外部ファイルとして指定してテーブルを作成できないと述べたブログを見つけましたが、テーブル定義で avro スキーマを指定すると、ブログ リンクが機能します。しかし、私は avro.schema.literal を使用できないことがわかりました。この git repo hiveテーブルのプロパティに従って利用できる唯一のオプションはavro_schema_urlであり、このプロパティは場所のみを受け入れます。
この点で何か助けてください。
sql - SQL - クエリにそれぞれ 2 回出現する、少なくとも n 人の一意のユーザーを保証する
私は AWS Personalize を使用しており、サービスの割り当ての 1 つは、「それぞれに少なくとも 2 つのレコードを持つ 25 の一意のユーザーの最小値を含む少なくとも 1000 のレコード」を持つことです。生データにそれらの数字があることは知っていますが、将来、クエリが他の誰かによって実行されたとしても、これらの数値が常に満たされることを保証する方法を見つけてください。
簡単な方法は、完全なデータセットを使用することですが、現在、POC に向けて取り組んでいるため、最初の選択肢ではありません。出現数を数えるだけで「それぞれ 2 つのレコード」セクションをカバーしましたが、最小 25 ユーザーを保証する方法がわかりません。
保存時にデータがシャッフルされていないことは重要です。
私のクエリ
私は AWS Athena にいるので、LIMIT を使用してサブセットをクエリします。