問題タブ [scalar-subquery]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
apache-spark - SparkSQL - FIRST/MIN/MAX/AVG なしでスカラー サブクエリを機能させる方法
「相関スカラーサブクエリを集約する必要がある」とはどういう意味ですか? 、SparkSQL はスカラー サブクエリに対して不平を言います。
そのため、Catalyst が SQL ステートメントを見るだけで (データを見ずに)、サブクエリが 1 行しか返さないことを 100% 確認できない場合、この例外がスローされます。サブクエリが 1 つの行しか返さないことが確実な場合は、次の集計標準関数のいずれかを使用できるため、Spark Analyzer は満足しています。
- 最初
- 平均
- 最大
- 分
以下の SQL クエリを機能させるにはどうすればよいですか?
Oracle で動作し、結果を返します。
ただし、SparkSQL では既知のエラーで失敗します。
AnalysisException: 相関するスカラー サブクエリを集計する必要があります
FIRST
orを置くとMAX
、別の例外がスローCouldn't find first(description)
されます。これは、スカラー クエリが 1 行しか返さないため、最初の行が見つからないためと思われます。