単一ノードのセットアップで Apache ドリルを使用して、600 GB を超える csv ファイルを寄木細工に再フォーマットしようとしています。
SQL ステートメントを実行します。
CREATE TABLE AS Data_Transform.'/' AS
....
FROM Data_source.'/data_dump/*'
寄木細工のファイルを作成していますが、エラーが発生します:
Query Failed: An Error Occurred
org.apache.drill.common.exceptions.UserRemoteException: RESOURCE ERROR:
One or more nodes ran out of memory while executing the query.
これを回避する方法はありますか?または、変換を行う別の方法はありますか?