外部テーブルから SQL DW 内部テーブルにデータを読み込もうとしています。BLOB ストレージに圧縮形式のデータ ストアがあり、外部テーブルは BLOB ストレージの場所を指しています。
サイズが約 22GB の約 24 個のファイルがあり、より大きなリソース クラスのサービス/ユーザー アカウントを使用して、外部テーブルから 300 DWU の内部テーブルにデータをロードしようとしています。
ステートメントへの挿入 (非常に簡単です) が 10 時間以上実行されています。insert into Trxdata.Details_data select * from Trxdata.Stage_External_Table_details_data;
以下のステートメントも試してみましたが、これも10時間以上実行されています。CREATE TABLE Trxdata.Details_data12 WITH (DISTRIBUTION = ROUND_ROBIN) AS SELECT * FROM Trxdata.Stage_External_Table_details_data;
なるほど - 両方の SQL が "sys"."dm_pdw_exec_requests" で ACTIVE ステータスで実行されています [考えていましたが、同時実行スロットの問題であり、実行する同時実行スロットがありませんが、そうではありません]
そして、DWUを増やしたりスケールアップしたりして、パフォーマンスが向上することを望んでいました。しかし、portal.azure.com で DWU の使用状況を見てみると、DWU の使用状況グラフが過去 12 時間で <50DWU を示しているため、DWU を増加させることはできません。
それで、私は理解しようとしています-どうすれば見つけることができますか-何がそんなに時間がかかっているのか、どうすればデータロードのパフォーマンスを向上させることができますか?