sql-server - freebcp が大量のデータで停止する

Question

毎日ビッグデータ (サイズ ~3TB) を処理するプロジェクトに取り組んでいます。データパイプラインの最初の段階では、というツールを使用して、MS-SQL サーバーからホストマシン (Linux サーバー) にデータをコピーしますfreebcp。freebcp の詳細はこちら

Linux サーバーからこのツールを使用して、一連のストアドプロシージャを SQL Server で実行し、データをエクスポートして一括転送します。最近私は、データが巨大な場合 (~200GB)、データ転送がしばらくすると停止することを観察しています。いくつかのコマンド ( sp_who2、およびdbcc inputbuffer(spid)) を実行して、SQL サーバーでのストアドプロシージャの実行を監視しました。この手順で使用される CPU 時間とディスク IO を観察します。これが数分間変化しない場合は、ジョブが停止していると見なし、これらのストアドプロシージャを手動で強制終了して、データ処理タスクを続行します。

このデータコピーの停止の考えられる理由は何ですか?

SQL サーバーから Linux ホストにデータを一括でコピーするより良い方法はありますか? freebcp の代わりになるかもしれません。この後、このデータを Hadoop ファイルシステムにロードし、map reduce タスクを実行します。

score 1 · Accepted Answer

BCP ソースのSELECTクエリがブロックされていない場合、ストールの原因として考えられるのは、結果を消費するクライアント側の問題です。

無料のSQL Server ODBC Driver for Linuxを検討しましたか?これには、BCP コマンドラインユーティリティが含まれています。

sql-server - freebcp が大量のデータで停止する

1 に答える 1

Related

Reference