現在、128 GB RAM と 1 TB 内部 SCSI ドライブを備えた Intel デュアル 8 コア プロセッサ サーバー上の 64 ビット Windows Server 2008 R2 Enterprise で SQL Server 2008 R2 SP1 を実行しています。
サーバーは、2011 年からデータ ウェアハウスと分析サービスのパッケージを実行しています。このサーバーと SQL インスタンスは OLTP には使用されません。
突然、警告なしに、(ストアド プロシージャを使用して) データ ウェアハウス テーブルを構築する SSIS パッケージを呼び出すすべてのジョブが、「通信バッファーのデッドロック」エラーで失敗します。パッケージ内でエラーを生成する SP は、プロセスが実行されるたびに異なります。
ただし、ジョブの開始時に SQL Server プロファイラーが実行されてトレースされていれば、ジョブは正常に実行されます。
これは、最初に 6 月に開発サーバー (同じ構成) で発生しました。Microsoft に問い合わせたところ、ディスク I/O の問題が特定され、MaxDOP = 8 に設定することが提案されました。これにより、デッドロックの問題が緩和されましたが、プロセスがランダムな間隔で最大 3 倍長くかかる可能性があるという問題が発生しました。
これは、本番サーバーで今日発生したばかりです。MaxDOP は現在ゼロに設定されています。先月、OS、SQL Server、または SSIS パッケージに変更はありませんでした。ジョブは 9 月 5 日の夜は正常に実行されましたが、昨夜 (9 月 6 日) の夜にエラーで失敗し、再試行しても引き続き失敗します。
1 つのジョブが失敗するまでの実行時間に一貫性がなく、ジョブ間の一貫性もありません。以前は完了までに 2 分かかっていたジョブは数秒で失敗します。通常 2 時間かかるジョブは、失敗するまでに 30 ~ 90 分かかる場合があります。