あるサーバーでチェックサムの不一致が発生しています。ご意見や同様の経験をお持ちでしたら教えてください。
コマンドを実行するたびに
# md5sum MyBig.3GB.largeFile.bin
チェックサム出力が異なります。このコマンドでも:
# for i in {1..10} ; do time md5sum MyBig.3GB.largeFile.bin ;done
後続のチェックサム出力は異なり、各反復の実行にかかる時間も大きく異なり、10 秒から最大 3 分までランダムに変化します。これは、I/O パフォーマンスに基づく通常の時間です。
この問題は、「md5sum」チェックサムだけでなく、「cksum」と「sha1sum」にもあります。同じ一貫性のない結果。
まったく同じ仕様のツイン サーバーが 3 台あります。この問題を示しているのはそのうちの 1 つだけです。サーバーはテスト段階にあり、実際のエンドユーザーはまだいません。この動作は、サーバーに負荷がかかり、負荷が高い場合にのみ見られますが. そして、これは重要です。サーバーを再起動すると、問題が解消され、限界に達するまで問題が解消され、その後、それらの症状が現れ始めます。
サーバーは、ASUS マザーボード、Intel Xeon i7 CPU、4x8GB Kingston RAM、SATA コントローラー Intel 8 シリーズ/C220、2x2TB Seagate ST2000DM (RAID-1 ソフトウェア) で、CentOS 6.4 64 ビットを実行しています。
私の経験から、これはハードウェアの潜在的な問題の明確な症状です。ただし、サーバーの所有者 (私はそれらのサーバーを借りているだけです) はメモリ テストを実行し、ハードウェア関連の問題を否定しました。サーバーは新品です。メモリ テストでは、メモリの問題は見られませんでした。
では、皆さんに質問です。どう思いますか?何が問題なのですか?過去に同様の問題がありましたか。
ありがとう。
(説明が長くてすみません)