tcp - tcp チェックサムとしてのアプリケーションレベルのチェックサムが弱すぎる可能性がありますか?

Question

この論文 ( CRC と TCP チェックサムが一致しない場合) は、TCP チェックサムアルゴリズムがかなり弱いため、TCP を使用する 1600 万から 100 億パケットごとに検出されないエラーが発生することを示唆しています。

アプリケーションレベルでチェックサムを追加することによって、この種のエラーからデータを保護するアプリケーション開発者はいますか?

EJB リモートメソッド呼び出し (Java EE 5) の実行中に、このようなエラーから保護するために使用できるパターンはありますか? または、Java はすでにシリアル化されたオブジェクトを自動的にチェックサムしますか (さらに、基礎となるネットワークプロトコルに加えて)?

エンタープライズソフトウェアは、メモリ ECC だけでなく、レジスタなど (SPARC など) で CPU 内のエラーチェックを実行するコンピューター上で実行されています。ストレージシステム (ハードドライブ、ケーブルなど) でのビットエラーは、Solaris ZFS を使用することで防ぐことができます。

その記事を見るまでは、TCP によるネットワークビットエラーを恐れたことはありませんでした。

一部の非常に少数のクライアントサーバーリモートインターフェースに対してアプリケーションレベルのチェックサムを実装するのは、それほど大変な作業ではないかもしれません。しかし、単一のデータセンター内の多数のマシンで実行される分散エンタープライズソフトウェアはどうでしょうか。非常に膨大な数のリモートインターフェイスが存在する可能性があります。

SAP、Oracle などのすべてのエンタープライズソフトウェアベンダーは、この種の問題を無視しているのでしょうか? 銀行はどうですか？証券取引所のソフトウェアはどうですか？

フォローアップ:たくさんの回答ありがとうございました! そのため、検出されないネットワークデータの破損をチェックすることはほとんどないように思われますが、それらは存在するようです。

MD5 または SHA1 を使用するように構成された TLS で RMI over TLS を使用するように Java EE アプリケーションサーバー (または EJB デプロイメント記述子) を構成し、同じことを行うように Java SE クライアントを構成するだけで、この問題を解決できませんでしたか? これは、アプリケーションレベルでこれを実装する必要がないように、信頼できる透過的なチェックサムを取得する方法でしょうか (やり過ぎではありますが)? それとも、ネットワークスタックに関して完全に混乱していますか?

score 2 · Accepted Answer

データの整合性を気にするすべてのアプリケーションは、安全なハッシュを使用する必要があると確信しています。ただし、ほとんどはそうではありません。人々は単に問題を無視します。

私は何年にもわたって頻繁にデータの破損を目にしてきましたが (チェックサムによるものであっても)、実際に最も記憶に残っているのは株式取引システムに関するものでした。不良ルーターがデータを破損していたため、通常は TCP チェックサムを通過していました。同じビットをオフとオンに切り替えていました。そしてもちろん、実際に TCP チェックサムに失敗したパケットについて警告を受けることはありません。アプリケーションには、データの整合性に関する追加のチェックはありませんでした。

メッセージは、株式注文や取引のようなものでした。データの破損の結果は、聞こえるほど深刻です。

幸いなことに、破損によりメッセージが無効になり、取引システムが完全にクラッシュしました。一部のビジネスを失った場合の結果は、偽の取引を実行した場合の潜在的な結果ほど深刻ではありませんでした。

この問題は幸運にも特定されました。関係する 2 つのサーバー間の SSH セッションが奇妙なエラーメッセージで失敗しました。明らかに、SSH はデータの整合性を確保する必要があります。

この事件の後、同社は飛行中または保管中のデータ破損のリスクを軽減するために何もしませんでした. 同じコードが本番環境に残っており、実際、周囲の環境がデータを破損しないことを前提とした追加のコードが本番環境に移行しています。

これは実際、関係者全員にとって正しい決定です。システムの他の部分 (不良メモリ、不良ハードドライブコントローラ、不良ルーターなど) によって引き起こされた問題を防止する開発者は、何も得られない可能性があります。余分なコードにより、バグが追加されたり、実際には関係のないバグのせいにされたりするリスクが生じます。後で問題が発生した場合、それは他の誰かのせいになります。

管理者にとっては、セキュリティに時間を費やすようなものです。インシデントの可能性は低いですが、「無駄な」努力が目に見えます。たとえば、エンドツーエンドのデータ整合性チェックが、既にここで説明した時期尚早の最適化と比較されていることに注目してください。

その論文が書かれてからの変化について言えば、変化したのは、データレートが向上し、システムがより複雑になり、暗号化ハッシュのコストを削減するために CPU が高速になったことだけです。破損の可能性が高くなり、それを防止するためのコストが削減されます。

本当の問題は、問題を検出/防止するか、無視することが環境内で優れているかどうかです。問題を検出すると、それがあなたの責任になる可能性があることを忘れないでください。また、経営陣が認識していない問題を防ぐために時間を費やすと、時間を無駄にしているように見える可能性があります。

score 2 · Accepted Answer

私は IB のトレーディングシステムに取り組んできましたが、余分なチェックサムが行われていないことを保証できます。ほとんどのアプリはネイキッドソケットを使用しています。金融セクターにおける現在の問題を考えると、TCP/IP チェックサムの不良は心配する必要がないと思います。

score 1 · Accepted Answer

ええと、その紙は2000年のものなので、かなり前のことです（男、私は年をとっています）、そしてかなり限られた痕跡のセットにあります。だから彼らの姿を巨大な塩の粒で取ってください。そうは言っても、これがまだ当てはまるかどうかを確認するのは興味深いでしょう。ただし、ハードウェアの障害など、いくつかのクラスのエラーがまだ存在している可能性はありますが、状況は変わったと思います。

追加のアプリケーションレベルの保証が本当に必要な場合は、チェックサムよりも便利なのは、データのSHA-Nハッシュ、またはMD5などです。

tcp - tcp チェックサムとしてのアプリケーション レベルのチェックサムが弱すぎる可能性がありますか?

3 に答える 3

Related

Reference

tcp - tcp チェックサムとしてのアプリケーションレベルのチェックサムが弱すぎる可能性がありますか?