ローカル ファイル システムから HDFS にデータを取り込むために webhdfs を使用しています。ここで、HDFS に取り込まれたファイルの整合性を確保したいと考えています。
転送されたファイルが破損/変更されていないことを確認するにはどうすればよいですか?
以下の webhdfs コマンドを使用して、ファイルのチェックサムを取得しました
curl -i -L --negotiate -u: -X GET "http://$hostname:$port/webhdfs/v1/user/path?op=GETFILECHECKSUM"
取り込まれたファイルの整合性を確保するには、上記のチェックサムをどのように使用すればよいですか? 提案してください
以下は私が従っている手順です
>md5sum locale_file
740c461879b484f4f5960aa4f67a145b
>hadoop fs -checksum locale_file
locale_file MD5-of-0MD5-of-512CRC32C 000002000000000000000000f4ec0c298cd6196ffdd8148ae536c9fe
ローカル システム上のファイルのチェックサムが、HDFS 上の同じファイルとは異なります。チェックサムを比較する必要があります。どうすればよいですか?