機械学習用のデータセットを含む Python クラスのハッシュを計算したいと考えています。ハッシュはキャッシングに使うものなので、md5
やを考えていsha1
ました。問題は、ほとんどのデータが NumPy 配列に格納されていることです。__hash__()
これらはメンバーを提供しません。現在pickle.dumps()
、各メンバーに対して実行し、これらの文字列に基づいてハッシュを計算しています。ただし、同じオブジェクトが異なるシリアル化文字列につながる可能性があることを示す次のリンクを見つけました。
Numpy 配列を含む Python クラスのハッシュを計算する最良の方法は何でしょうか?