次元削減のための機能ハッシュについて少し読んでいます。均一な出力分布を持つハッシュ関数を使用することが重要であることを理解しています (入力が特定の値にマッピングされる可能性は、範囲内の他のすべての値と同じです)、雪崩/カスケード効果 (小さなインプットの変化はアウトプットの大きな変化を生み出す)。これらのプロパティにより、フィーチャ間の衝突が頻度に依存しないことが保証されます。ただし、雪崩効果が(具体的に)これにどのように影響するかについては、まだ不明です. ここでなぜ/どのように重要なのか誰か説明できますか? 出力の「大きな変化」を構成するものは何ですか?
参考文献: http://blog.someben.com/2013/01/hashing-lang/ http://metaoptimize.com/qa/questions/6943/what-is-the-hashing-trick#6945