私はメディア ファイルのコレクションを持っていますが、ほとんどが音楽で、そのほとんどは何年も前に CD からインポートされたものです。このコレクションは、さまざまなメディア プレーヤー、さまざまなファイル システム、さまざまなコンピューターなどの間で何度も転送されてきました。その過程で、いくつかのトラックが誤って複製されました。また、これらのメタデータをキュレートし、すべてを適切にタグ付けするよう常に努めています。その多くが最初にインポートされたとき、私は派手なメディア再生ソフトウェアを持っておらず、ID3 タグがすべてが「クラシック アルバム「Album」のトラック %d」。
これにより、一部のファイルには最新のメタデータが含まれているものの、削除したい同じメディア ファイルの "重複" があり、そのメタデータが適切に更新されていないという状況が発生します。メタデータはファイル内に存在するため、これらのファイルの内容は異なり、liten2などのツールは機能しません。
私の質問は次のとおりです。メタデータを無視して、ファイルのメディア コンテンツのみの一意に識別されるフィンガープリント (おそらく何らかの暗号化ハッシュですが、それは難しい要件ではありません) を便利に抽出するライブラリはありますか? もしそうなら、私はそれをどのように使用しますか?