個人的なプロジェクトとして(Pythonをよりよく学ぶために)、私は重複ファイルリムーバーの作業を開始しました(特に、完全に重複した音楽コレクションを整理しようとして考えたので、.mp3ファイルの場合)。これで、ファイル名を照合し、類似度が0.7を超えるファイルのみを削除し、同じであるが完全に異なる名前のファイルにmd5合計を使用する方法について、かなり明確になりました(例:「メタリカ」 -他に何も重要ではありません」と「Track1」)。問題は、名前が異なり、互いに少し異なるファイルをどうすればよいかわからないことです。たとえば、「他に何も問題がない」と「Track1」は、「 Track1は、最後に2秒間無音になります。私の質問は:ファイル自体の類似性をチェックする何らかの方法やアルゴリズムはありますか?文字列照合のようなものですが、ファイル上にありますか?それが複雑なアルゴリズムであるかどうかは関係ありませんが、私はこれを学習するためだけに行っているので、難しいほど良いです:D
2 に答える
4
音楽の指紋を計算するChromaprintを使用できます。同様の音楽ファイルを見つけることができるはずです。
これをさらに推し進めたい場合は、musicbrainzのAPIを使用して、曲に関する正確な情報を見つけることができます。
これらのライブラリは、私が使用する2つの優れた音楽ライブラリのタグ付けおよび並べ替えアプリケーションで使用されます。picardとbeetsです。
于 2012-05-31T13:35:12.507 に答える
0
また、win32モジュールを見ることができます。ここにリンクがあります
于 2012-05-31T15:30:12.680 に答える