Web からオーディオ ファイルをダウンロードし、ダウンロード プロセスに問題が発生した場合、Python でオーディオ ファイルが不完全であることを効率的に検出するにはどうすればよいですか?
linux でコマンドを使用するfile
など、いくつかのアイデアがあります。
file audio.mp4
しかし、それは mp4 であることを認識します。
audio.mp4: ISO Media, MPEG v4 system, version 2
mplayer でさえ mp4 オーディオ タイプを検出しますが、再生しようとすると失敗します。ただし、mplayerfrom python を起動して失敗したかどうかを確認することは、スケーラブルなソリューションではないと思います。
壊れたファイルのサンプルは次のとおりです: https://www.dropbox.com/s/5rpscb9r1xrrx4t/They
上記のサンプルは、mutagen と mp4file で失敗し、無期限にハングします。それは fileObject.tell() と関係があります。