6

Fraunhofer が特許を取得した mp3 コードは使用できないため、エンコーダーやデコーダー (ffmpeg、lame、MAD など) は使用できず、サイズが大きすぎます。

私はこれを Windows で行っていますが、DirectShow の IMediaDet は時間の経過とともに遅くなるようです。数百回呼び出すと、同じインターフェイス オブジェクトを再利用し、ファイル名を入力して期間を取得するだけでも、システムがクロールされます。

では、C/C++ で VBR ファイルを読み取って期間を取得できるコードはありますか?

C++ で CBR を実行するための別の投稿がここにありましたが、コードは大量の仮定を作成し、もちろん VBR では機能しません。

4

4 に答える 4

4

ほとんどの MP3 ファイルにはID3 ヘッダーがあります。それをデコードして期間を取得するのは難しくありません。

以下は、テクニックを説明する非常に基本的で醜いコードです。

#include <iostream>
#include <iomanip>

size_t GetMP3Duration(const std::string sFileName);

int main(int argc, char* argv[])
{
    try
    {
        size_t nLen = GetMP3Duration(argv[1]);
        if (nLen==0)
        {
            std::cout << "Not Found" << std::endl;
        }
        else
        {
            std::cout << nLen << " miliseconds" << std::endl;
            std::cout << nLen/60000 << ":";
            nLen %= 60000;
            std::cout << nLen/1000 << ".";
            std::cout << std::setw(3) << std::setfill('0') << nLen%1000 << std::endl;
        }
    }
    catch (std::exception &e)
    {
        std::cout << "Exception: " << e.what() << std::endl;
    }
    return 0;
}

#include <cstring>
#include <vector>
#include <iostream>
#include <fstream>
#include <cctype>
#include <cstdlib>

unsigned DecodeMP3SafeInt(unsigned nVal)
{
    // nVal has 4 bytes (8-bits each)
    //  - discard most significant bit from each byte
    //  - reverse byte order
    //  - concatenate the 4 * 7-bit nibbles into a 24-bit size.
    unsigned char *pValParts = reinterpret_cast<unsigned char *>(&nVal);
    return (pValParts[3] & 0x7F)         |
            ((pValParts[2] & 0x7F) << 7)  | 
            ((pValParts[1] & 0x7F) << 14) | 
            ((pValParts[0] & 0x7F) << 21);
}

#pragma pack(1)
struct MP3Hdr {
    char tag[3];
    unsigned char maj_ver;
    unsigned char min_ver;
    unsigned char flags;
    unsigned int  size;
};
struct MP3ExtHdr {
    unsigned int  size;
    unsigned char num_flag_bytes;
    unsigned char extended_flags;
};
struct MP3FrameHdr {
    char frame_id[4];
    unsigned size;
    unsigned char flags[2];
};
#pragma pack()

size_t GetMP3Duration(const std::string sFileName)
{
    std::ifstream fin(sFileName.c_str(), std::ifstream::binary);
    if (!fin) 
        throw std::invalid_argument("Cannot open file");

    // Read Header
    MP3Hdr hdr = { 0 };
    fin.read(reinterpret_cast<char *>(&hdr), sizeof(hdr));
    if (!fin.good())
        throw std::invalid_argument("Error reading file");

    if (0 != ::memcmp(hdr.tag, "ID3", 3))
        throw std::invalid_argument("Not an MP3 File");

    // Read extended header, if present
    if (0 != (hdr.flags&0x40))
    {
        fin.seekg(sizeof(MP3ExtHdr), std::ifstream::cur);
        if (!fin.good())
            throw std::invalid_argument("Error reading file");
    }

    // read a chunk of file.
    const size_t nDefaultSize(2048);
    std::vector<char> vBuff(nDefaultSize);
    fin.read(&vBuff[0], vBuff.size());
    size_t nSize = fin.gcount();
    if (!nSize)
        throw std::invalid_argument("Error reading file");
    vBuff.resize(nSize);

    size_t nUsed = 0;
    while (nSize-nUsed > sizeof(MP3FrameHdr))
    {
        MP3FrameHdr *pFrame = reinterpret_cast<MP3FrameHdr *>(&vBuff[nUsed]);
        nUsed += sizeof(MP3FrameHdr);
        size_t nDataLen = DecodeMP3SafeInt(pFrame->size);
        if (nDataLen > (nSize-nUsed))
            throw std::invalid_argument("Corrupt file");

        if (!::isupper(pFrame->flags[0])) // past end of tags
            return 0;

        if (0 == ::memcmp(pFrame->frame_id, "TLEN", 4))
        {
            // skip an int
            nUsed += sizeof(int);
            // data is next
            return atol(&vBuff[nUsed]);
        }
        else
        {
            nUsed += nDataLen;
        }
    }
    return 0;
}
于 2010-08-19T09:33:33.350 に答える
2

ジェフ、

唯一の有効な方法は、mp3 ファイル全体を調べ、その中のすべての mp3 フレームを見つけて、それらの合計時間を計算することです。

mp3 ファイルの主な特徴は、密度が異なる可能性があることと、その中に他のバイナリ データが多数含まれている可能性があることです。たとえば、読み取り時にデコーダーがスキップする ID3 タグ。

とにかく - ここで mp3 フレームのヘッダー情報を見てください:

http://www.mp3-converter.com/mp3codec/mp3_anatomy.htm

ヘッダーをヘッダーごとに正しく解析し、その期間を (サンプリング周波数から) 計算し、すべてのフレームの期間を合計するコードを作成してみてください。

フレームをデコードする必要はありません。フレームのヘッダーを使用するだけです。

LGPL を気にしない場合は、http: //sourceforge.net/projects/mpg123net/ を試してください。

于 2010-09-07T11:43:36.027 に答える
1

それを行うライブラリ、LGPL v3 を見つけました: http://www.codeproject.com/KB/audio-video/mpegaudioinfo.aspx

于 2010-08-17T18:18:30.880 に答える
-1

tagLibまたはid3libはどうですか?

それらはそれ自体がデコーダーではなく、トラック/アーティスト/アルバムや、必要なことを実行できるようにするその他の情報のホストを抽出するものです...

于 2010-08-17T18:28:40.307 に答える