SILKを含む VoIP 通話の pcap があります。Wireshark で RTP ペイロードを確認できます。RTP ヘッダーから、サンプル レート (例: 24 KHz) とフレーム サイズ (例: 20 ms) を理解できます。私がやりたいのは、RTP ペイロードを抽出し、SILK でエンコードされたオーディオを含むファイルを生成することです。RTPペイロード形式の説明から、ファイルに保存する場合、サンプルレートとブロックサイズを指定するために、オーディオの各ブロックにブロックヘッダーが必要であることがわかります(ブロックサイズは可変であり、フレームごとに異なる可能性があるため) )。
正しいファイル ヘッダー (「マジック ナンバー」) を持つファイルを生成し、オーディオの各ブロックにブロック ヘッダーを追加するにはどうすればよいですか?
いくつかの異なるプログラミング言語を使用できるので、主に必要なアルゴリズムに関心がありますが、コードの実装 (または既存のツール) への参照を歓迎します。