1

できるだけ多くの既存のツールを使用するポッドキャスト トランスコーディング ツール/スクリプトの実装を検討しています。ツールとライブラリのどの組み合わせをお勧めしますか?

目的:

  1. オーディオ サブスクリプション (話し言葉のポッドキャスト) をより小さいサイズ (Ogg Vorbis と Speex) に自動変換し、複数のデバイス (Android フォンと Rockbox を搭載した iPod) と同期できるようにします。
  2. ピッチを維持するテンポ調整を伴うタイム クランチ ファイル (1.5x から 2.5x まで、少なくとも 0.1x の増分)。
  3. トランスコードされたファイルのすべてのメタ情報 (id3 と画像) を保持します。
  4. できれば、小さな移植可能な Unix/Linux ツールと互換性のあるライブラリ (Windows 上の Cygwin、または Wine 互換の呼び出しも可能) を使用します。
  5. 1 つのパスで同時のデコード/エンコードとタイム クランチは、計算時間を節約するためのボーナスです。

SoX は Speex をサポートしていません。引数として -speed を使用した MPlayer は、WAV へのデコードと速度調整の可能性があり、その後に ogg/speex 標準エンコーダーが続き、id3tool またはその他のメタ情報操作ツールで終了します。要件を満たす他の代替トランスコーディング パイプラインはありますか?

4

1 に答える 1

1

プログラムの作成に取り掛かる必要がある場合は、次のような開始点が適切です。

  • フォーマット変換とプロパティへのアクセスのためのlibsndfile
  • 時間圧縮/拡張のディラック
  • 入力のサンプルレートコンバーターの可能性があります

あなたの質問の問題の 1 つは、その入力形式とファイル属性がバインドされていないように見えることです。たとえば、一部の形式では領域を定義できますが、この場合はどのように処理すればよいでしょうか? その情報を省略しますか?そのままにしておきます (伸ばすと正しくなくなりますが) ? 倍率に基づいて領域を調整しますか? 後者が最適ですが、このレベルのサポートが必要な場合は、C または C++ に慣れる必要があるかもしれません。

于 2012-05-12T21:00:01.030 に答える