4

以下に示すように、ターゲット言語のテキストスクリプトがあるさまざまな言語に吹き替える必要があるスクリーンキャストがいくつかあります。

開始時間の音声ナレーション

0:0 何とかnao lorep iposm...

1:20 xao dok dkjv dwv....

..

上記の各ユニットを個別に記録し、上記のスクリプトで説明したように、適切な開始時間に合わせます。

例:

入力:

N タイミング値を入力します: 0:0,1:20 ... 次に、N オーディオ録音を入力します

出力:

上記のタイミングに合わせたオーディオ録音。オーバーフローはシステムによって個別に検出される必要がありますが、アンダーフローは無音で埋められます。

提供された時間に基づいてこれらのオーディオユニットを調整できるようにする、プラットフォームに依存しないオーディオ API \ ソフトウェアまたはコードスニペットができれば python にありますか?

4

1 に答える 1

1

入力オーディオ ファイルが圧縮されていない場合 (つまり、WAV ファイルなど)、私が好んで使用するオーディオ ライブラリは libsndfile です。ここに python ラッパーがあるようです: https://code.google.com/p/libsndfile-python/。それを念頭に置いて、残りは次のように達成できます。

出力オーディオ ストリームを開き、libsndfile でオーディオ データを書き込む

入力オーディオ ファイルごとに、libsndfile で入力ストリームを開きます

テキスト記述「スクリプト」に基づいて、指定されたオーディオ ファイルのメタデータ情報を抽出します。

マスター出力ストリームに必要な無音を書き込み、入力ストリームから出力ストリームにデータを書き込みます。現在の位置/時間に注意してください。入力オーディオ ファイルごとにこの手順を繰り返し、オーディオ クリップのターゲット開始時間が常に >= 前述の現在の位置/時間であることを確認します。そうでない場合は、重複があります。

もちろん、サンプルレートのマッチングなどについて心配する必要がありますが、始めるにはそれで十分です。また、単一の出力ファイルを作成しようとしているのか、入力ファイルごとに 1 つ作成しようとしているのか正確にはわかりませんが、この回答は十分に調整できるはずです。libsndfile は、入力ファイル形式をサポートしていると仮定して、必要なすべての情報 (クリップの長さなど) を提供します。

于 2013-04-22T15:29:16.117 に答える