1

私はFestivalonEmacsの改善に取り組んでいます。文章を読むときは、フェスティバルをもっとうまくコントロールする必要があります。基本的に、私は2つのものが必要です。

  1. 読んでいる単語を表示します。
  2. 読み取られているものの速度(そしておそらくピッチ)を変更します。

理想的には、Festivalによって出力されるデータ構造があり、オフセット/長さ(通常は単語の開始/長さ)を出力WAVファイル(またはwavファイル内の場所)にリンクします。次に、mplayerのようなものを使用してプレイリストを作成し、次の単語がいつ再生されているか、その単語がバッファのどこにあるかを教えてくれます。

また、読み取られる速度を変更するための簡単なコマンドがあることを望んでいます。しかし、mplayerは私のためにそれを行うことができるので、私が#1を機能させることができれば、それは大したことではありません。

4

1 に答える 1

1

ここのマニュアル、特に「text2wave」スクリプトに関する部分を参照してください。これが別の実行可能ファイルなのか、呼び出す必要がある単なるスキーム スクリプトなのかは不明です。どちらの場合でも、これを行う方法について何らかのインスピレーションを与えるはずです。このコマンドにバッファ全体を送信すると、.wav ファイルが生成され、mplayer を介して制御できるように思えます。もちろん、これはどのセンテンスが現在再生されているか分からないことを意味するので、各センテンスを .wav ファイルとして出力し、それらを mplayer でキューに入れる (または mplayer を繰り返し呼び出す) ことができます。text2wave が実行可能ファイルである場合、Windows で利用できるかどうかはわかりませんが、Festival のスキーム スクリプトを使用して同じことを達成できるはずです。

編集: text2wave は確かにスクリプトですが、引数としてスクリプトを使用してフェスティバルを呼び出すように簡単に変更できるはずです (path/to/festival --script text2wave)。Windows バイナリにこれが含まれているかどうかはわかりませんが、メインの Festival サイトまたは *nix ディストリビューション (間違いなく Ubuntu にあります) から入手できるはずです。

于 2010-01-02T16:59:50.757 に答える