audio - Google Cloud Text-to-Speech インターフェースの混乱 (mp3 ファイルをダウンロードするにはどうすればよいですか?)

Question

私はプログラマー/開発者ではなく、マルチメディアデザイナーであるという事実から始めたいと思います。テキスト読み上げを使用して、公式のオーディオナレーションを録音する前に、アニメーションのタイミングを合わせるために使用できるプレースホルダーオーディオファイルを生成します。

以前は Amazon Polly を使用していましたが、Google Cloud を試してみたかったのです。ただし、mp3 ファイルを生成して保存する方法を実際に理解するのに最も苦労しています。

Amazon Polly を使用すると、ウェブサイトにアクセスしてフィールドにテキストを入力し、ボタンをクリックするだけで、ファイルが mp3 ファイルとして保存されます。Google Cloud では、それよりもはるかに複雑に思えます。「クイックスタート」ガイドでは、API の有効化、JSON ファイルのダウンロード、環境資格情報の設定、SDK の初期化、およびコマンドプロンプトへのコードの入力について説明しています。

ドキュメンテーションページで読んだガイドのすべてが、私が単に理解していないステップに必然的につながるようです。私は完全な道化師のように聞こえるのは嫌いですが、これは私の頭を少し超えているようです. ソフトウェアを作成したり、機械学習を Web サイトに統合したりするつもりはありません。数行のテキストを入力して mp3 ファイルを生成したいだけです。

Google Cloud でそれを行う方法はありますか? 起動ページ ( https://cloud.google.com/text-to-speech/ ) はまさに私が望むものを提供しますが、ファイルをダウンロードするオプションはなく、プレビューするだけです。

この初心者に提供できるヘルプを前もって感謝します。

score 0 · Accepted Answer

Google Wavenet の音声が最高のようですが、Google は Microsoft が提供するようなスムーズな Speech Studio を提供していません。ここで LITE バージョンを試してみてください: https://speech.microsoft.com/audiocontentcreation

audio - Google Cloud Text-to-Speech インターフェースの混乱 (mp3 ファイルをダウンロードするにはどうすればよいですか?)

3 に答える 3

Related

Reference