3

私はプログラマー/開発者ではなく、マルチメディア デザイナーであるという事実から始めたいと思います。テキスト読み上げを使用して、公式のオーディオ ナレーションを録音する前に、アニメーションのタイミングを合わせるために使用できるプレースホルダー オーディオ ファイルを生成します。

以前は Amazon Polly を使用していましたが、Google Cloud を試してみたかったのです。ただし、mp3 ファイルを生成して保存する方法を実際に理解するのに最も苦労しています。

Amazon Polly を使用すると、ウェブサイトにアクセスしてフィールドにテキストを入力し、ボタンをクリックするだけで、ファイルが mp3 ファイルとして保存されます。Google Cloud では、それよりもはるかに複雑に思えます。「クイック スタート」ガイドでは、API の有効化、JSON ファイルのダウンロード、環境資格情報の設定、SDK の初期化、およびコマンド プロンプトへのコードの入力について説明しています。

ドキュメンテーションページで読んだガイドのすべてが、私が単に理解していないステップに必然的につながるようです。私は完全な道化師のように聞こえるのは嫌いですが、これは私の頭を少し超えているようです. ソフトウェアを作成したり、機械学習を Web サイトに統合したりするつもりはありません。数行のテキストを入力して mp3 ファイルを生成したいだけです。

Google Cloud でそれを行う方法はありますか? 起動ページ ( https://cloud.google.com/text-to-speech/ ) はまさに私が望むものを提供しますが、ファイルをダウンロードするオプションはなく、プレビューするだけです。

この初心者に提供できるヘルプを前もって感謝します。

4

3 に答える 3

0

Google Wavenet の音声が最高のようですが、Google は Microsoft が提供するようなスムーズな Speech Studio を提供していません。ここで LITE バージョンを試してみてください: https://speech.microsoft.com/audiocontentcreation

于 2021-04-02T09:56:05.250 に答える