AppleScript スクリプト エディタの場合:
set diphones to {"Dah", "Di", "Du", "Beh", "Bi", "Burr"} --etc.
set targetFolder to ((choose folder) as text)
repeat with p in diphones
say p using "Vicki" pitch 55 modulation 0 saving to (targetFolder & p & ".aif")
end repeat
次に、ファイルを WAV に変換します。
"say" コマンド ディクショナリには、他にもいくつかのオプションがあります。
しかし、それはそれほど単純ではないと思います。スピーチ シンセがこれらのダイフォンをどのように扱うかは奇妙であり、使用する声によって異なることさえあります。思い通りのサウンドになるように、かなりの数を操作する必要がある場合があります。たとえば、Vicki は「ディ」を「DEE」のように言い、「バイ」を「BYE」のように言います。これらの声に短い「i」(「big」のように) を単にディフォンとしてイントーンさせるのは非常に困難です。「大きい」(たとえば) と表示してから、Audacity でサウンドを編集し、編集したバージョンの最後を切り取り、フェードアウトしてからエクスポートする必要がある場合もあります。私はこれをやっただけで動作しますが、ええ、いくつかの特別なケースの調整を行う必要があります. 開発者ツールをお持ちの場合は、音声テキストを「調整」できる「Repeat After Me」というアプリもあります。しかし(驚くべきことに)今説明した状況では、それは役に立ちません。(ただし、大きなチャンクではかなり強力です)。
[編集]そうです、上記の音声入力バージョンは次のようになります。
set diphones to {"dAO", "dIH", "dAX", "bEH", "bIH", "brr"} --etc., changed to be phonetic based on Apple's system
set targetFolder to ((choose folder) as text)
repeat with p in diphones
say ("[[inpt PHON]]" & p & "[[inpt TEXT]]") using "Vicki" pitch 52 modulation 0 saving to (targetFolder & p & ".aif")
end repeat
【追記】
数年前、Apple の声はすべて同じように機能し、どんな声でも曲を完璧に歌うように調整できました (私はある夜、「星条旗」を歌いました)。その後、何らかの理由で、開発者は声を変更しただけでなく、一貫性を取り除いて、一部の声が他の声とはまったく異なる動作をするようにしました。私はこれに満足していませんでした。次の点を考慮してください。
デフォルトの音声 (「アレックス」) を使用すると、次の発話は (検索することをお勧めします) 可能な限り:
say "[[inpt TUNE]] d {D 114; P 95.0:100} UW {D 227; P 95.0:100} 1IY {D 382; P 95.0:100} . {D 30} [[inpt TEXT]]" using "Alex"
しかし、「チェロ」や「パイプオルガン」を使うと、このTUNEモードを使っていても、最後に奇妙なリフトが得られます。理由を聞かないでください。では、少なくとも「アレックス」については、どうやってこれを機能させたのでしょうか。前述の「Repeat After Me」アプリを使用して、「調整された」出力を簡素化しました。TUNE と PHON のいくつかのバリエーションを使用して、おそらく必要なものを取得できると思います。ただし、「Cellos」や「Pipe Organ」は、単調なイントネーションを作成するのに問題があるため、近づかないようにする必要があります (ただし、特定のダイフォン/トライフォンでは問題ない場合があります)。そして、おそらく両方を使用する必要があるかもしれませんが、これは面倒です。あなたの痛みが分かります。
もう1つのバリエーション。次の「rate」タグがより長い発話を強制する方法に注意してください。
say "[[rate - 66]] [[inpt TUNE]] d {D 114; P 95.0:100} UW {D 227; P 95.0:100} 1IY {D 382; P 95.0:100} . {D 30} [[inpt TEXT]]" using "Alex"
[補遺 II]
あ、でもこれ見てください。これにより、「パイプオルガン」が均等になります。最後の音素の前にピッチ変調 (「pbas」) を強制することで、エンド リフトを取り除きます。
say "[[rate - 66]] [[inpt TUNE]] d {D 114; P 95.0:100} UW {D 227; P 95.0:100} [[pbas - 5]] 1IY {D 382; P 95.0:100} . {D 30} [[inpt TEXT]]" using "Pipe Organ"
彼らは私たちをここで一生懸命働かせています:-)
これは単純化されたバージョンで、元に戻りますが、その pbas をそこに貼り付けます。
say "[[inpt TUNE]] d UW [[pbas - 5]] 1IY [[inpt TEXT]]" using "Pipe Organ"