私は、言語をアルファベット順に教えるために、非識字者のためにPHPでWebサイトを開発しています。最後に、学習者が表示されたアルファベットをマイクで声に出して話さなければならない評価フェーズを作成します。学習者が単語を発音するとき、私はそれを保存されたアルファベットの発音と比較したいと思います。
PHPと音声比較することはできますか?
私は、言語をアルファベット順に教えるために、非識字者のためにPHPでWebサイトを開発しています。最後に、学習者が表示されたアルファベットをマイクで声に出して話さなければならない評価フェーズを作成します。学習者が単語を発音するとき、私はそれを保存されたアルファベットの発音と比較したいと思います。
PHPと音声比較することはできますか?
はい、可能です。ここにあなたが始めるための少しの研究とリソースがあります。あなたはあなたのためにあなたの仕事を切り取っているようです。
PHP Voice(旧称PHP VXML)には、PHPを使用した音声アプリケーションの開発を支援する4つのクラスが含まれています。これは、Speech Synthesis Markup Language 1.0、Speech Recognition Grammar Specification 1.0、Voice Browser Call Control:CCXML 1.0、およびVoice Extensible Markup Language(VoiceXML)2.0をサポートします。
簡単に言うと、これは同じ古いPHPであり、音声アプリケーションを作成できるようになりました。
これはPHPの拡張ではありません。実際、これは同じPHPであり、テキストの代わりに音声を出力し、テキストの代わりに音声として入力を受け取ります。技術用語では、標準のテキストベースの入力と出力(プログラマーの用語ではstdio、stdout)が同等の音声に置き換えられているのはPHPです。
AQuAは、音声品質の観点から知覚音声品質テストと音声ファイル比較を提供するためのシンプルで強力なツールです。これは、2つのオーディオファイルを比較し、元のファイルと劣化したファイルの音声品質をテストする最も簡単な方法です。
ウィキペディアから:ボコーダーは分析/合成システムであり、人間の音声を再現するために使用されます。エンコーダーでは、入力はマルチバンドフィルターを通過し、各バンドはエンベロープフォロワーを通過し、エンベロープフォロワーからの制御信号はデコーダーに伝達されます。デコーダーは、これらの(振幅)制御信号をシンセサイザーの対応するフィルターに適用します。制御信号は元の音声波形に比べてゆっくりしか変化しないため、音声の送信に必要な帯域幅を減らすことができます。これにより、より多くの音声チャネルが無線回線または海底ケーブルを共有できるようになります。制御信号をエンコードすることにより、音声伝送を傍受から保護することができます。
MASLEプロジェクトは、インターネットを介して話された言語を評価するための一連のツールを作成することを目的としています。この評価は、自動音声認識ソフトウェアと人間の評価者によって実行されます。
NanoGongは、誰かがWebページで自分の声を録音、再生、保存するために使用できるアプレットです。録音を再生すると、ユーザーはサウンドを変更せずにスピードアップまたはスローダウンできます。アプレットは、Webページ上で、またはMoodleの統合コンポーネントとして使用できます。
確かに可能ですが、考慮すべき点がたくさんあります。
この種のものは、複雑なクライアント側とサーバー側のコードがたくさんある、非常に長くて難しいワークフローになるでしょう。あまりぶっきらぼうに言いたくないのですが、「できますか?」と聞かれたら、できないかもしれません。私自身、私よりも経験豊富な人に相談しないと、おそらくこのようなことを試みることはなかったでしょう. 大規模なクライアント側およびサーバー側システムで少なくとも数年の経験がある人が必要です。
ああ、これは単なる個人的な好みかもしれませんが、私は PHP よりも Java EE サーバーを使用してこのようなことをしたいと思っています。小さくて簡単なサーバー側のものには PHP を好みます。