問題タブ [google-speech-to-text-api]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
451 参照

flutter - FlutterのSpeech to Text APIでuriの代わりにローカルオーディオファイルを使用するには?

googleapisパッケージの Google Speech To Text API を使用しています。しかし、RecognizeRequest.fromJson の送信中にアプリケーション アセット フォルダーにあるローカル オーディオ ファイルをオーディオ データとして使用する方法を説明するドキュメント (ダーツとフラッター用) は見つかりませんでした。コードで _json のオーディオ コンテンツの代わりにローカル ファイルを使用する方法を知りたいです。前もって感謝します。

0 投票する
0 に答える
99 参照

google-speech-api - Google Speech to Text API で句読点とクラス トークンの精度を向上させる方法

画像 1クラス トークン「$OOV_CLASS_ALPHA_SEQUENCE」を使用して文字起こしを行った結果

2019 年 22 月 22 日[ 2019 年 2 月 22 日]Anonymosメモと呼ばれる父親の [ファイル]との電話会議 a n n o y m o u s

画像 2サポートされている Google クラス トークン

サポートされているクラス トークン

このページでは、 gbで英語の Speech-to-Text を使用した音声適応用にサポートされているクラス トークンを表示できます。

クラストークン 説明 話し言葉の例 記述例
$OOV_CLASS_ALPHANUMERIC_SEQUENCE 文字 [az] および/または数字のシーケンス。 「abc」
"一二三"
「a b c ワン ツー スリー」
ABC
123
ABC123
$OOV_CLASS_ALPHA_SEQUENCE 文字列 [az]。 「abc」
「cqbcf」
「hqqgwrmy o」
ABC
CQBCF
HQQGWRMYO

画像 3句読点が認識されない

我々は請求状を見直し、被告のアポストロフィは前に応答する

この機会に。パラグラフを停止 問題は、どのように進めるかです疑問符 理論的にはコンマは精神科医から報告書を入手できると言いましたが、彼は評価を実施する必要があります. 泌尿器科の症状ブラケット それらは閉じたブラケットであり、ブラケットがある場合はどのブラケットに影響を与えるかを検討します

ディクテーションからの書き起こしの精度を向上させるのに 2 つの問題があります。上記の添付画像をご覧ください。

  1. Class Token と Boost で Google Speech Adaptation Feature を使用しました。ただし、画像 1 と同様に、名前のスペルを入力すると、結果は単語としてではなく、個々の文字として表示されます。また、ディクテーションでは名前を綴る癖が多く、クラストークン「$OOV_CLASS_ALPHA_SEQUENCE」を使っても単語として表示されません。

  2. もう一つの問題は句読点の問題です。書き取りでは、ストップ、コンマ、クエスチョンマーク、ブラケットのようにフォーマットを作成します。しかし、コードで自動句読点を有効にしましたが、それでも句読点は正しくなく、Image3 のように単語として表示されます

これらの問題を改善する方法はありますか。それとも私は何かを逃していますか。もしそうなら、親切に私に方法を教えてもらえますか。事前にお時間をいただき、誠にありがとうございます。

ありがとうございました。