画像 1クラス トークン「$OOV_CLASS_ALPHA_SEQUENCE」を使用して文字起こしを行った結果
2019 年 22 月 22 日[ 2019 年 2 月 22 日]のAnonymosメモと呼ばれる父親の [ファイル]との電話会議
a n n o y m o u s
サポートされているクラス トークン
このページでは、 gbで英語の Speech-to-Text を使用した音声適応用にサポートされているクラス トークンを表示できます。
クラストークン 説明 話し言葉の例 記述例 $OOV_CLASS_ALPHANUMERIC_SEQUENCE 文字 [az] および/または数字のシーケンス。 「abc」
"一二三"
「a b c ワン ツー スリー」ABC
123
ABC123$OOV_CLASS_ALPHA_SEQUENCE 文字列 [az]。 「abc」
「cqbcf」
「hqqgwrmy o」ABC
CQBCF
HQQGWRMYO
画像 3句読点が認識されない
我々は請求状を見直し、被告のアポストロフィは前に応答する
この機会に。パラグラフを停止 問題は、どのように進めるかです疑問符 理論的にはコンマは精神科医から報告書を入手できると言いましたが、彼は評価を実施する必要があります. 泌尿器科の症状ブラケット それらは閉じたブラケットであり、ブラケットがある場合はどのブラケットに影響を与えるかを検討します
ディクテーションからの書き起こしの精度を向上させるのに 2 つの問題があります。上記の添付画像をご覧ください。
Class Token と Boost で Google Speech Adaptation Feature を使用しました。ただし、画像 1 と同様に、名前のスペルを入力すると、結果は単語としてではなく、個々の文字として表示されます。また、ディクテーションでは名前を綴る癖が多く、クラストークン「$OOV_CLASS_ALPHA_SEQUENCE」を使っても単語として表示されません。
もう一つの問題は句読点の問題です。書き取りでは、ストップ、コンマ、クエスチョンマーク、ブラケットのようにフォーマットを作成します。しかし、コードで自動句読点を有効にしましたが、それでも句読点は正しくなく、Image3 のように単語として表示されます。
これらの問題を改善する方法はありますか。それとも私は何かを逃していますか。もしそうなら、親切に私に方法を教えてもらえますか。事前にお時間をいただき、誠にありがとうございます。
ありがとうございました。