現在、ドラゴンを使用して、IVR 監視システムで電話の文字起こしを実行しています。基本的に私はドラゴンでフォルダを監視し、そこにwavファイルをドロップし、別のフォルダでトランスクリプション出力を待ちます. このようなソリューションは、ドラゴンのクラッシュにより、最近かなりの頭痛の種になっています。
オンデマンドでトランスクリプションを実行する単純な実行可能ファイルが必要です (したがって、永続的に実行されている sw の必要性を排除します)、次のようなものです。
cmd -> 転記 in.wav > out.txt
ソフトウェアにはイタリア語の辞書と音響モデルが用意されているか、少なくともイタリア語をサポートするために簡単にトレーニングできる必要があります。オフィススイートなしでwindowx xp組み込み(かなり古いバージョン!)で実行する必要があるため、windows音声エンジンはオプションではありません。
lib/dll と vbscript または python で使用するコード スニペットも同様に使用できますか?