私はPortAudioと自然言語処理を使って実験を行ってきましたが、この2つを組み合わせる方法があるかどうか疑問に思っています。私が欲しいのは、ビデオからオーディオを取得し(ビデオ形式は最も簡単なものであれば何でもかまいません)、再生時にテキストに解析できるサービスです。これはAndroidにとってはかなり簡単なことですが、コンピューターまたはラップトップで、可能であればリアルタイムで機能させたいと思います。ビデオのサウンドカードでスピーチを再生すると、マッピングはすでに決定されていますが、最初の部分の実装方法に少し迷っています。Dragonについては知っていますが、実際の音声からテキストの解析には、独自仕様ではないものを使用したいと思います。パーサーは完璧である必要はありません。スペルミスや不規則な単語形式に対処できます。何かご意見は?