Javascript を使用して音声の録音を書き起こすツールに取り組んでいます。audio
基本的に、キー イベントをフックして、タグで読み込まれたファイルを再生、一時停止、およびループします。
このようなことを行うための高度な既存のデスクトップ アプリが多数あります ( Transcriberなど -スクリーンショットはこちら)。ほとんどの文字起こしツールには、音声ファイル内をジャンプするために使用できる波形が組み込まれています。これは、文字起こし者がフレーズを視覚的に見つけて繰り返しまたはループすることを学習できるため、非常に役立ちます。
Javascript を使用して、ブラウザでこの機能のサブセットをエミュレートできるかどうか疑問に思っています。私は信号処理についてあまり知りません。おそらくそれは実現可能でさえありません。
しかし、私が思い描いているのは、Javascript がファイルからサウンド ストリームを読み取り、振幅を定期的にサンプリングすることです。振幅が特定の時間のしきい値よりも長く非常に低い場合、それはフレーズ ブレークとしてラベル付けされます。
このようなラベリングは、転写に非常に役立つと思います。次に、キー コマンドを設定して、前の沈黙の期間にジャンプすることができました。仮説として(jQueryベースのAPIを想像して):
var audio = $('audio#someid');
var silences = silenceFindingVoodoo(audio);
silences
silence
には時間のリストが含まれているため、ユーザーがさまざまなsをジャンプできるように何らかの方法で接続しcurrentTime
、 を選択した値に設定して再生することができます。
Javascriptでこの種のことを行うことさえ考えられますか?