これは純粋なプログラミングの質問です。私は単語の配列を持っています。単語の後には、さまざまな長さ (ほとんどゼロ) の休止があります。各単語には確実性スコアもあります。先読みウィンドウから単語の最適なスパンを選択したい。
- 全体的な確実性が低いほど良い (または、確実性の 33 パーセンタイルが低いほど良い)。
- エッジでの一時停止が長ければ長いほど、より良い結果が得られます (厳密な最小値を使用)。
- 最適な長さ (5 秒など) があります。それに近いほど良いです。最小長と最大長には厳しい制限があります。
べね、これは JavaScript で書いているので、サポート ベクター マシンなどを使う余裕はありません。:-) パフォーマンスについては、2 分間の長さ (250 ワード程度) のウィンドウで 1 分ごとに計算されます。
興味のある方への 2 番目の注意事項: これは、自動音声認識によって生成された単語のスパンを選択して、手動で書き起こします (アクティブ ラーニング)。
これにどのようにアプローチしますか?