おそらくRubyでスクリプトを作成する必要があります。このスクリプトは、1ブロックのテキストを取得し、そのテキストの録音の多数の文字起こしを元のテキストと比較して、正確性を確認します。それが完全に混乱している場合は、別の方法で説明してみます...
数文の長さの台本を読んでいる何人かの異なる人々の録音があります。これらの録音はすべて、他の人によって何度もテキストに書き戻されています。私はすべての文字起こし(数百)を取り、それらを元のスクリプトと比較して正確にする必要があります。
擬似コードを概念化することすら問題があり、誰かが私を正しい方向に向けることができるかどうか疑問に思っています。検討すべき確立されたアルゴリズムはありますか?レーベンシュタイン距離が提案されましたが、句読点の選択や空白などの違いを考慮すると、これは長い文字列にはうまく対応できないようです。最初の単語が欠落していると、たとえ1つおきの単語であっても、アルゴリズム全体が破壊されます。完璧だった。私は何にでもオープンです-ありがとう!
編集:
ヒントをありがとう、psyho。ただし、私の最大の懸念事項の1つは、次のような状況です。
元のテキスト:
I would've taken that course if I'd known it was available!
転写
I would have taken that course if I'd known it was available!
Even with a word-wise comparison of tokens, this transcription will be marked as quite errant, even though it's almost perfect, and this is hardly an edge-case! "would've" and "would have" are commonly pronounced extremely similarly, especially in this part of the world. Is there a way to make the approach you suggest robust enough to deal with this? I've thought about running a word-wise comparison both forward and backward and building a sort of composite score, but this would fall apart with a transcription like this:
I would have taken that course if I had known it was available!
Any ideas?