私は巨大なファイルを持っています。それは、約2日間連続して、過度の長さの転写されたスピーチで構成されています。10万語以上だと思います。
音声文字変換中に、スピーカーとセッションを「<-名前->」マークで別々のブロックに分けました。私の問題は、name_speach.txtの命名規則でそれらをファイルに自動的に処理することは可能ですか?
ありがとう!!!!
テストケース:
テストケース
<--测试0-->
这个是一段测试内容,a quick fox jumps over a lazy dog.
<——测试1——>
,a quick fox just over 啊 辣子 dog!!?是吗?
<——测试2——>
这是一段测试用的text,嗯!
<--Test case 3-->
/* sound track lost @153:12.236 -- 153.18.222 */
…
A quick fox jumps over a {lazy|lame} dog.