これを解決できないことに少し不満を感じていますが、不明な量の単語 (いくつかのスペース、いくつかの数字、いくつかのアンダースコア) を選択する正規表現を定義したいと考えています。
「不明な量の単語」と言うとき、それがより現実的であれば、喜んで 10 に制限します。基本的に私はファイル名をスキャンしており、10 語を超えているとは思いませんが、制限を設定する必要がないのは良いことです。
私がこれまでに持っている最高のものは次のとおりです。
tc = re.findall(r'FROM CLIP NAME:\s\s(\w*\s*\w*\s*\w*\s*\w*\s*\w*\s*\w*\s*\w*\s*\w*\s*\w*\s*\w*)', text)
'FROM CLIP NAME:\s\s' は各行の先頭になります。
\s は改行とスペースを読み取り、次の行からデータを取得するため、上記の私の試みは完全に失敗しました。