したがって、基本的には、テキスト ファイル内の 2 つの山かっこ内にある 4 桁のコードを具体的に探しています。テキスト ファイルを開いて 1 行ずつ解析する必要があることはわかっていますが、「ファイル内の行」をチェックした後でコードを構造化する最善の方法がわかりません。
どういうわけかそれを分割、削除、またはパーティション化できると思いますが、コンパイルを使用した正規表現も書いたので、それが一致オブジェクトを返す場合、それらの文字列ベースの操作でそれを使用できないと思います。また、正規表現が十分に貪欲であるかどうかもわかりません...
見つかったヒットのすべてのインスタンスをタプルまたはリスト内の文字列として保存したいと思います。
これが私の正規表現です:
regex = re.compile("(<(\d{4,5})>)?")
これまでのところかなり基本的なことを考えると、それほど多くのコードを含める必要はないと思います。