ファイルの形式を編集しようとしていますが、次のようになります。
>クラスター 0
L07510
>クラスター 1
AF480591
AY457083
>クラスター 2
M88154
>クラスター 3
CP000924
L09161
>クラスター 4
AY742307
>クラスター 5
L09163
L09162
>クラスター 6
AF321086
>クラスター 7
DQ666175
>クラスター 8
DQ288 DQ288
各行を通過し、">Cluster x" (x は数値) という行で停止し、その数値を後続の行に追加する何かを Python で記述したいと考えています。その後、新しい ">Cluster x" に到達すると、新しい x 値で再び開始されます。
したがって、次のようになります。
>クラスター0
0 L07510
>クラスター1
1 AF480591
1 AY457083 > クラスター
2 2
M88154 >
クラスター3 3
CP000924
3 L09161 >
クラスター 4
4 AY742307 DQ288691
を使用して(正規表現は次のようになりますか? ) をregex
検索し、この一致した正規表現に続く各行をプログラムに追加させることができると考えていました。これを実際に書く方法がわかりません。どんな助けでも大歓迎です!">Cluster x"
('\>Cluster \d+')
\d+