サンプルデータ:
603 Some garbage data not related to me, 55, 113 ->
1-ENST0000 This is sample data blh blah blah blahhhh
2-ENSBTAP0 This is also some other sample data
21-ENADT)$ DO NOT WANT TO READ THIS LINE.
3-ENSGALP0 This is third sample data
node #4 This is 4th sample data
node #5 This is 5th sample data
This is also part of the input file but i dont wish to read this.
Branch -> 05 13,
44, 1,1,4,1
17, 1150
637 YYYYYY: 2 : %
編集:上記のデータで。セクションの列幅は固定されていますが、読みたくないセクションがいくつかあるかもしれません。上記のサンプル データは、それを反映するように編集されています。
したがって、この入力ファイルでは、最初のセクション '1-ENST0000' の内容を配列に読み込み、'2-ENSBTAP0' の内容を別の配列に読み込みます。
パターンを定義する正規表現を思いつくのに苦労しています...最初の3行が<someNumber>-ENS<someotherstuf>
あり、その後もある可能性がありますnode #<some number here>