慣用的な Perl 6 を使用してこれを行いたいと思います。
ノイズの多い出力ファイルに埋め込まれた素晴らしい連続したデータの塊を見つけました。
Cluster Unique
ヘッダー行から始まり、それに続くすべての行を、最初に出現する空の行まで (ただし、それを含まない)単純に印刷したいと思います。ファイルは次のようになります。
</path/to/projects/projectname/ParameterSweep/1000.1.7.dir> was used as the working directory.
....
Cluster Unique Sequences Reads RPM
1 31 3539 3539
2 25 2797 2797
3 17 1679 1679
4 21 1636 1636
5 14 1568 1568
6 13 1548 1548
7 7 1439 1439
Input file: "../../filename.count.fa"
...
解析したいものは次のとおりです。
Cluster Unique Sequences Reads RPM
1 31 3539 3539
2 25 2797 2797
3 17 1679 1679
4 21 1636 1636
5 14 1568 1568
6 13 1548 1548
7 7 1439 1439