次の形式のタブ区切り列を持つテキストファイルがあります。
fileName Type sc1 sc2 sc3 sc4 sc5 sc6
file1 abc 0 0.2 0 0 0 0
file1 xyz 0 0.8 0 0 0.8 0.2
file2 abc 0.5 0 0 0.1 0 0
file2 xyz 0 0 0 0.7 0.003 0.1
file3 abc 0.002 0 0 0 0.04 0
file3 xyz 0.5 0 0 0 0 0.3
.
.
最初の行はヘッダー行です。sc1、sc2、sc3などはスコア1、スコア2、スコア3です(すべてゼロではありません)
3つ以上のタイプがあり、各ファイルには同じ数のタイプがあります。
xyzタイプのsc6が最も低いfileNameを知る方法は? または、このファイルから別のテキストファイルを作成する方法を教えてください。このファイルには、すべてのxyzタイプのファイル名とsc6が含まれます。
私は本当にこれをデータベースとしてロードしたり、そのようなことをしたくありません。cut
Unixの、sort
またはgrep
コマンドを使用して、これをかなり迅速に達成できるかどうか疑問に思いました。すべてのperl、awkソリューションも受け入れられます。
質問があまり明確でない場合はお知らせください。
PSこの質問には別の見出しを提案してください。これは私が思いつくことができる最高のものです。