このツールを使用すると、タブ区切りまたはcsvファイルのヘッダーを変更する方がはるかに簡単だと思うので、awkをいじっていました..
2 種類のファイル (コンマまたはタブ区切り) があり、ヘッダー (NR =1) を次のように変更するだけです。
- すべての単語の大文字小文字を下げる
- 各フィールド名のスペースをアンダースコアに置き換えます。がんの種類を *cancer_type* に変更します
がんの種類、アセンブリ バージョン、染色体、染色体の開始、染色体の終了
これまでになんとかしたことは、最初の行をリストすることだけです
awk 'NR == 1' test2.csv
さて、私は途方に暮れています。いずれにしても、ダウンストリームの変更を行う前に、おそらくこのスクリプト (sed または awk) を実行します。
どんな助けでも(または良いチュートリアル/ワンライナーを教えて)いただければ幸いです。
編集
こんにちは、これを明確にするために編集する必要があります。ファイルから開始し、同じファイルで終了しますが、ヘッダーが変更されています。
ファイルの 2 つのバージョンを取得できました。
CSV
がんの種類、アセンブリ バージョン、染色体、染色体の開始、染色体の終了
後:
がんの種類、アセンブリのバージョン、染色体、染色体の開始、染色体の終了
TSV
がんの種類\t アセンブリ バージョン\t 染色体\t 染色体開始\t 染色体終了
後:
がんの種類\t アセンブリのバージョン\t 染色体\t 染色体の開始\t 染色体の終了
とは言っても、アプローチはほとんど機能していると思います..
EDIT 2 OSはOS X 10.7.+です