基本的にRで開くことができない非常に大きな遺伝子型ファイルがあるため、Linuxコマンドラインを使用して目的の行と列を抽出しようとしています。行は頭/尾を使用して十分に簡単ですが、列を処理する方法を理解するのに苦労しています。
を使用して、100〜105番目のタブまたはスペースで区切られた列を抽出しようとすると(たとえば)
cut -c100-105 myfile >outfile
各列に複数の文字の文字列がある場合、これは明らかに機能しません。列がスペースまたはタブ (またはその他の文字) で区切られて定義されている列内の文字列全体を抽出するように、適切な引数でカットを変更する方法はありますか?