awkで解決したい次の問題があります。100,000 行と 5,000 列で構成される、カンマ区切りの大きなテキスト テーブルが 1 つあります。最初の行はヘッダーで、最初の列はレコード ID です。次に、最初のファイルのヘッダーのサブセットを含む 2 番目のテキスト ファイルを作成します。2 番目のファイルで指定されたリストにヘッダーが含まれている最初のファイルのすべての列を抽出したいと考えています。入力と目的の出力の例を次に示します。
DATA.TXT
ID, head1, head2, head3, head4
1, 25.5, 1364.0, 22.5, 13.2
2, 10.1, 215.56, 1.15, 22.2
リスト.TXT
head1
head4
望ましい出力:
ID, head1, head4
1, 25.5, 13.2
2, 10.1, 22.2
この問題をawkで解決する方法、またはUNIXスクリプトを使用して解決する方法について、誰かアドバイスをいただけますか? 助けてくれてありがとう!