複数行のレコードを含むビッグ データ ファイルを処理する必要があります。入力例:
1 Name Dan
1 Title Professor
1 Address aaa street
1 City xxx city
1 State yyy
1 Phone 123-456-7890
2 Name Luke
2 Title Professor
2 Address bbb street
2 City xxx city
3 Name Tom
3 Title Associate Professor
3 Like Golf
4 Name
4 Title Trainer
4 Likes Running
最初の整数フィールドは一意であり、実際にはレコード全体を識別することに注意してください。したがって、上記の入力では、実際には 4 つのレコードがありますが、各レコードに何行の属性があるかはわかりません。私はする必要があります: - 有効なレコードを識別します (「名前」と「タイトル」フィールドが必要です) - 有効なレコードごとに使用可能な属性を出力します。たとえば、「名前」、「タイトル」、「住所」は必要なフィールドです。
出力例:
1 Name Dan
1 Title Professor
1 Address aaa street
2 Name Luke
2 Title Professor
2 Address bbb street
3 Name Tom
3 Title Associate Professor
したがって、出力ファイルでは、「名前」フィールドがないため、レコード 4 が削除されます。レコード 3 には Address フィールドがありませんが、「名前」と「タイトル」を持つ有効なレコードであるため、出力に出力されます。
awkでこれを行うことはできますか?しかし、各行の最初の「id」フィールドを使用してレコード全体を識別するにはどうすればよいでしょうか?
私を助けてくれたUNIXシェルスクリプトの専門家に感謝します! :)