3

次のようなファイルがあります。

XX1, 1.1,24.08.1994 13:00:00, 111,112,113
XX2, 1.2,24.08.1994 13:30:00, 121,122,123
XX3, NaN,22.08.1995 15:00,    131,132,133

そのため、時間形式は一貫していません。一部の行には hh:mm:ss のような時間があり、一部の時間形式は hh:mm です。秒を削除して、次のようなファイルを取得したいと思います。

XX1, 1.1,24.08.1994 13:00, 111,112,113
XX2, 1.2,24.08.1994 13:30, 121,122,123
XX3, NaN,22.08.1995 15:00, 131,132,133

私がこれまでに試したことは

#!/bin/bash
sed 's@,\(..\):\(..\):\(..\) @,\1:\2 @' < time_fault > ./time_corrected

#!/usr/bin/awk -f
BEGIN { RS="," ; FS=":"; ORS=","}
{ getline str
gsub(/*..:..:..*/,  $1":"$2 str) > time_corrected }

しかし、どちらも機能しませんでした。

4

7 に答える 7

2

sed必要なキャプチャグループは1つだけです。

sed -re 's/([0-9]{2}:[0-9]{2}):[0-9]{2},/\1,/' -e 's/, +/, /g' file
XX1, 1.1,24.08.1994 13:00, 111,112,113
XX2, 1.2,24.08.1994 13:30, 121,122,123
XX3, NaN,22.08.1995 15:00, 131,132,133

たぶんawkもっと良いです..必要な場合にのみ3番目のフィールドに置換を適用し、そうでない場合は4番目のフィールドから余分なスペースを削除します。

$ awk '{if ($3~/([0-9]{2}:){2}/) sub(/:[0-9]{2},/,",",$3);else sub(/ */,"",$4)}1'
XX1, 1.1,24.08.1994 13:00, 111,112,113
XX2, 1.2,24.08.1994 13:30, 121,122,123
XX3, NaN,22.08.1995 15:00, 131,132,133
于 2013-02-04T11:13:22.343 に答える
2

私はあなたのsedコマンドを少し微調整しました:

$ sed 's/ \(..:..\)[^,]*/ \1/g' file
XX1, 1.1,24.08.1994 13:00, 111,112,113
XX2, 1.2,24.08.1994 13:30, 121,122,123
XX3, NaN,22.08.1995 15:00,    131,132,133
于 2013-02-04T11:14:02.190 に答える
2

よろしければ、これをチェックしてください。

入力例に基づいて、これは機能するはずです。

awk -F, 'split($0,a,":")>2{gsub(/:[0-9][0-9],/,",")}1' file

テスト

kent$  echo "XX1, 1.1,24.08.1994 13:00:00, 111,112,113
XX2, 1.2,24.08.1994 13:30:00, 121,122,123
XX3, NaN,22.08.1995 15:00,    131,132,133"|awk -F, 'split($0,a,":")>2{gsub(/:[0-9][0-9],/,",")}1'
XX1, 1.1,24.08.1994 13:00, 111,112,113
XX2, 1.2,24.08.1994 13:30, 121,122,123
XX3, NaN,22.08.1995 15:00,    131,132,133
于 2013-02-04T11:07:04.230 に答える
2

一方通行:

 awk -F, '{$3=substr($3,0,16);}1' OFS=, file
于 2013-02-04T11:41:58.107 に答える
1
awk -F, '{OFS=","}length($3)>16{$3=substr($3,0,16)}1' your_file

以下でテスト:

> cat temp
XX1, 1.1,24.08.1994 13:00:00, 111,112,113
XX2, 1.2,24.08.1994 13:30:00, 121,122,123
XX3, NaN,22.08.1995 15:00,    131,132,133

> awk -F, '{OFS=","}length($3)>17{$3=substr($3,0,16)}1' temp
XX1, 1.1,24.08.1994 13:00, 111,112,113
XX2, 1.2,24.08.1994 13:30, 121,122,123
XX3, NaN,22.08.1995 15:00,    131,132,133
于 2013-02-04T11:25:08.263 に答える