0

さまざまなソースから取得したレコードを含むテキスト ファイルがあるとします。ファイルは次のようになります。

1000 Once upon a time, happy end.
1001 Tornado in NY city, the statue was finally found.
1002 I bought her an iphone 
yes 
for $1000. And then

happy end.
1003 How many times 
have I seen it?
not many. Actually.
1004 5 Cars. 2 Toys. 3 Birds.

各行は\n{1000...2000} のような行番号で始まります。行番号は、タブでテキストと区切られています\t

"."では、 with sed in oneの出現をどのように数えますrecordか?

sedは、パターンで指定されたものを除くすべての文字を、グループ化せずに置き換えることができます[^...]か?

出力は次のようになります。

1000 1
1001 1
1002 2
1003 2
1004 3
4

1 に答える 1

3

1 つの方法を次に示します。

$ awk -v r=1000 '{print r++,split($0,a,".")-1}' RS="\n[0-9]+\t" file 
1000 1
1001 1
1002 2
1003 2
1004 3
于 2013-04-10T14:19:15.350 に答える