filter - awk / grep を使用してデータベースから # を抽出し、フィルターする

Question

次のような大規模なタブ区切りデータベースがあります。

1       14933   14933   G       A       ID=COSN404397;OCCURENCE=1(lung)  
1       14948   14948   G       A       ID=COSN415697,COSN415698;OCCURENCE=2(urinary_tract)  
1       69537   69537   G       T       ID=COSM536198;OCCURENCE=1(lung)  
1       69538   69538   G       A       ID=COSM75742;OCCURENCE=1(ovary)  
...

awk または grep を使用して、OCCURENCE >= 3 の行のみを保持しようとしています (そうです、データベース全体でつづりが間違っています!)、6 番目の列を分割/スキャンする最善の方法がわかりません...

score 0 · Accepted Answer

0

使用可能なままにしておく短いワンライナーFS:

$ awk -F'[(=\t;]' '$9>2' file

于 2013-04-09T17:05:55.077 に答える

score 0 · Accepted Answer

0

これを試して：

$ awk -F\; '{ if (substr($2,11,index($2,")")) >= 3) print $0; }' x.txt

于 2013-04-09T17:03:30.027 に答える

filter - awk / grep を使用してデータベースから # を抽出し、フィルターする

3 に答える 3

Related

Reference