次のような大規模なタブ区切りデータベースがあります。
1 14933 14933 G A ID=COSN404397;OCCURENCE=1(lung)
1 14948 14948 G A ID=COSN415697,COSN415698;OCCURENCE=2(urinary_tract)
1 69537 69537 G T ID=COSM536198;OCCURENCE=1(lung)
1 69538 69538 G A ID=COSM75742;OCCURENCE=1(ovary)
...
awk または grep を使用して、OCCURENCE >= 3 の行のみを保持しようとしています (そうです、データベース全体でつづりが間違っています!)、6 番目の列を分割/スキャンする最善の方法がわかりません...