URL の一部を一致させようとしています。この URL は既に処理されており、ドメイン名のみで構成されています。
例えば:
現在持っている URL は business.time.com です。トップ レベル ドメイン (.com) を削除したいと考えています。私が望む結果はbusiness.timeです
次のコードを使用しています。
gawk'{
match($1, /[a-zA-Z0-9\-\.]+[^(.com|.org|.edu|.gov|.mil)]/, where)
print where[0]
print where[1]
}' test
テストでは、次の 4 行があります。
business.time.com
mybest.try.com
this.is.a.example.org
this.is.another.example.edu
私はこれを期待していました:
business.time
mybest.try
this.is.a.example
this.is.another.example
ただし、出力は
business.t
mybest.try
this.is.a.examp
this.is.another.examp
何が悪いのか、どうすればいいのか誰か教えてもらえますか?
ありがとう