linux - bash で文字列を操作する

Question

検索後に取得した Google のページを含むファイルがあります。使った

w3m -no-cookie $search > google

ページを作る

その後、そのページに含まれるすべてのサイトを取得する必要があるため、基本的に「www」で始まり「/」で終わるすべての文字列を取得する必要があります。

私は試した：

grep -Fw "www" google | awk -F "/" '{ print $1";" }'

しかし、それは私にwwwの前にあるすべてのものを与えてくれます

どうすればそれを削除できますか?

sedを使用する必要がありますか？

ありがとう！

score 3 · Accepted Answer

すべてのサイトがで始まると仮定するwwwのは少し奇妙ですが、次のようになります。

あなたの問題は、 grep が行全体を返すことです。これ-oを使用すると、一致した部分のみが返されます:

grep -wo "www.*" google | awk -F "/" '{ print $1";" }'

または単に：

grep -wo "www[^/]*" google

1 に答える 1