-1

検索後に取得した Google のページを含むファイルがあります。使った

w3m -no-cookie $search > google

ページを作る

その後、そのページに含まれるすべてのサイトを取得する必要があるため、基本的に「www」で始まり「/」で終わるすべての文字列を取得する必要があります。

私は試した :

grep -Fw "www" google | awk -F "/" '{ print $1";" }'

しかし、それは私にwwwの前にあるすべてのものを与えてくれます

どうすればそれを削除できますか?

sedを使用する必要がありますか?

ありがとう!

4

1 に答える 1

3

すべてのサイトが で始まると仮定するwwwのは少し奇妙ですが、次のようになります。

あなたの問題は、 grep が行全体を返すことです。これ-oを使用すると、一致した部分のみが返されます:

grep -wo "www.*" google | awk -F "/" '{ print $1";" }'

または単に:

grep -wo "www[^/]*" google
于 2012-08-04T17:19:30.623 に答える