linux - cut、sed、trコマンドを使用せずにbashシェル環境でダウンロードしたhtmlページからリンクを「grep」しようとしています（e / grepのみ）

Question

Linuxシェルで、ダウンロードしたHTMLスクリプトファイルからJPGファイルへのリンクを返そうとしています。これまでのところ、私はこの点に到達しただけです：

grep 'http://[:print:]*.jpg' 'www_page.html'

'tr'、'cut'、'sed'などの補助コマンドを使用したくない...'lynx'は大丈夫です！

score 2 · Accepted Answer

ファイルをマッサージせずに grep を単独で使用することは可能ですが、多くの人がコメントで指摘しているように推奨されません。

要件を少し緩めることができる場合は、html tidyを使用してダウンロードした HTML ファイルをマッサージし、各 html エンティティが 1 行に収まるようにして、次のように正規表現をより単純にすることができます。

$ tidy file.html|grep -o 'http://[[:print:]]*.jpg'

入力の一致する部分のみを出力するために grep に「-o」オプションを使用することに注意してください。

1 に答える 1