Linuxシェルで、ダウンロードしたHTMLスクリプトファイルからJPGファイルへのリンクを返そうとしています。これまでのところ、私はこの点に到達しただけです:
grep 'http://[:print:]*.jpg' 'www_page.html'
'tr'、'cut'、'sed'などの補助コマンドを使用したくない...'lynx'は大丈夫です!
ファイルをマッサージせずに grep を単独で使用することは可能ですが、多くの人がコメントで指摘しているように推奨されません。
要件を少し緩めることができる場合は、html tidyを使用してダウンロードした HTML ファイルをマッサージし、各 html エンティティが 1 行に収まるようにして、次のように正規表現をより単純にすることができます。
$ tidy file.html|grep -o 'http://[[:print:]]*.jpg'
入力の一致する部分のみを出力するために grep に「-o」オプションを使用することに注意してください。