HTML ページ ソースをファイルとしてダウンロードし、ファイルを読み取り、特定のコードの後にある特定の URL を抽出するスクリプトを作成しています。(出現回数は 1 回のみ)
一致する必要があるサンプルは次のとおりです。
<img id="sample-image" class="photo" src="http://xxxx.com/some/ic/pic_1asda963_16x9.jpg"
URL の前のコードは常に同じなので、次の部分を抽出する必要があります。
<img id="sample-image" class="photo" src="
および"
URL の後に。
私はこのようなsedで何かを試しました:
sed -n '\<img\ id=\"sample-image\"\ class=\"photo\"\ src=\",\"/p' test.txt
しかし、うまくいきません。私はあなたの提案に感謝します、どうもありがとう!