大きなhtmlファイルから情報を抽出できるbashscriptを書き込もうとしています。毎朝最新の新聞を自動的にダウンロードするためにこれが必要です:)。最新の新聞をダウンロードするには、そのIDを知っている必要があります。それを取得するには、それを指すリンクを解析する必要があります。私はなんとか行を抽出することができました、それはawkでIDを保持しています
awk '/show.php\?id=/' index.html
取得します
<a href="show.php?id=914826">Latest Newspaper</a>
したがって、この行から必要なのは「914826」です。これは私が立ち往生しているところです...私はawkを使用して行全体ではなくフラグメントを抽出できるとは思いません。
あなたの答えを楽しみにしています。よろしくお願いします、サイモン