YouTubeのコメントページをダウンロードし、次のコードブロックからユーザー名(またはユーザーの表示名)とリンクを抽出したいと思います。
<p class="metadata">
<span class="author ">
<a href="/channel/UCuoJ_C5xNTrdnc4motXPHIA" class="yt-uix-sessionlink yt-user-name " data-sessionlink="ei=CKG174zFqbQCFZmaIQodtmyE0A%3D%3D" dir="ltr">Sabil Muhammad</a>
</span>
<span class="time" dir="ltr">
<a dir="ltr" href="http://www.youtube.com/comment?lc=S2ZH2gSPYaef43vTRkLDxUzo2fYicVUc3SFvmYq2jrs">
il y a 1 jour
</a>
</span>
</p>
/ channel/UCuoJ_C5xNTrdnc4motXPHIAとSabilMuhammadを抽出したい
もちろん、htmlページには多くの行がありますが、上記のようなコードブロックに焦点を当て、すべてのユーザー名と対応するリンクを抽出して、ログファイルに入れたいだけです。
これに適したスクリプトはありますか?私はbashとc/c++を知っています
ありがとう!