この質問が以前に寄せられた場合は申し訳ありませんが、主に例が不足しているため、Python 正規表現のドキュメントは非常に理解しにくいと思います。ページ ソースのブロックを取得して、後で再度解析したいと考えています。例えば:
<div id="viewed"><div class="shortstory-block">
<div class="shortstoey-block-image">
<a href="...."><img src="/uploads/posts/cov.jpg" alt="instance 1"/></a>
<span class="format"><a href="http://www..../">something</a></span>
</div>
<a href="http://....."><span class="shortstory-block-title" style="text-decoration:none !important;">
Something
</span>
</a>
</div><div class="shortstory-block">
<div class="shortstoey-block-image">
<a href="...."><img src="/uploads/posts/cov.jpg" alt="something 2"/></a>
<span class="format"><a href="http://www.website/xfsearch/smth/">something</a></span>
</div>
<a href="http://web.html"><span class="shortstory-block-title" style="text-decoration:none !important;">
Something
</span>
</a>
</div>
(* x times)
<div id="rated">....
変数 (html_source) にすべてのページ ソースがあり、このコード ブロック (div id="viewed" と div id="rated" の間) のみで別の変数を定義したいと考えています。2 つのインスタンスの間に \n または \r があるにもかかわらず、すべてを取得したいと考えています。
誰かが私を正しい方向に向けることができますか (正規表現)?
前もって感謝します