正規表現を使用してスクレイピングしたい Web ページがあります。このページには、気になるテキスト ブロックを 3 つまで含めることができます。
3 つのテキスト ブロックがすべて存在する場合は一致が返され、それ以外の場合は一致が返されません。テキストは、ページ上で任意の順序にすることができます。
私はこれを試しましたが、「任意の順序」の要件を満たしていません:
re_text = (Text block 1)((.|\n)*)(Text block 2)((.|\n)*)(Text block 3)
re_compiled = re.compile(re_text)
ここで後方参照を使用する必要がありますか? それとも別の解決策がありますか?