Python正規表現キーワードを含む文字列がありますが、キーワードが存在せず、特定の順序ではない場合があります。正規表現について助けが必要です。
キーワードは次のとおりです。
Up-to-date
date added
date trained
これらは、他の多くのキーワードの中から見つける必要があるキーワードであり、存在しない可能性があり、任意の順序になります.
刺傷はどのように見えるか
<div>
<h2 class='someClass'>text</h2>
blah blah blah Up-to-date blah date added blah
</div>
私が試したこと:
regex = re.compile('</h2>.*(Up\-to\-date|date\sadded|date\strained)*.*</div>')
regex = re.compile('</h2>.*(Up\-to\-date?)|(date\sadded?)|(date\strained?).*</div>')
re.findall(regex,string)
私が探している結果は次のとおりです。
If all exists
['Up-to-date','date added','date trained']
If some exists
['Up-to-date','','date trained']