OutWit Hub を使用して、Web サイトから会社名をスクレイピングしています。
一部のページでは、HTML タグは次のようになります。
<p style="font-weight: bold;">COMPANY NAME</p>
他のページでは:
<span style="font-weight: bold;">COMPANY NAME</span>
すべてのページで上記の 2 つのオプションのいずれかを使用しますが、両方を使用することはありません。
OutWit Hub に慣れていない場合は、必要な情報の前にマーカーを要求し、情報の後にマーカーを要求することで機能します。
会社名を取得する正規表現を作成しようとしています。これらのマーカーのいずれかが前後に使用されているかどうかに関係ありません。
これまでのところ、「before」タグでこれを試しましたが、うまくいきません:
/[<p style="font-weight: bold;">]|[<p>Name of Company: <span style="font-weight: bold;">]/
誰でも助けることができますか?