こんにちは、HTML を取得しました。正規表現を使用して、itemprop 属性を取得するすべての HTML タグを見つけようとしました。
HTML の整合性がわからないので、正規表現を使用したいと思います。
私はこの正規表現を試しました。
<(?<balise>.+)>(?(balise).*itemprop=.*)
グループ内のパターンを一致させたいのですが、うまくいきません。
誰かが私を助けることができます
テキスト解析の例
<meta itemprop="currency" content="CDN" >
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
<html xmlns="http://www.w3.org/1999/xhtml" lang="fr" xmlns:og="http://ogp.me/ns#" xmlns:fb="http://www.facebook.com/2008/fbml">
<head><span itemprop="name">My name</span>
itempropを取得するhtmlタグのみを抽出する必要があります