0

以下のhtmlコードからhrefタグを取得しようとしています。これは完全な html のほんの一部です。

<div class=\"adr\"><a title=\"8632 Open Meadow Way, Columbia, MD\" href=\"\/homedetails\/8632-Open-Meadow-Way-Columbia-MD-21045\/37058296_zpid\/\">8632 Open Meadow Way, Columbia, MD<\/a><\/div>

私は多くの方法を試しましたが、うまくいきません。正規表現を探しています。

私を助けてください。

4

3 に答える 3

2
/href=\\"(.*?)\\"/  //substring should be capture group 1.

編集:しかし、データに二重引用符がある場合はどうなりますか? それは二重二重引用符ですか?次に、これを試すことができます:

/href=\\"(""|.*?)\\"/
于 2012-03-07T08:06:24.927 に答える
1

hrefタグではなく、属性です。第二に、聖なるすべてのために、正規表現を使用して HTML を解析しないでください。それが DOM の目的です。使用している言語を指定していません。Javascript の場合、使用する適切な関数はelement.getAttribute()です。

于 2012-03-07T08:08:38.350 に答える
0

確かに、これだけです (プラットフォームに応じて必要なエスケープが必要です)。キーは、* の後の最小マンチ量指定子です。それ以外の場合は、最後の可能な引用符まで消費されます。

a\s+href="(.*?)"
于 2012-03-07T08:07:11.297 に答える