0

Webページに含まれるiframe内で、「行」を含むクラスですべてのテーブル行をスクレイピングする必要があります。

私は現在、このコードを持っています:

"//tr[contains(@class, 'row']"

しかし、私はエラーが発生します

'//tr[contains(@class, 'row']' には無効なトークンがあります。

私の質問は次のとおりです。

  1. iframe の HTML コンテンツを取得するにはどうすればよいですか?
  2. 正しい XPath 式はどれですか?

誰かが私を助けてくれますか?

編集 私はxpathをに変更しました

"//tr[contains(@class, 'row')]"

エラーは表示されませんが、何も表示されません

ありがとう

4

1 に答える 1

1

コメントで述べたように、iFrame のソースを取得し、ページを直接読み込んで HTML をスケープする必要があります。

  1. HTMLAglityPack を使用して iframe の場所を見つける

    スクレイピングする iFrame の src を取得する方法については、こちらをお読みください: get i frame source using HtmlAgilityPack

  2. WebRequest を実行して iFrame の src を取得します

  3. HTMLAglityPack を使用して応答を解析します。

于 2012-05-02T17:19:37.847 に答える