-2

重複の可能性:
特定のHTML内のすべてのタグ間でテキストを取得し、リンクを再帰的に通過する

敏捷性パックを使用して、タグ間の単語や情報を引き出すにはどうすればよいですか?HTMLコード内のすべてのタグを無視し、それらのタグの間にあるすべての単語を取得します。htmlコードは私によって文字列に保存されました!今、私はこれを達成するために敏捷性パックを使用したいですか?

4

1 に答える 1

0

上手、

場合によります。たとえば、1つのタグにクラスがあり、それが一意である場合、それは1つの関数ですが、複数のタグがある場合は、タグの場所に基づいて関数を考えて作成する必要があります。タグがない場合は、別の状況になります。 html要素を数える必要があります。たとえば、タブ行をループする必要がある場合もあります。

以下の例は、必要なものと同様です。(ページレイアウトに変更があった場合、失敗する可能性があるため、それでも機能するかどうかはわかりません。)しかし、それはアイデアを与え、そこから進むことができます。

PS-質問をするときは、漠然とした説明ではなく、正確な問題を教えてください。

                String openUrl = @"http://www.ebay.com/sch/-/11724/i.html?_nkw=" + some_part_number + "&_armrs=1&LH_Complete=1";

                HtmlWeb hw = new HtmlWeb();
                hw.UserAgent = "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1)";
                HtmlAgilityPack.HtmlDocument doc = hw.Load(openUrl);

                foreach (HtmlNode nd in doc.DocumentNode.SelectNodes("//tr[@itemprop='offers']"))
                {
                    String title = "";
                    title = Regex.Split(nd.InnerHtml.ToString(), ("title='"))[1].Trim();
                    title = Regex.Split(title, "'")[0].Trim();
                }
于 2012-12-01T18:57:59.707 に答える