c# - html c＃のすべてのタグ間の単語の抽出

Question

重複の可能性：
特定のHTML内のすべてのタグ間でテキストを取得し、リンクを再帰的に通過する

敏捷性パックを使用して、タグ間の単語や情報を引き出すにはどうすればよいですか？HTMLコード内のすべてのタグを無視し、それらのタグの間にあるすべての単語を取得します。htmlコードは私によって文字列に保存されました！今、私はこれを達成するために敏捷性パックを使用したいですか？

score 0 · Accepted Answer

上手、

場合によります。たとえば、1つのタグにクラスがあり、それが一意である場合、それは1つの関数ですが、複数のタグがある場合は、タグの場所に基づいて関数を考えて作成する必要があります。タグがない場合は、別の状況になります。 html要素を数える必要があります。たとえば、タブ行をループする必要がある場合もあります。

以下の例は、必要なものと同様です。（ページレイアウトに変更があった場合、失敗する可能性があるため、それでも機能するかどうかはわかりません。）しかし、それはアイデアを与え、そこから進むことができます。

PS-質問をするときは、漠然とした説明ではなく、正確な問題を教えてください。

                String openUrl = @"http://www.ebay.com/sch/-/11724/i.html?_nkw=" + some_part_number + "&_armrs=1&LH_Complete=1";

                HtmlWeb hw = new HtmlWeb();
                hw.UserAgent = "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1)";
                HtmlAgilityPack.HtmlDocument doc = hw.Load(openUrl);

                foreach (HtmlNode nd in doc.DocumentNode.SelectNodes("//tr[@itemprop='offers']"))
                {
                    String title = "";
                    title = Regex.Split(nd.InnerHtml.ToString(), ("title='"))[1].Trim();
                    title = Regex.Split(title, "'")[0].Trim();
                }

c# - html c＃のすべてのタグ間の単語の抽出

1 に答える 1

Related

Reference