3

ウィキペディアのページから曲名のリストを取得しようとしています (" https://en.wikipedia.org/wiki/Category:The_Kinks_songs ")

ここに私が現在試しているコードがあります

//Get page source and parse it
string pageSource = PageSource.Get(url);// own method
HtmlParser parser = new HtmlParser();
var doc = parser.Parse(pageSource);

//Get div tag with class="mw-category"
var div_mw_content_ltr = doc.All.Where(tag => tag.LocalName == "div" && tag.GetAttribute("class") == "mw-category");
//Get all li tags
var li = div_mw_content_ltr.All(tag => tag.LocalName == "li");

List<string> LS = new List<string>();
foreach (var item in div_mw_content_ltr)
    {
        string tmp = item.TextContent;
        LS.Add(tmp);
    }

return LS;

私はこのことに本当に慣れていません。var li は、div_mw_content_ltr 内のリスト アイテム タグのコレクションであると予想していた場所で false です。

新しいパーサーを作成してdiv_mw_content_ltrのinnerhtmlをパースしようとしましたが、そのメンバーが存在しません。

stackoverflow 以降ですべての anglesharp タグを検索しましたが、解決策が見つかりません。angleharpの使用方法を理解する前に、htmlやクエリセレクターなどの解析に関する基本的な知識が必要であると感じています。 anglesharp ライブラリを実際に使用します。

お読みいただきありがとうございます。

4

1 に答える 1