ウィキペディアのページから曲名のリストを取得しようとしています (" https://en.wikipedia.org/wiki/Category:The_Kinks_songs ")
ここに私が現在試しているコードがあります
//Get page source and parse it
string pageSource = PageSource.Get(url);// own method
HtmlParser parser = new HtmlParser();
var doc = parser.Parse(pageSource);
//Get div tag with class="mw-category"
var div_mw_content_ltr = doc.All.Where(tag => tag.LocalName == "div" && tag.GetAttribute("class") == "mw-category");
//Get all li tags
var li = div_mw_content_ltr.All(tag => tag.LocalName == "li");
List<string> LS = new List<string>();
foreach (var item in div_mw_content_ltr)
{
string tmp = item.TextContent;
LS.Add(tmp);
}
return LS;
私はこのことに本当に慣れていません。var li は、div_mw_content_ltr 内のリスト アイテム タグのコレクションであると予想していた場所で false です。
新しいパーサーを作成してdiv_mw_content_ltrのinnerhtmlをパースしようとしましたが、そのメンバーが存在しません。
stackoverflow 以降ですべての anglesharp タグを検索しましたが、解決策が見つかりません。angleharpの使用方法を理解する前に、htmlやクエリセレクターなどの解析に関する基本的な知識が必要であると感じています。 anglesharp ライブラリを実際に使用します。
お読みいただきありがとうございます。