pugixml の xpath 関数を使用して、(curl でダウンロードした) HTML ドキュメント内の特定のノードを検索しています。
私は使っている:
pugi::xml_document doc;
doc.load_buffer(htmlcontent.c_str(), htmlcontent.size());
pugi::xpath_node example= doc.select_single_node("//h2[@class='tv_header']");
std::cout << example.node();
これは 0 ノードを返します。このノードがドキュメントに存在することは知っています。そのノードだけを文字列内に配置すると、ノードが正常に検出されます。ドキュメント内にノードが見つからないのはなぜですか? HTMLドキュメントのエンコーディングに問題はありますか?
ありがとう!