jsdom で複数行の属性の値を取得することは可能ですか (Node.js+JQuery で使用します)?
スクレイピングするサイトには、次の HTML が含まれています。
<li><a data-title="<strong>hello world
this is a test</strong>" href="example.org</strong>">A link</a></li>
残念ながら、これはに解析されます
<li><a data-title="data-title"><strong>hello world
this is a test</strong>' href="example.org">A link</a></li>
そのため、たとえば JQuery: を介して title と href 属性を抽出できません$("a").attr("data-title")
。
何か案は?