私はhtmlparserのreadmeをよく理解していません..インターネットで検索しましたが、適切なチュートリアル(または他のNodeJSパーサー)が見つかりません。
ほとんどの場合、かなり完全で古いライブラリのチュートリアルがない場合、それは簡単に実行できるため、人々はチュートリアルを書く必要性をあまり感じないからだと思います...しかし、NodeJS html パーサーはかなり分かりにくい…
私はhtmlparserのreadmeをよく理解していません..インターネットで検索しましたが、適切なチュートリアル(または他のNodeJSパーサー)が見つかりません。
ほとんどの場合、かなり完全で古いライブラリのチュートリアルがない場合、それは簡単に実行できるため、人々はチュートリアルを書く必要性をあまり感じないからだと思います...しかし、NodeJS html パーサーはかなり分かりにくい…
htmlparser2をチェックアウトする必要があります。これは新しい htmlparser で、適切な readme があります。私がそれを使用する傾向がある方法は、合理的ではないため、次のようになります。
handler = new htmlparser.DomHandler(function(err, dom) {
// ... DO CODE HERE
})
new htmlparser.Parser(handler).parseComplete(html_string)
ハンドラー関数内のコードについては、文書化されていて怠け者なので、 soupselectを使用しますが、htmlparser2 の連中は domutils を提案していますが、文書化されていません。