PythonでHTMLコードを解析したいので、すでに美しいスープとpyqueryを試しました。問題は、これらのパーサーが元のコードを変更することです。たとえば、タグを挿入するなどです。コードを変更しないパーサーはありますか?
私は試しHTMLParser
ましたが、成功しませんでした!:( コードを変更せず、タグが配置されている場所を教えてくれるだけです。しかし、mail.live.com のような Web ページの解析に失敗します。ブラウザと同じように Web ページを解析する方法はありますか?