私は今、自分で Go を学んでいて、HTML/XML の取得と解析に行き詰まっています。Python で Web スクレイピングを行う場合、通常は次のコードを記述します。
from urllib.request import urlopen, Request
url = "http://stackoverflow.com/"
req = Request(url)
html = urlopen(req).read()
string
のいずれかの形式で未加工の HTML/XML を取得し、それを使用bytes
して作業を進めることができます。Goでは、どうすれば対処できますか? 私が取得したいのは、またはのいずれかに格納されている生の HTML データですstring
([]byte
簡単に変換できますが、どちらを取得してもかまいません)。gokogiriパッケージを使用して Go で Web スクレイピングを行うことを検討していますが (実際に使用することになるかどうかはわかりません!)、作業を行う前に未加工の HTML テキストが必要なようです...
では、どうすればそのようなオブジェクトを取得できますか?
または、Go で Web スクレイピング作業を行うためのより良い方法はありますか?
ありがとう。