0

私は今、自分で Go を学んでいて、HTML/XML の取得と解析に行き詰まっています。Python で Web スクレイピングを行う場合、通常は次のコードを記述します。

from urllib.request import urlopen, Request
url = "http://stackoverflow.com/"
req = Request(url)
html = urlopen(req).read()

stringのいずれかの形式で未加工の HTML/XML を取得し、それを使用bytesして作業を進めることができます。Goでは、どうすれば対処できますか? 私が取得したいのは、またはのいずれかに格納されている生の HTML データですstring([]byte簡単に変換できますが、どちらを取得してもかまいません)。gokogiriパッケージを使用して Go で Web スクレイピングを行うことを検討していますが (実際に使用することになるかどうかはわかりません!)、作業を行う前に未加工の HTML テキストが必要なようです...

では、どうすればそのようなオブジェクトを取得できますか?

または、Go で Web スクレイピング作業を行うためのより良い方法はありますか?

ありがとう。

4

1 に答える 1