27

Google の Go プログラミング言語を学んでいます。HTML WebページからすべてのURLを抽出するベストプラクティスを知っている人はいますか?

Java の世界から来て、たとえばjsouphtmlparserなどの仕事をするライブラリがあります。しかし、go lang については、利用可能な同様のライブラリがまだ作成されていないと思いますか?

4

6 に答える 6

25

jQuery を知っているなら、GoQueryを気に入るはずです。

正直なところ、これは私が Go で見つけた中で最も簡単で最も強力な HTML ユーティリティであり、go.net リポジトリの html パッケージに基づいています。(生の HTML トークンなどを公開しないため、単なるパーサーよりも高レベルですが、実際に HTML ドキュメントで何かを実行したい場合は、このパッケージが役立ちます。)

于 2014-08-02T23:03:46.393 に答える
21

HTML解析用のGoの標準パッケージはまだ進行中の作業であり、現在のリリースの一部ではありません。あなたが試すかもしれないサードパーティのパッケージはgo-html-transformです。積極的に整備されています。

于 2012-06-18T13:23:45.973 に答える
17

HTML 解析用の Go パッケージは実際にはまだ開発中ですが、go.netリポジトリで入手できます。

そのソースはcode.google.com/p/go.net/html github.com/golang/net積極的に開発されています。

これは、最近のgo-nuts ディスカッションで言及されています。


Go 1.4 (2014 年 12 月) では、この回答で述べたように、パッケージは現在golang.org/x/net( godocを参照) であることに注意してください。

于 2012-08-08T09:13:07.287 に答える
6

調べてみると、Ruby の Nogokiri に似た Gokogiriというライブラリがあることがわかりました。プロジェクトも活発だと思います。

于 2013-05-17T05:09:26.823 に答える