15

Python の Beautiful Soup スクレイピング ライブラリが気に入っています。それだけで機能します。Rubyに近いものはありますか?

4

4 に答える 4

10

Nokogiriは、もう 1 つの HTML/XML パーサーです。これらのベンチマークによると、hpricot よりも高速です。Nokogiri は libxml2 を使用し、hpricot の代替としてドロップインされます。また、css3 セレクターのサポートもあり、非常に優れています。

編集: nokogiri、libxml-ruby、hpricot、rexml を比較する新しいベンチマークがここにあります。

Ruby Toolboxには HTML パーサーに関するカテゴリがあります

于 2009-03-12T19:25:16.753 に答える
4

scRUBYtがあります!、 Rubyful-soup (もはやメンテナンスされていません)、 WWW::MechanizescrAPIなど。

または、解析に Hpricot またはNokogiriを使用することもできます。

于 2009-03-12T19:24:00.890 に答える
3

Ruby Toolboxのこのページには、さまざまなパーサーの相対的な人気を示すグラフが含まれています。

于 2009-11-11T21:46:08.490 に答える
1

Hpricot?他の人が何を使っているのかわかりません...

于 2009-03-12T19:16:05.513 に答える