私はWebスクレイピングに3つの言語(Ruby、PHP、Python)を使用しましたが、正直なところ、どれもこのタスクに最適ではないようです。
Rubyには優れた機械化およびXML解析ライブラリがありますが、スプレッドシートのサポートは非常に貧弱です。
PHPには優れたスプレッドシートとHTML解析ライブラリがありますが、WWW:Mechanizeに相当するものはありません。
Pythonには非常に貧弱なMechanizeライブラリがあります。私はそれに関して多くの問題を抱えていましたが、それでもそれらを解決することができません。そのスプレッドシートライブラリも、XLSXファイルを作成できないため、多かれ少なかれまともです。
ウェブスクレイピングに最適なものはありますか。
PS:私はWindowsプラットフォームに取り組んでいます。