トピックについていくつか質問があります。
次の言語を使用してスクレイパーを作成することの長所と短所を誰か説明できますか?
Java/グルーヴィー
パール
PhP
セレン
パイソン
また、スクレイピング中にどのような問題に直面することが予想されるか、そしておそらくどのように対処するべきかについても考えています. たとえば、私はフラグメント ID に遭遇しましたが、まだそれを処理する方法を見つけていません。(私はhtmlunitを使用しています)
トピックについて少し知っている人のためのいくつかの指針を探しています。