0

インタラクティブなWeb アプリケーションから特定の情報をスクリーン スクレイピングする必要があります。さらに言えば、その Web アプリケーションのユーザーがそのフォームを送信 (おそらく POST) したら、フォームからその情報をスクリーン スクレイピングする必要があります。

そのためにどのようなオプションや選択肢がありますか?

ソリューションは侵襲性を最小限に抑える必要があります。つまり、Fiddler に頼ることはできません。また、フットプリントを小さくする必要があります (つまり、これを実現するためにあまりにも多くのサードパーティのアプリやツールをインストールすることはできません)。

スクリーン スクレイピングされるデータは、デスクトップ システムのバックグラウンドで実行される C# アプリケーションと結び付けられます。これは Windows ベースのデスクトップ システムです。

上記の制約が満たされている限り、Ruby、Python などの非 C# ベースのソリューションに対して完全にオープンです。

4

2 に答える 2

0

要件について正しく理解したかどうかはわかりませんが、Rubyを知っているので、Mechanizeを使用するだけで十分だと思います。これは非常に強力なWeb自動化ライブラリであり、セットアップも簡単です。

Windowsでの設定方法については、次の記事を確認してください。

http://webmites.org/ruby-mechanize-web-scraping-made-easy/

そして、ここでMechanizeのドキュメントを参照できます。

http://mechanize.rubyforge.org/GUIDE_rdoc.html

于 2012-07-06T07:31:34.907 に答える
0

C# には htmlagilitypack がありますが、私なら ruby​​ mechanize または watir/selenium を使用します

于 2012-07-05T23:23:17.513 に答える