完全に悪意のない目的、特に機械学習のために、CAPTCHA 画像の膨大なデータセットをダウンロードしたいと考えています。ただし、CAPTCHA は常に難読化された JavaScript を使用して実装されているため、ブラウザーなしで実際の画像を取得することは、少なくとも JavaScript の初心者である私にとっては簡単なことではありません。
では、完全にブラウザの外部でスクリプトを使用して、あいまいな単語の画像をダウンロードする方法について、役立つヒントを誰か教えてもらえますか? また、すでに収集されたあいまいな単語のデータセットを教えてはいけません。この特定の実験のために、特定の Web サイトから画像を収集する必要があります。
ありがとう!
編集:この質問をする別の方法は非常に簡単です。複雑な JavaScript を使った Web サイトで「ソースを表示」をクリックすると、スクリプトの参照が表示されますが、それだけです。ただし、[Web ページを名前を付けて保存] (Firefox の場合) をクリックして、保存されたWeb ページのソースを表示すると、JavaScript が解決され、新しい html と画像 (少なくとも ASIRRA と reCAPTCHA の場合) が表示されます。ソースで。スクリプトを使用して、この「Web ページを名前を付けて保存」の動作を模倣するにはどうすればよいですか? これは一般的に重要な Web コーディングの質問なので、私の動機について私に質問するのはやめてください! これは、これからスクリプトを含むすべての Web 開発で使用できる知識であり、他のスタック オーバーフローの訪問者も同様に使用できると確信しています!