PHPまたはJavaを使用したWebサイトのスクレイピングは簡単に実装できますが、私の質問は、サーバー側ではなくJavaScriptでこれを行うことができるかどうか、クライアントコンピューターでスクレイピングを行うかどうかです.
その背景には、Web サイトがサーバーまたはサーバー ファームをブロックする可能性があるというものがありますが、ユーザーのコンピューターにスクレイピングを許可し、その情報をサーバーに投稿すれば、サーバーのブロックを回避できます。
- 特定の情報を抽出するために、JavaScript で Web サイトをスクレイピングし、CSS セレクターまたは正規表現を使用して HTML を解析できますか?
- javacript で使用するコードを保護できますか?それとも、スクレイピング アルゴリズムを人が読めるようにする必要がありますか?
- 次に、結果を AJAX 経由でサーバーに送信した場合、それがスクリプトであり、悪意のあるユーザーによってデータが操作されたものではないことをどのように確認しますか?
これを達成するための適切なフレームワークはありますか、それともサーバー側のスクレイピングを続行する必要がありますか?