0

ここにはいくつかのスクリーンスクレイピングスレッドがあることは知っていますが、どれも満足のいくものではありませんでした.

javascript を使用して外部 Web ページから HTML をスクレイピングしようとしています。私は $.ajax を使用していますが、すべて正常に動作するはずです。これが私のコードです:

$.ajax({
    url: "my.url/path",
    dataType: 'text',
    success: function(data) {
        var myVar = $.get(url);
        alert(myVar);
    }
});

唯一の問題は、Web サーバー内で指定された URL を探していることです。プロキシを使用して外部 Web ページにアクセスするにはどうすればよいですか?

4

1 に答える 1

0

クロス サイト スクリプティングの制限により、目的の URL をサーバー上のページに渡す必要があります。このページはサーバー側から問題の URL をクエリし、結果を返します。以下のスレッドを見て、それをアプリケーションに組み込み、そのページが AJAX 関数によってヒットされたときにソースを返すようにします。

Ruby で Web ページの HTML ソースを取得する方法

GET リクエストを使用すると、サーバーをフェッチするページの URL を転送する最も簡単な方法になるため、次のようなものを呼び出すことができます。

$.ajax("fetchPage.rb" + encodeURI(http://www.google.com))

問題の側にサーバーから直接アクセスすることはできないため、リクエストを機能させるには、プロキシを介してサーバー側のスクリプトをパイプする必要があります。これは、設定によって異なります。Ruby の Proxy クラスを見てみましょう。

http://ruby-doc.org/stdlib-1.9.3/libdoc/net/http/rdoc/Net/HTTP.html#method-c-Proxy

于 2012-09-21T17:46:53.153 に答える