1

クライアント側のみのhtmlエディターのテキストボックスにページのソースをロードしようとしています。本文だけでなく、Web ページのソース全体を取得できる必要があります。この yql クエリは本体のみを返します。

http://query.yahooapis.com/v1/public/yql?format=xml&callback=editor.handleLoad&q=select+*+from+html+where+url%3D%22example.com%22

ソース全体を取得する方法はありますか、またはできる他の無料の json-px Web サービスはありますか?

4

1 に答える 1

1

YQL でこれを行う明確な方法はわかりませんが、うまくいくと思われる Yahoo Pipe を次に示します。robots.txt で許可されていないサイトの取得を拒否しますが、他のサイトのソース全体を取得しています。

http://pipes.yahoo.com/pipes/pipe.info?_id=dCsGDO123hG6BNv70EypaA

デフォルトは www.example.com に設定されていますが、そのページの robots.txt のために拒否されています。ただし、URL をパラメーターとして受け入れます。pipes.yahoo.com のソースを取得し、JSON でラップされた結果を返すこのパイプの使用例へのリンクを次に示します。

http://pipes.yahoo.com/pipes/pipe.run?_id=dCsGDO123hG6BNv70EypaA&_render=json&url=http%3A%2F%2Fpipes.yahoo.com%2F

これは役に立ちますか?

于 2009-07-22T18:33:59.897 に答える