0

今日のプレリリース ドメイン .txt ファイルのリストをダウンロードして保存する関数を作成する必要があります。 http://www.namejet.com/pages/downloads.aspx. 今日は 10 月 8 日なので、「2012 年 10 月 8 日月曜日」というファイルを取得します。リクエストで試しましたが、うまくいきませんでした。ファイルが固定の URL に保存されておらず、Javascript の背後に隠されているため、問題が発生しています。

4

2 に答える 2

2

ASP.NETのポストバックシステムを扱っているので、これは少し注意が必要です。これが個人的なスクリプト以外の場合は、他のサイトのデータを効果的に使用しているだけでなく、そのソフトウェアもリバースエンジニアリングしているので注意が必要です(ただし、IANALであり、Webでのこれらの問題に関する合法性についてはわかりません。システム)。

やりたいことは、POSTデータをチェックして(Firebug、Chrome開発者ツールなどを使用して)、フォームオブジェクトの属性__EVENTTARGETと属性を探すことです。__VIEWSTATE読み取り可能にするには、をデコードする必要があります( http://ignatu.co.uk/ViewStateDecoder.aspx__VIEWSTATEを確認してください)。そこから、探しているデータを取得する方法を理解できるはずだと思います。

Pythonからは、次のように簡単です。

from urllib2 import urlopen
from urllib import urlencode

data = urlopen('url', urlencode({
    '__VIEWSTATE': 'foo',
    '__EVENTTARGET': 'bar',
})).read()
于 2012-10-08T06:25:33.887 に答える
1

実際には、base64でエンコードされたいくつかのリクエストパラメータを含むPOSTリクエストに応答してテキストファイルを取得します。お気軽に遊んでください

Firebugまたはその他のデバッグツールを使用して、POSTのコンテンツとパラメーターを確認します

于 2012-10-08T05:30:38.753 に答える