0

Web-Harvest ライブラリを使用して作成されたアプリケーションでいくつかの問題をテストしましたが、役に立ちませんでした。私たちのネットワーク環境にはプロキシと他のフィルターが混在しており、問題のある User-Agent 文字列を除外しようとしています。

アプリケーションで文字列を指定する方法に問題があると思いますが、提供された文字列をデバッグ用に出力する方法がわかりません。

IDE デバッガー内で文字列を確認できますが、他のユーザーがサーバーでテストできるように、この出力が必要です。

4

1 に答える 1

0

実行後に http オブジェクトを照会することにより、ヘッダー (および http プロセッサーに関するその他の情報) を出力できます。以下は、ヘッダー情報を webharvest 変数に保存するコード例です。

<config>
    <http url="${yoururl}"></http>

    <script><![CDATA[
            String keys="";
            for(int i=0;i<http.headers.length;i++) {
                keys+=(http.headers[i].key + "=" + http.headers[i].value +"\n---\n");
            }
            SetContextVar("myCookie", keys);
        ]]>
     </script>


</config>

myCookie 変数は次のようなものを返します。

Server=Apache
---
Content-Language=en-GB
---
Pragma=no-cache
---
Cache-Control=no-cache,no-store,must-revalidate
---
Expires=0
---
Content-Type=text/html;charset=UTF-8
---
Date=Thu, 17 Jul 2014 14:35:41 GMT
---
Transfer-Encoding=chunked
---
Connection=keep-alive
---
Connection=Transfer-Encoding
---
Set-Cookie=Unique=%1%enc%3~~~ Domain=~~~; Path=/; Expires=Sat, 16 Jul 2016 14:35:40 GMT; HttpOnly
---
Set-Cookie=Session=%1%V2ID~~~
---
Set-Cookie=ServerPool=A; Domain=~~~
---
Set-Cookie=005db%3Bhac01a%3A10023%3B;
---
Set-Cookie=ReturnTo=%1%%2F~~~
---
于 2014-07-17T14:43:39.040 に答える