Web-Harvest ライブラリを使用して作成されたアプリケーションでいくつかの問題をテストしましたが、役に立ちませんでした。私たちのネットワーク環境にはプロキシと他のフィルターが混在しており、問題のある User-Agent 文字列を除外しようとしています。
アプリケーションで文字列を指定する方法に問題があると思いますが、提供された文字列をデバッグ用に出力する方法がわかりません。
IDE デバッガー内で文字列を確認できますが、他のユーザーがサーバーでテストできるように、この出力が必要です。
Web-Harvest ライブラリを使用して作成されたアプリケーションでいくつかの問題をテストしましたが、役に立ちませんでした。私たちのネットワーク環境にはプロキシと他のフィルターが混在しており、問題のある User-Agent 文字列を除外しようとしています。
アプリケーションで文字列を指定する方法に問題があると思いますが、提供された文字列をデバッグ用に出力する方法がわかりません。
IDE デバッガー内で文字列を確認できますが、他のユーザーがサーバーでテストできるように、この出力が必要です。
実行後に http オブジェクトを照会することにより、ヘッダー (および http プロセッサーに関するその他の情報) を出力できます。以下は、ヘッダー情報を webharvest 変数に保存するコード例です。
<config>
<http url="${yoururl}"></http>
<script><![CDATA[
String keys="";
for(int i=0;i<http.headers.length;i++) {
keys+=(http.headers[i].key + "=" + http.headers[i].value +"\n---\n");
}
SetContextVar("myCookie", keys);
]]>
</script>
</config>
myCookie 変数は次のようなものを返します。
Server=Apache
---
Content-Language=en-GB
---
Pragma=no-cache
---
Cache-Control=no-cache,no-store,must-revalidate
---
Expires=0
---
Content-Type=text/html;charset=UTF-8
---
Date=Thu, 17 Jul 2014 14:35:41 GMT
---
Transfer-Encoding=chunked
---
Connection=keep-alive
---
Connection=Transfer-Encoding
---
Set-Cookie=Unique=%1%enc%3~~~ Domain=~~~; Path=/; Expires=Sat, 16 Jul 2016 14:35:40 GMT; HttpOnly
---
Set-Cookie=Session=%1%V2ID~~~
---
Set-Cookie=ServerPool=A; Domain=~~~
---
Set-Cookie=005db%3Bhac01a%3A10023%3B;
---
Set-Cookie=ReturnTo=%1%%2F~~~
---