cfhttpを使用して、ページから情報を解析するためのページを取得しようとしています。私が呼んでいるページヘッダーは次のとおりです。
コンテンツエンコーディング:gzip
接続:Keep-Alive
コンテンツ-長さ:19066
サーバー:IBM_HTTP_Server
変更:Accept-Encoding、User-Agent
コンテンツ-言語:en-US
キャッシュ制御:no-cache = "set-cookie、
set-cookie2 "
コンテンツタイプ:
text / html; charset = ISO-8859-1
文字セットをISO-8859-1に設定しましたが、FileContentで次のようになります(以下に示すのは小さなサンプルのみですが、わかりやすいと思います)。
EðÑq・Oã?・Ì\ZóL¯þ´Vú5ðbä£ÿæ¾_HÉÒñQãO\Çþãë85ÁÜà±°ùÖ}&bßý?、u?2SùQyk5g?UÛ3Ѹfã×ARÃi_iûRã
"b /¯ßíWÝÆ´}w~,°iøÜCáÇþ@ÃZ5¤ïsÁ8½°ì* ZÜéjOÝK/Ë4§ÈG5×ä*¬6ÚwÇ0]ã:àÑþé¬G"ÅÁl/t° jlá»5¶&¯lìYìºØ'yDð½|#ý<ñìTé%¾ï¬ùƪx¶}«±o9»ë¼ÂÆÒï'w8Y?÷ðxsllû6íqüGÞsÜóÀx・ªk®XºàåZ{íÁ½åo÷mbq¥ÝÃ8M
他の文字セットを試し、gzipエンコーディングが問題の原因であると考えていましたが、それが問題であるかどうかをテストする方法がわかりません。どんな提案や助けも大いに評価されるでしょう。
以下は私のコードです
<cfhttp
METHOD="get"
throwonerror="yes"
CHARSET="ISO-8859-1"
URL="http://www.cars.com/for-sale/searchresults.action?sf1Dir=DESC&prMn=1&crSrtFlds=stkTypId-feedSegId-pseudoPrice&rd=100000&zc=44203&PMmt=0-0-0&stkTypId=28881&sf2Dir=ASC&sf1Nm=price&sf2Nm=miles&feedSegId=28705&searchSource=UTILITY&pgId=2102&rpp=10">
<cfhttpparam type="Header" name="Accept-Encoding" value="deflate;q=0">
<cfhttpparam type= "Header" name= "TE" value= "deflate;q=0" >
</cfhttp>
<cfset listings = #cfhttp.FileContent#>
<cfoutput>
#listings#
</cfoutput>
私もヘッダーを試しました:
<cfhttpparam type="Header" name="Accept-Encoding" value="*">
<cfhttpparam type= "Header" name= "TE" value= "deflate;q=0" >
そして、「Accept-Encoding」ヘッダーを削除して、TEをそのままにしてみました。
更新: 私はまだそれを理解していませんが、誰かが私を助けるのを助けるかもしれない何かを見つけました。私のテストphpサーバーを使用して同じページでfile_get_contentsを実行し、それが正常に機能した場合、同じcfhttpコードを実行して、ページを呼び出していたphpページを呼び出すと、問題なく機能しました。これまでの提案に感謝します。