4

CURL または file_get_contents を使用してサード パーティのファイル コンテンツを取得しようとすると、奇妙な動作が発生します。ページのパストは読み取られますが、ランダムな位置で停止します...ただし、エラーは発生しません (タイムアウトなど)。

完全な例を示すと、おそらく最も簡単に確認できます!:

次の非常に基本的なスクリプトを使用して完全な URL を読み取り、コンテンツを返すと、ページの完全なコンテンツ (一部の外部 CSS などを除く) が 1 秒か 2 秒で正常に機能します。

<?php    
set_time_limit(180);
$page = file_get_contents('http://www.fantasyleague.com/Classic/Stats/playerlist.aspx?dpt=3');
echo $page;
?>

ただし、次のように変更すると、

<?php    
set_time_limit(180);
$page = file_get_contents('http://www.fantasyleague.com/Classic/Stats/playerlist.aspx?dpt=4');
echo $page;
?>

実行には時間がかかり、最終的にはページの一部が返されますが、すべてではありません。一貫性はありませんが、通常はページの少し上にある「A Westwood AV 3.6 12」または「show」で終わります。

2 つの URL を見ると、基本的にほとんど同じであることがわかります。そして、この動作は発生し始めたばかりで、1日か2日前までは両方とも正常に機能していました.

何か案は?見逃した情報があれば提供できます!

編集:

ファイルが終了する場所の例...元のファイルには次が含まれます。

<div class="right">
    <a id="Playerlist_help_button" class="button left" href="#"><div>Show help</div></a>
    <a id="Playerlist_filters_button" class="button left" href="#"><div>Show filters</div></a>
    <a class="button left" href="PlayerListPrintable.aspx" target="_blank"><div>Printable Version</div></a>
    <br class="clear" />
</div>

しかし、取得されたデータは次の時点で停止します。

<div class="right">
    <a id="Playerlist_help_button" class="button left" href="#"><div>Show help</div></a>
    <a id="Playerlist_filters_button" class="button left" href="#"><div>Show 

または、失敗することが多い他の場所は次のとおりです。

        <td><div class="chilli normal" /></td>


        <td>12</td>


        <td>0</td>

これは次のようになります。

        <td><div class="chilli normal" /></td>


        <td>12</td>
4

1 に答える 1

0

file_get_contents または curl で一度に html ソースのみを取得できますが、すべてのコンポーネントを取得することはできません

于 2013-01-02T14:09:26.200 に答える