私の最初のプロジェクトは、銀行のデータを取得し、テンプレート内のデータをサーバーに再公開する単純なスクレーパーです。ここまでは順調ですが、最後のステップはわかりません。
このスクリプトは、1 時間に 1 回だけ CRON JOB を使用して停止する必要があります。cron ジョブ ページの読み込みが原因でスクリプトが実行されるたびに、配列から 1 つの URL をデータに使用する必要があります。だから私はこのコードを書き、それはページをスクレイピングし、ページを構築し、ページを完璧に公開します.
ただし、配列から 1 つの値 (url) のみを公開し、次の配列値まで反復しません。
以下は、foreach ステートメントとブレークを成功させるために使用しているコードです。
$i = 0; // set counter
foreach($urlscrape_data as $links_to_loop => $link_to_post){
$master_data = file_get_contents($link_to_post);
if (++$i == 1) {
break;
}
}
以下は、私が作成した $urlscrape_data 配列のサンプル var_dump です。
array(6) { [0]=> string(43) "http://www.somesite.com/some-page.htm" [1]=> string(44)
"http://www.somesite.com/some-page2.htm" [2]=> string(44) "http://www.somesite.com/some- page3.htm"
[3]=> string(44) "http://www.somesite.com/some-page4.htm" [4]=> string (44) "http://www.somesite.com/some-page5.htm"
[5]=> string(44) "http://www.somesite.com/some-page6.htm" } 761
ページの読み込み時にスクリプトを 1 回実行すると、毎回 [5] キーの値 (URL) が使用されます。ある時点で [0] キー値を実行しましたが、それを 10 回続けて実行しました。[1]-[4] キーを実行することはありません。私のコードでは、すべてが使い果たされるまで次の値が使用されると考えていました。読んでくれてありがとう!