php - PHP で生成された Web ページをプログラムでダウンロードする

Question

オフラインで使用するオンラインヒンディー語辞書をダウンロードする必要があります。辞書内のすべての単語には、php で生成されたページがあります。これらのページの URL は次のとおりです: http://pustak.org/home.php?mean=XX は数字を表します。

したがって、辞書の最初の単語はに移動することで見つけることができhttp://pustak.org/home.php?mean=1、2 番目の単語はhttp://pustak.org/home.php?mean=2、というようになります。

これらのページをすべてプログラムでダウンロードし、個別の html ファイルとして保存するにはどうすればよいですか?

PS: ご参考までに、私がこれを行っているのは、旅行中に iPod Touch でオフラインで参照するためにヒンディー語の辞書が必要だからです (Touch にはセルラーデータがないため)。私はたくさんのヒンディー語辞書アプリを試しましたが、この無料のオンライン辞書の品質と定義数に匹敵するものはありません. したがって、私の計画は、すべてをhtmlファイルとしてダウンロードし、全文検索をサポートするiOSファイルシステムアプリにすべて保存し、独自のオフライン辞書を作成することです...

助けてください！

score 1 · Accepted Answer

少し異なるアプローチ、私は個人的にHTTrackを使用します

ホームページから：

HTTrack は無料 (GPL、libre/フリーソフトウェア) で使いやすいオフラインブラウザユーティリティです。

これにより、World Wide Web サイトをインターネットからローカルディレクトリにダウンロードし、すべてのディレクトリを再帰的に構築し、HTML、画像、およびその他のファイルをサーバーからコンピュータに取得できます。HTTrack は元のサイトの相対的なリンク構造を調整します。「ミラーリングされた」Web サイトのページをブラウザーで開くだけで、オンラインで閲覧しているかのように、リンクからリンクへとサイトを閲覧できます。HTTrack は、既存のミラーサイトを更新し、中断されたダウンロードを再開することもできます。HTTrack は完全に構成可能で、統合されたヘルプシステムがあります。

Web サイトによると、Windows 2000 / XP / Vista / Seven と Linux のいくつかのフレーバーをサポートしています。

ダウンロードしたファイルを、あなたが言及したこのiOSアプリにインポートできると思います。

score 0 · Accepted Answer

You can try it with file_get_contents:

$max = 100000 //total num of words to get

for($cont=1; $cont<$max; $cont++){
    $sourceCode = file_get_contents('http://pustak.org/home.php?mean=$cont');

    if(!file_put_contents('/path/word'.$cont.'.html',$sourceCode)){
        echo "error with word number".$cont;
        die();
    }
}

php - PHP で生成された Web ページをプログラムでダウンロードする

2 に答える 2

Related

Reference