1

オフラインで使用するオンライン ヒンディー語辞書をダウンロードする必要があります。辞書内のすべての単語には、php で生成されたページがあります。これらのページの URL は次のとおりです: http://pustak.org/home.php?mean=XX は数字を表します。

したがって、辞書の最初の単語は に移動することで見つけることができhttp://pustak.org/home.php?mean=1、2 番目の単語はhttp://pustak.org/home.php?mean=2、というようになります。

これらのページをすべてプログラムでダウンロードし、個別の html ファイルとして保存するにはどうすればよいですか?

PS: ご参考までに、私がこれを行っているのは、旅行中に iPod Touch でオフラインで参照するためにヒンディー語の辞書が必要だからです (Touch にはセルラー データがないため)。私はたくさんのヒンディー語辞書アプリを試しましたが、この無料のオンライン辞書の品質と定義数に匹敵するものはありません. したがって、私の計画は、すべてをhtmlファイルとしてダウンロードし、全文検索をサポートするiOSファイルシステムアプリにすべて保存し、独自のオフライン辞書を作成することです...

助けてください!

4

2 に答える 2

1

少し異なるアプローチ、私は個人的にHTTrackを使用します

ホームページから:

HTTrack は無料 (GPL、libre/フリー ソフトウェア) で使いやすいオフライン ブラウザ ユーティリティです。

これにより、World Wide Web サイトをインターネットからローカル ディレクトリにダウンロードし、すべてのディレクトリを再帰的に構築し、HTML、画像、およびその他のファイルをサーバーからコンピュータに取得できます。HTTrack は元のサイトの相対的なリンク構造を調整します。「ミラーリングされた」Web サイトのページをブラウザーで開くだけで、オンラインで閲覧しているかのように、リンクからリンクへとサイトを閲覧できます。HTTrack は、既存のミラー サイトを更新し、中断されたダウンロードを再開することもできます。HTTrack は完全に構成可能で、統合されたヘルプ システムがあります。

Web サイトによると、Windows 2000 / XP / Vista / Seven と Linux のいくつかのフレーバーをサポートしています。

ダウンロードしたファイルを、あなたが言及したこのiOSアプリにインポートできると思います。

于 2012-12-12T12:04:49.523 に答える
0

You can try it with file_get_contents:

$max = 100000 //total num of words to get

for($cont=1; $cont<$max; $cont++){
    $sourceCode = file_get_contents('http://pustak.org/home.php?mean=$cont');

    if(!file_put_contents('/path/word'.$cont.'.html',$sourceCode)){
        echo "error with word number".$cont;
        die();
    }
}
于 2012-12-12T12:04:14.967 に答える