8

現在、 The Conversations NetworkIT Conversationsポッドキャストを含む)をシャットダウン中です。計画は、インターネットアーカイブで恒久的なホスティングのために私たちのウェブサイトの静的なHTMLバージョンをレンダリングすることです。

現在PHPから動的に生成されている約5,000の動的ページから静的HTMLを生成する最も簡単な方法は何ですか?

コードを微調整してPHP出力をキャッシュし、ファイルに書き込んでから、サイトマップをたどってすべてのページを生成できることはわかっています。しかし、私たちが考慮すべきオプションがあるかどうか疑問に思います。これを実行し、HTMLをそのままスクレイピングするためのツールはありますか?(Acrobat Pro以外のもの?)

残念ながら、かなりの数のAjax呼び出しもあり、これによりこれがさらに困難になります。最初にAjaxを解除する必要があると思います。

4

2 に答える 2

5

それはあなたが探しているものではないかもしれません。ただし、HTTrackはWebサイトを参照してリンクを探し、そのHTMLバージョンを保存します。このミラーには、画像、css、javascriptなど、リンクされているすべての静的コンテンツが含まれます。

私が考えることができる唯一の問題は、AJAXスクリプトがサーバーから重要なデータをプルしている場合ですが、おそらくHTTrackにはその設定があります。

于 2012-09-26T20:41:57.997 に答える
2

「 TeleportPro」(残念ながら有料ソフトウェア)と呼ばれる優れたソフトウェアがあり、Webサイトの閲覧可能/複製コピーを作成できます。サーバーにアップロードすると、元のサイトとまったく同じように機能するはずです。

ただし、動的ページから静的htmlを作成する場合は、次の点に注意してください。

  • 現在のajax呼び出しは、ajaxされていない必要があります(自分で言ったように)
  • .htaccess設定、たとえばmod_rewriteは、静的ファイルを無価値にする可能性があります。リンクが機能しない可能性があるためです。

しかし、「Teleport pro」は、かなり前から存在している本当に堅実なプログラムです。私は過去にそれを使用しました、そしておそらく再びそれを使用するでしょう。


別のアプローチは、キャ​​ッシュを作成するphpモジュール「php-apc」かもしれません。この場合、完全なキャッシュを作成する前に、サイト全体をクロールする必要があります。私はそれにあまり慣れていませんが、インストールは簡単に実行でき、生成されたファイルが役立つかどうかを確認できます。

于 2012-09-26T19:53:47.120 に答える