私は自分のウェブサイトの改ざんを検出する方法に取り組んでいます。ウェブサイト全体をクロールし、ページごとにスクリーンショットを撮るか、ウェブサイトを画像としてレンダリングし、ページが最後にチェックされたときと比較します。
言語に関係なく、Web ページ全体 (HTML、CSS、JS) をスクリーンショットのような画像に変換する方法を探しています (ただし、Java、Python、または C# が望ましいです)。
サーバー上で高速で使用できるようにする必要があります。
私はすでにJavaで次のことを試しました:
- CssBox ですが、レンダリングが十分ではありません (JS なし)
- Selenium Web Driverですが、遅すぎて(Firefoxを開く時間、ページを表示する時間など...)、GUIなしでは使用できません
解決策は Web エンジンの一種のラッパーになると思いますが、それについては何も見つかりませんでした (少なくとも Java では)。PhantomJS がこのニーズに適していると言われましたが、正しいですか?
完璧な結果は、次のようなものを作成することです: http://www.page2images.com/home