0

HTMLの解析を行いました。URL を取得し、Nokogiri を使用して HTML からコンポーネントを抽出できます。それは結構です。

今、私は次のことが可能か、それともまったく意味をなさないのか疑問に思っています:

ブラウザーを見ると、HTML/CSS/JS を解析して視覚的な表現を作成するレンダリング エンジンがあります。そのインメモリDOM解釈にアクセスできるかどうか疑問に思っています。したがって、たとえば、HTML を解析すると、ルート要素からかなり離れた を見つけることができますが、レンダリングすると、ページの上に表示されることがあります (CSS は絶対配置されているため)。ブラウザに表示される画像を取得できるようにしたいと考えています。

HTMLファイルのこの解釈にアクセスできるオープンソースAPIはありますか?それとも、私たちが言っていることはまったく意味をなさないのですか?

4

1 に答える 1

0

ヘッドレス ブラウザー(ユーザーではなくコードに対して機能するレンダリング エンジン) を求めているように思えます。PhantomJS
を見てください。

于 2013-10-09T19:17:42.153 に答える