3

Hpricot を使用してテーマ ファイルを解析しています。ただし、有効な HTML5 ドキュメントを Hpricot() にフィードすると、HTML5 タグ ( など<section>) が自動的に閉じられ、DOCTYPE.

HTML5 ドキュメントを正しく解析できるようにする Hpricot の拡張機能、または設定する必要があるフラグはありますか?

4

2 に答える 2

2

直接の質問を回避できることは知っていますが、質問投稿のコメントの一部に記載されているように、 Nokogirihttp : //nokogiri.org/を試してみることをお勧めします。HTML5を含む構造化テキストのようなHTML/XMLの解析に問題はありませんでした。

于 2011-01-30T07:21:25.547 に答える
0

I think Hpricot's to_original_html method is exactly what you're looking for.

From the docs, to_original_html

Attempts to preserve the original HTML of the document, only outputing new tags for elements which have changed.

于 2011-02-24T21:58:26.207 に答える