逆マークダウン Ruby gem を使用して、HTML ページをマークダウンに変換しようとしています。残念ながら、次のように失敗します。
/usr/lib/ruby/1.9.1/rexml/parsers/treeparser.rb:95:in `rescue in parse': #<REXML::ParseException: Missing end tag for 'img' (got "td") (REXML::ParseException)
ソースには、 ではなく で終わる 、 などのタグが含まれIMG
ていINPUT
ます。>
/>
私はtidy_ffi gemを試しました:
doc = Nokogiri::HTML(TidyFFI::Tidy.new(Nokogiri::HTML(page).to_html,
:numeric_entities => 1,
:output_html => 1,
:merge_divs => 0,
:merge_spans => 0,
:join_styles => 0,
:clean => 1,
:indent => 1,
:wrap => 0,
:drop_empty_paras => 0,
:literal_attributes => 1).clean)
しかし、それは違いはありませんでした。助言がありますか?