開けない大きなファイルがあります:
... more here
<my_element attr1='123'>
... a lot of text and elements here
</my_element>
<my_element attr1='33'>
... a lot of text and elements here
</my_element>
... more here
「 Nokogiri::XML::Reader を使用して大きな XML ファイルを解析するにはどうすればよいですか?」を試しました。
#!/usr/bin/ruby
require "rubygems"
require "nokogiri"
require "debugger"
require "awesome_print"
file = ARGV[0]
reader = Nokogiri::XML::Reader(File.open(file))
reader.each do |node|
if node.name == "PATDOC"
debugger
break
end
end
しかし、node.attributes
戻ります{}
。
要素から属性と内部テキストを抽出するにはどうすればよいですか?