私は dblp XML ファイルを扱っています。私は実際に dblp.xml ファイルを解析し、いくつかのプロジェクトでさらに処理するために有用な情報を抽出したいと考えています。その XML ファイルは非常に巨大 (1.1 GB) で、このファイルを開くことさえできません。
dblp.xml 用の C# パーサーをお持ちの場合、またはこれに関して、または巨大な xml ファイルをどのように解析できるかについてご案内いただけますでしょうか。
XML dom の代わりに XML リーダーを使用します。XML dom はファイル全体をメモリに保存しますが、これはまったく役に立ちません:
http://msdn.microsoft.com/en-us/library/system.xml.xmlreader.aspx
使用する必要がありますXmlReader
これは、データへの高速で非キャッシュの順方向アクセスを提供するリーダーを表しXML
ます。すべてのデータをメモリにロードするわけではなく、大量のデータ セットで使用することになっています。他の組み込み.NET
ソリューションは、完全に生成されたオブジェクト グラフを保持します。