7

HaskellでUnicodeXMLを処理するための公式の解決策は何か知りたいです。StringHXTがテキストに単純な表現(Unicode文字のリスト!!!)を使用していることに気付きました。

http://hackage.haskell.org/packages/archive/hxt/9.3.1.0/doc/html/Text-XML-HXT-DOM-TypeDefs.html#t:XNode

Constructors
XText String    ordinary text (leaf)
XBlob Blob          text represented more space efficient as bytestring (leaf)

解析するときに、2つの表現からどのように選択しますか?ユーザーに文字のリストを使用させることは、特にXMLドキュメントに多くのテキストコンテンツが含まれている場合は、特に魅力的な機能のようには思えません。

また、 Googleでhttp://hackage.haskell.org/package/hxt-unicodeを見つけましたが、解析でどのように使用するのかわかりません。Unicodeのサポートも以前ははるかに明示的でした:http://hackage.haskell.org/packages/archive/hxt/8.5.2/doc/html/Text-XML-HXT-DOM-Unicode.html しかし、このモジュール明確な理由なしに最新バージョン(執筆時点では9.3.1.0)で削除されました。その背後にある動機は何でしたか?

また、HXTの使用目的のサンプルコードを教えてもらえますか?wikiページはこの点で深刻に欠けています。ありがとうございました。

4

1 に答える 1

3

xml-conduitパッケージは、テキストTextデータを格納するためにデータ型を使用します。これは、過去数年間で標準のテキストデータ表現になりました。xml-conduitは手入れの行き届いたパッケージであり、私は個人的にオープンソースと商用コードの両方で大量に使用しています。

于 2012-10-06T17:36:37.403 に答える