5

SGML を使用して構造化された文書がいくつかあり、この構造を記述した DTD ファイルがあります。

このデータを解析するために、誰かが Python-3 互換のライブラリまたはモジュールを推奨してくれませんか? Python 2.x の場合、私の Google-fu はSGMLParserを有効にしているようですが、もちろんそれは非推奨になりました (そして Py3k から完全に削除されました)。

多くの人が を示唆しているようですlxmlが、依存関係の問題のため、それは私にとって選択肢ではありません。

乱雑なマークアップに最適であることはわかってBeautifulSoupいますが、A) py3k と互換性がないと最後に聞いたのですが、B) このコンテンツは適切に構造化されています。

4

1 に答える 1

3

BeautifulSoup は非推奨です。代わりに、Py3k と互換性のある代替を使用してください。

于 2013-03-13T00:59:54.737 に答える