XML コンテンツを解析するために python の xml.sax ライブラリを使用しています。XML ファイルのいくつかのタグに HTML タグがあります。たとえば、次のように言いましょう。
<Car>
<Color> Blue</Color>
<Size> 1500 </Size>
<Description><p>This is <b>new in the market</b></p></Description>
</Car>
だから私が現在得ているのは
Color : Blue
Size : 1500
Description : <
Description : p
Description : >
Description : This is
Description : <
Description : b
Description : >
Description : new in the market
.... and so on.
私が欲しいのは、返すことです:
Description - <p>This is <b>new in the market</p>
ファイルが非常に大きいので、手動で CDATA 内の HTML タグを使用することはできません。さらに、ファイル内のすべてのコンテンツを表示する必要があります。これを乗り越える方法はありますか?