私は次のXMLファイルを持っています:
<class id="1" name="good/bad">
<verb>
<token>like</token>
<token>feel</token>
</verb>
<mess>This is <sugg>not</sugg> text</mess>
<id type="incorrect">I'm glad to <marker>unsee you</marker>.</id>
<id type="correct">I'm glad to see you.</id>
</class>
特定のタグからテキストを抽出する必要があります。http://effbot.orgには非常に少数の例があり、一般的に不十分なドキュメントです。多分どこかに良い例がありますか?また、同じタグ(トークン)内のテキストを個別のエンティティとしてどのように処理しますか?前もって感謝します!結果はおおよそ次のようになります。
(like) feel > not #This is not text