私は自分のhtmlドキュメントにこの構造を持っています:
<p>
"<em>You</em> began the evening well, Charlotte," said Mrs. Bennet with civil self–command to Miss Lucas. "<em>You</em> were Mr. Bingley's first choice."
</p>
しかし、それを処理できるようにするには、「プレーンテキスト」をタグでラップする必要があります:)
<p>
<text>"</text>
<em>You</em>
<text> began the evening well, Charlotte," said Mrs. Bennet with civil self–command to Miss Lucas. "</text>
<em>You</em>
<text> were Mr. Bingley's first choice."</text>
</p>
これを達成する方法はありますか?私はtagsoupとjsoupを見てきましたが、これを簡単に解決する方法はないようです。たぶん、派手な正規表現を使用しています。
ありがとう