Java と SAX を使用して、検索エンジンから RSS 検索機能を実装しています。ただし、一部の検索結果は整形式ではありません。つまり、<title>
一部のエントリのタグの本文には、etc の&
代わりに文字が含まれています&
(たとえば、 のようなものStarsky & Hutch
)。
RSS を解析するorg.apache.harmony.xml.ExpatParser&ParseException
と、 が返され、検索全体が中断され、何も返されません。
Firefox の RSS リーダーのように、パーサーがこれらのエラーを回避できるようにしたいと考えています。この問題を修正して RSS フィードを解析する可能性はありますか?