0

Java と SAX を使用して、検索エンジンから RSS 検索機能を実装しています。ただし、一部の検索結果は整形式ではありません。つまり、<title>一部のエントリのタグの本文には、etc の&代わりに文字が含まれています&amp;(たとえば、 のようなものStarsky & Hutch)。

RSS を解析するorg.apache.harmony.xml.ExpatParser&ParseExceptionと、 が返され、検索全体が中断され、何も返されません。

Firefox の RSS リーダーのように、パーサーがこれらのエラーを回避できるようにしたいと考えています。この問題を修正して RSS フィードを解析する可能性はありますか?

4

1 に答える 1

1

SAX の実装は通常、エラーを検出して例外をスローするように設計されており、これを回避する標準的な方法はありません。私が考えることができる最も合理的な方法は、SAX にストリーミングする前に、迷子や文字などのエラーにパッチを当てることです。

于 2012-03-13T17:50:16.310 に答える