無効な HTML ソースを分析するために Saxon 9 を使用しています。具体的には、html には次のような href 値があります。
<a href="blah.asp?fn=view&g_varID=1234">テキスト</a>
エラーが発生します:
"XML パーサーによって報告されたエラー: エンティティ "g_varID" への参照は、';' で終わる必要があります デリミタ。"
xml パーサーは「&g_varID」文字列を読み取り、「;」が必要であると不平を言っています。エンティティを区切る。しかし、もちろん、これは HTML エンティティとして意図されたものではなく、単なる URI の一部です。
パーサーにそれを無視するように指示するにはどうすればよいですか? 注: 私は、Saxon-SA ではなく、非スキーマ対応の Saxon を使用しています。