1

nekohtmlパーサーを使用してhtmlコードを解析しています。アンカータグを使用しているときの私の間違いは、コンテンツがこのように書かれていることがあります。

<a href="http://abc.com"><a href="http://abc.com">abc</a></a>

nekohtmlを解析した後、コンテンツをこのように修正したいと思います。

<a href="http://abc.com"></a><a href="http://abc.com">abc</a>

これを実現するには、nekohtml解析の構成を支援してください。

アップデート:

設定を試してみた後

parser.setFeature( "http://cyberneko.org/html/features/balance-tags"、true);

それは役に立たない。期待通りの結果が得られません。それは私が与えたのと同じhtmlコンテンツを返します

4

1 に答える 1

0

balance-tagsNekoHTML パーサーが解析済みドキュメント内のタグのバランスをとろうとするかどうかを指定する機能を設定する必要があります。

config.setFeature( "http://cyberneko.org/html/features/balance-tags", true );

ドキュメントから:

  • タグのバランスをとることで、欠落している親要素を追加し、オプションの終了タグで要素を自動的に閉じ、バランスの取れていないインライン要素タグを修正することで、多くのよくある間違いを修正します。HTML ドキュメントを XML として処理するには、この機能をオフにしないでください。この機能は、ドキュメントの形式が正しくない構造に関係なく、特定の要素、属性、および/またはコンテンツの外観のみを気にするアプリケーションのパフォーマンス強化として提供されます。
于 2011-10-13T06:08:21.900 に答える