問題タブ [jtidy]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
0 に答える
60 参照

jtidy - JTidy によるデンマーク文字の変換のエスケープ

HTMLページをXHTMLに解析するためにJTidyを使用しています。HTML にデンマーク語の文字が含まれている場合、JTidy はそれらを特定の文字に変換します。

例: 「Observér」という単語は「Observér」に変換されます。

これを回避する方法はありますか?

0 投票する
0 に答える
401 参照

java - JTidyDoctypeエラーブロックの解析

私はJTidyを使用していくつかのオンラインのものをスクレイプしようとしましたが、この厄介なエラーが発生し、それを修正する方法やJTidyに無視させる方法がわかりません。

これはばかげたエラーのようです。他にエラーはないので、これがJTidyによるドキュメントの解析をブロックしているようです。HttpURLConnectionから直接InputStreamから解析しており、メソッドTidy.parseDomを使用しています。

0 投票する
0 に答える
298 参照

java - JTidy で XML プロローグのエンコーディング属性を設定するには?

JTidy を使用して HTML ファイルから XML を生成する必要があります。ソースのエンコーディングは GB2312 なので、生成される XML のエンコーディングも GB2312 に設定する必要があります。

現在の XML プロローグ:

必要なもの:

どうすればこれを達成できますか?

0 投票する
2 に答える
723 参照

java - JTidy からすべての出力を削除するには?

次のように、JTidy を使用して一部の XML をクリーンアップしています。

問題は、常に次のように出力されることです。

何かを出力しないようにするにはどうすればよいですか? 私は試した:

、ここに示すように、しかしそれもうまくいきませんでした。

0 投票する
1 に答える
1228 参照

java - 特定のエラーや警告を無視するようにJTidyを構成できますか?

JTidyを使用して、Javaで生成されたHTMLのスニペットをレンダリングクラスで検証しています。特定の警告とエラーを無視したいと思います。

(編集:考え直して、エラーを抑制したくないかもしれません)

たとえば、生成される次のスニペットは次のとおりです。

この警告が発生します:

line 5 column 7 - Warning: img lacks "alt" attribute

このような特定のチェックを無視するようにJTidyを構成できますか?

私がチェックするために使用する方法は次のとおりです。

0 投票する
3 に答える
12908 参照

java - HTMLをXHTMLに変換するJTidyjavaAPI

JTidyを使用してHTMLからXHTMLに変換していますが、XHTMLファイルでこのタグを見つけました 。防ぐことはできますか?
これは私のコードです

0 投票する
1 に答える
1996 参照

java - Java:htmlテキストからxhtmlテキストへのJtidy変換

JTidyを使用していますが、ファイルではなく文字列を入力として指定したいと思います。それは可能ですか?どうすればそれができますか?

これは私のコードです:

0 投票する
1 に答える
255 参照

java - JTidyおよびブール属性

次のようなラジオボタンがあります、

tidyの解析後、3つの属性を持つノードとその問題があります。ブール属性を解析するようにtidyを構成する方法は?ありがとう。

PS My Tidy構成:

ありがとう!

0 投票する
1 に答える
945 参照

java - JTidyを使用してhtmlから目的のタグを削除します

私は HTML の解析に JTidy と xpath を使用していますが、テキストの解析には b タグが含まれている可能性があるため、しばらくの間、少し問題が発生します。そのため、子ノードをループしたくなく、単に 'b' タグを後で削除します。 html をロードします。

DOM ドキュメントからタグを削除するにはどうすればよいですか。

たとえば、そのための擬似コード-doc.removeTag('<b>');

出来ますか ?