問題タブ [jtidy]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
jtidy - JTidy によるデンマーク文字の変換のエスケープ
HTMLページをXHTMLに解析するためにJTidyを使用しています。HTML にデンマーク語の文字が含まれている場合、JTidy はそれらを特定の文字に変換します。
例: 「Observér」という単語は「Observér」に変換されます。
これを回避する方法はありますか?
java - JTidyDoctypeエラーブロックの解析
私はJTidyを使用していくつかのオンラインのものをスクレイプしようとしましたが、この厄介なエラーが発生し、それを修正する方法やJTidyに無視させる方法がわかりません。
これはばかげたエラーのようです。他にエラーはないので、これがJTidyによるドキュメントの解析をブロックしているようです。HttpURLConnectionから直接InputStreamから解析しており、メソッドTidy.parseDomを使用しています。
java - JTidy で XML プロローグのエンコーディング属性を設定するには?
JTidy を使用して HTML ファイルから XML を生成する必要があります。ソースのエンコーディングは GB2312 なので、生成される XML のエンコーディングも GB2312 に設定する必要があります。
現在の XML プロローグ:
必要なもの:
どうすればこれを達成できますか?
java - JTidy からすべての出力を削除するには?
次のように、JTidy を使用して一部の XML をクリーンアップしています。
問題は、常に次のように出力されることです。
何かを出力しないようにするにはどうすればよいですか? 私は試した:
、ここに示すように、しかしそれもうまくいきませんでした。
java - 特定のエラーや警告を無視するようにJTidyを構成できますか?
JTidyを使用して、Javaで生成されたHTMLのスニペットをレンダリングクラスで検証しています。特定の警告とエラーを無視したいと思います。
(編集:考え直して、エラーを抑制したくないかもしれません)
たとえば、生成される次のスニペットは次のとおりです。
この警告が発生します:
line 5 column 7 - Warning: img lacks "alt" attribute
このような特定のチェックを無視するようにJTidyを構成できますか?
私がチェックするために使用する方法は次のとおりです。
java - HTMLをXHTMLに変換するJTidyjavaAPI
JTidyを使用してHTMLからXHTMLに変換していますが、XHTMLファイルでこのタグを見つけました
。防ぐことはできますか?
これは私のコードです
java - Java:htmlテキストからxhtmlテキストへのJtidy変換
JTidyを使用していますが、ファイルではなく文字列を入力として指定したいと思います。それは可能ですか?どうすればそれができますか?
これは私のコードです:
java - JTidyおよびブール属性
次のようなラジオボタンがあります、
tidyの解析後、3つの属性を持つノードとその問題があります。ブール属性を解析するようにtidyを構成する方法は?ありがとう。
PS My Tidy構成:
ありがとう!
java - JTidyを使用してhtmlから目的のタグを削除します
私は HTML の解析に JTidy と xpath を使用していますが、テキストの解析には b タグが含まれている可能性があるため、しばらくの間、少し問題が発生します。そのため、子ノードをループしたくなく、単に 'b' タグを後で削除します。 html をロードします。
DOM ドキュメントからタグを削除するにはどうすればよいですか。
たとえば、そのための擬似コード-doc.removeTag('<b>');
出来ますか ?