問題タブ [jtidy]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
servlets - ClassNotFoundException JTidy
myeclipse を使用してサーブレットを実行します。doPost 関数には 1 つの文がありTidy tidy = new Tidy();
ますが、サーブレットを実行すると、次のようなエラーが発生します。
私はすでにこれをやったimport org.w3c.tidy.Tidy;
このエラーが表示されるのはなぜですか? で何らかの構成が必要だからweb.xml
ですか?もしそうなら、どうすればこれを行うことができますか?
java - HTML コードをプログラムで検証する
String
HTMLコードの検証を試みています。つまり、HTML コードの構文が間違っている場合は、おそらくreturn false
.
私は現在JTidyを使用していますが、それを修正するだけで悪い構文があったことを教えてくれません。シンタックスが悪いか良いかを言うだけで修正する必要はありません。
JTidy コード:
どんな助けでも感謝します。
java - テキストを含む親から NodeList を取得する
特定のテキストを含む親ノードからすべての子ノードを取得したいと考えています。言い換えれば、必要な文字列が含まれていると確信している特定の子ノードで検索を開始します。見つかったら、同じ Xpath 式に一致するノードから他のすべての文字列を取得するのではなく、同じレベルの他のノードを取得する必要があります。私はJavaを使用しています。例えば:
IIND1000 を探す場合、その tr タグ内のすべての td 要素 (10110,IIND1000, 1, 3, INTROD. INGEN. INDUSTRIAL, 100, 100, 0) を取得したいと考えています。これは Jtidy で可能ですか? ヒントや推奨事項はありますか?ありがとう。
java - 要素が見つかった場合、Jtidy の解析を停止します
XPathExpression を使用して要素が見つかるまで、XML ドキュメントのみをダウンロードして解析する方法はありますか? 私はJavaを使用しています:
次のような HTML ドキュメントからテキストを取得しています。
たとえば、params[1]=10110)
最初のテーブルで XPathExpression がコード 10110 ( を検出するとすぐに、次のテーブルをダウンロードしないようにする必要があります。代わりに、同じレベルの子からのすべてのテキストのみをダウンロードします。通常のドキュメント サイズは次のとおりです。 10k 行を超えると、検索された要素が最初にある場合、しばらくすると非効率になります。
java - XML メッセージの一部である XML で < および > を削除する方法
次のような XML があります。
XML に、XML を無効にする「<」文字が含まれています。
最も簡単な方法は、XML のソースを修正することですが、残念ながら、XML の作成を制御することはできません。「The value is < than 10」のようなメッセージがあり、「未満」であると想定されます。
とにかく、このようなものについて XML をチェックし、それらの文字をエスケープする方法はありますか?
この投稿を見て、男がJTidyを使用する必要があることを示しました。しかし、試してみたところ、<:
java - JTidy を使用して HTML を検証する方法は?
JTidy を使用して html を検証したい。それぞれ検証されているかどうか、trueまたはfalseの応答が必要です。現在、私はこのコードを使用しています。
HTMLが検証されているかどうかに関係なく、ブール値の応答を取得する方法または方法はありますか? どんな助けでも感謝します。
java - JAVA で HTML の余分なスペースを削除する
HTML クレンジングを実行する必要があります。
冗長な br タグがたくさんある HTML があるので、これまで HtmlCleaner と jTidy を試してみましたが、結果はありませんでした。
例:
私が欲しいのは、シングル<br>
バックを手に入れることだけです
行ごとに手動で解析せずにこれを達成する他の方法はありますか?