問題タブ [jtidy]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - JTidy Node.findBody()—使用方法は?
JTidyを使用してXHTMLDOM解析を実行しようとしていますが、これはかなり直感に反する作業のようです。特に、HTMLを解析する方法があります。
そして、そのノードの<body />を取得するには、
そのTagTableのインスタンスはどこで入手できますか?(コンストラクターは保護されており、それを製造する工場は見つかりませんでした。)
JTidy8.0-SNAPSHOTを使用しています。
java - Javaでxpathが機能しない
URL にアクセスし、そこから html を取得し、xpaths を使用して特定の値を取得しようとしています。私はhtmlをうまく取得しており、Jtidyはそれを適切にクリーニングしているようです。ただし、xpath を使用して必要な値を取得しようとすると、空の NodeList が返されます。xpath 式が正しいことはわかっています。私は他の方法でそれをテストしました。このコードの何が問題なのですか。助けてくれてありがとう。
java - JTidy のアップグレードでドキュメントの xpath が壊れた
10 月にリリースされた最新バージョンの jtidy に更新したところ、不明な理由でドキュメント オブジェクトが壊れたようです。これは私のコードです:
そして、これは私が得ているエラーです:
NodeList を生成しようとすると、コードの最後の行でエラーが発生します。新しいバージョンの JTidy でこのような問題が発生した人はいますか?
java - SpringサーブレットコンテナでJTidyを最適に使用するにはどうすればよいですか?
SpringFrameworkを使用するJavaサーブレットコンテナがあります。ページは、Springを使用してJSPから生成され、すべてを接続します。結果としてユーザーに送信されるHTMLは、私が望むほどきれいではありません。HTMLをクライアントブラウザに送信する直前にTidyに送信したいと思います。
開発で動作するように設定し、本番環境ではオフにします。メンテナンスがより簡単になるので、私の観点からは勝者です。
春にそれをきれいに機能させる方法についての提案はありますか?
html - Maven2でJTidyを使用する
私はspring2とMavenを使用してJavaプロジェクトに取り組んでいます。
私はすでにJSLint4JavaをMavenに組み込んでいますが、今度はさらに検証を行う必要があります。
ビルドには、ホームページや検索ページなど、仕様の妥当性について最終的なHTML出力を自動的にテストしたいコアページがいくつかあります。つまり、Mavenビルドからの有効なXHTML1.1厳密です。最終的なHTML出力を生成するhtmlテンプレートファイルはすべてモジュール化されて分離されているため、コンポーネントを個別に検証することは、1つとして実行されるまで有効にならないため機能しません。
ビルドの各ページをテストするのはかなり遅くなるので、テストしたくありません。検証プロセスで実行したいURLのリストを含むXML構成ファイルを用意することをお勧めします。
Jtidyプロジェクトを見つけましたが、これをMavenビルドに組み込み、検証するために特定のURLを呼び出す方法がわかりません。
誰かがこれまでにこれをしたことがありますか?誰かが私がこれを行うために必要な段階の簡単なウォークスルーを提供できますか?
乾杯
java - jtidyがxhtmlをxmlに変換するためのチュートリアルリンクを誰でも投稿できますか
Javaでjtidyを使用してxhtml docをxmlに変換するサンプルプログラムを誰でも提供できますか。
または、jtidy を使用するためのチュートリアル リンクを投稿します。
java - JavaでHTMLタグの内容を変更するには?
JavaでタグのHTMLコンテンツを変更するにはどうすればよいですか? 例えば:
前:
後:
JTidy を試してみましたが、サポートしていませんgetTextContent
。他の解決策はありますか?
ありがとう、整形式の HTML を解析したくありません。TagSoup を試しましたが、このコードがある場合:
「sometext」を「someAnotherText」に変更したいのですが、使用する{bodyNode}.getTextContent()
と「sometext text」と表示されます。を使用setTextContet("someAnotherText"+{bodyNode}.getTextContent())
してこれらの構造をシリアル化すると、結果はタグ<body>someAnotherText sometext text</body>
なし になります。<div>
これは私にとって問題です。
java - HTMLを浄化するためのJTidyの適切な使用
JTidy (jtidy-r938.jar) を使用して入力 HTML 文字列をサニタイズしようとしていますが、デフォルト設定を正しく取得するのに問題があるようです。多くの場合、「hello world」などの文字列は、整理すると「helloworld」になります。私はここで何をしているのかを示したかったのですが、どんな指針も本当に感謝しています:
rawHtml
が入力 (実世界) HTML を含む文字列であると仮定します。これは私がやっていることです:
まず、上記のコードで何か根本的に間違っているように見えますか? 私はこれで奇妙な結果を得ているようです。
たとえば、次の入力について考えてみます。
<p class="MsoNormal" style="text-autospace:none;"><font color="black"><span style="color:black;">???</span></font><b><font color="#7f0055"><span style="color:#7f0055;font-weight:bold;">private</span></font></b><font color="black"><span style="color:black;"> String parseDescription</span></font><font>
出力は次のとおりです。
<p class="MsoNormal" style="text-autospace:none;"><font color=
"black"><span style="color:black;"> </span></font>
<b><font color="#7F0055"><span style=
"color:#7f0055;font-weight:bold;">private</span></font></b><font
color="black"><span style="color:black;">String
parseDescription</span></font></p>
そう、
「public String parseDescription」は「publicString parseDescription」になります
前もって感謝します!
html - JTidy: 特定のタグを処理する方法
JTidy で不正な形式の HTML ページを処理しています。たとえば、特定のタグのセットを修正することにのみ関心があります<img> <table>
。JTidy にそれらのタグだけに集中するように指示する方法はありますか?
java - Android SDK と XQuery?
Android SDK で動作することがわかっている XQuery の実装はありますか? mxquery を試しましたが、うまくいきませんでした。彼らのサイトには、Andriod のサポートが間もなく開始されると書かれているので、私はそれが機能するとは思っていませんでした。
私は、Web ページを XHMTL に解析するために jTidy を使用していません。XML ファイルを検索、フィルタリング、および再フォーマットするための軽量で高速なものを探しています。
ありがとう。