“jtidy”の関連問題_Stack Overflow日本語サイト

0 投票する

2 に答える

1224 参照

dom - JTidy から返された DOM を解析して特定の HTML 要素を見つける

私はしばらくこのコードをいじっていましたが、何が間違っているのかわかりません。

URL を取得し、それを JTidy でクリーンアップします。形式が整っていないためです。次に、特定の非表示の入力フィールド ( input type="hidden" name="mytarget" value="313") を見つける必要があるため、name 属性の値を知っています。

クリーンアップ時に HTML ページ全体を印刷するので、探しているものとドキュメントの内容を比較できます。

私の問題は、私が持っている場所について、これを見つけるための最良の方法を決定しようとしていSystem.out << itます。

2012-03-05T19:44:17.170

0 投票する

1 に答える

2268 参照

java - HTML5出力をきれいにフォーマットする

HTML5出力を自動的にインデントしようとしています。私が使用しようとしたツールはJTidyでしたが、問題はHTML5要素をサポートしておらず、たとえばHTML5が本文でそれらを使用しているのに対し、すべてとヘッダーに移動することです。

HTMLはXMLではないため、インデントに一般的なJavaXMLツールを使用することはできません。

java html pretty-print indentation jtidy

2012-03-21T16:36:29.490

0 投票する

4 に答える

20734 参照

java - JTIdyでHTMLドキュメントを整形式にするにはどうすればよいですか？

JTidyv。r938を使用しています。このコードを使用してページをクリーンアップしようとしています…</p>

しかし、このURLを解析すると--http：//www.chicagoreader.com/chicago/EventSearch？narrowByDate = This + Week＆eventCategory = 93922＆keywords =＆page = 1、物事はクリーンアップされていません。たとえば、ページ上のMETAタグは、次のようになります。

として残る

「</META>」タグを付けたり、「<META http-equiv = "Content-Type" content = "text/html;」と表示したりする代わりに charset =UTF-8"/>"。結果のJTidyorg.w3c.dom.Documentを文字列として出力することでこれを確認します。

JTidyが本当にページをクリーンアップするために、つまり、ページを整形式にするために何ができますか？他にもツールがあることはわかっていますが、この質問は特にJTIdyの使用に関連しています。

java html xml parsing jtidy

2012-04-30T21:36:36.733

0 投票する

1 に答える

710 参照

java - Java で Html5 ページをクリーンアップ: 可能ですか?

Java プロジェクト内の Html5 ページをクリーンアップする必要があります。

そのため、Java ライブラリ、または Linux と Windows の両方で動作するコマンドラインプログラムが必要です。

JTidy がうまく動作しません (テストしました)。HTML5 の HTML Tidy は C++ ライブラリであり、そのコマンドラインバージョンは Linux でのみ動作します。

Validator.nu HTML パーサーもクリーンアップするかどうか知っていますか (それに関する情報は見つかりませんでした)。

何かアイデアはありますか？

ありがとう

java html java-7 jtidy

2012-07-12T16:29:59.467

0 投票する

1 に答える

735 参照

java - jTidyhtmlからxhtmlは空のファイルを返します

htmlファイルからxhtmlファイルを作成しようとしていますが、エラーが発生します。変換中に次のエラーが発生します。

1行目1列目-警告：欠落している「title」要素を挿入しています

InputStream：ドキュメントコンテンツはHTML2.0のように見えます

警告1、エラーは見つかりませんでした！

私のコードは次のとおりです。

最後に私は空のファイルを受け取ります。私は何が間違っているのですか？

よろしくお願いいたします。Zoli

java xhtml html-parsing jtidy

2012-07-16T13:36:48.590

0 投票する

0 に答える

241 参照

java - ソースを整理せずにHTMLパーサー

私のマシンには数百の古いhtmlファイルがあり、それらを解析してデータを抽出しようとしています。Jsoup、Tagsoup、HTMLcleaner、JTidyなどのさまざまなJavaパーサーを試しました。ファイル内のhtmlコードの方法により、XPATHをサポートするパーサーしか使用できず、Jsoupを試しましたが、同等のcssセレクターが見つかりませんでした。

とにかく、私の問題は、私が試したパーサーが何であれ、実際のコンテンツをクリーンアップし、'（アポストロフィ）のようなものを奇妙な文字に変換することです。

特別な文字を整理して置き換えることなく、Javaパーサーを使用してコンテンツを解析することは可能ですか？

java parsing html-parsing jtidy htmlcleaner

2012-08-23T09:59:58.497

0 投票する

1 に答える

126 参照

java - javaでw3c Tidyインターフェースをインポートするnetbeansでデバッガーを使用する方法

JTidy を使用していくつかの html を消去するコードにバグがあります。不正な形式の html が見つかったら、スキップする必要があります。しかし、プログラムが不正な html で停止することがあるので、自分のコードで何が起こっているのかを確認したいと考えています。しかし、netbeans でデバッガーを実行できないようです。デバッガーはこのDebugger stopped on uncompilable source code.行で停止しましimport org.w3c.tidy.Tidy;たプログラムを実行する方法は、コマンドプロンプトで次java -cp jtidy-r938.jar;. HtmlCleanerTest http://yahoo.comのように表示されます。

java debugging netbeans jtidy

2012-11-05T20:04:39.147

0 投票する

1 に答える

736 参照

java - GUIでのJtidyエラー/警告メッセージの表示JTextArea

私はjtidyを使用してURLから取得したソースコードからhtmlをクリーンアップするプログラムを書いています。GUIのJTextAreaにエラーと警告を表示したい。警告を印刷からstdoutからJTextAreaに「再ルーティング」するにはどうすればよいですか？Jtidy APIを調べましたが、必要なことを実行するものが見つかりません。誰かが私がこれを行う方法を知っていますか、それが可能かどうかさえわかりますか？

//jtidyオプションのテスト

java swing jtextarea jtidy

2012-11-08T04:22:44.623

0 投票する

1 に答える

127 参照

jtidy - JTidyが属性値のアポストロフィをエンティティに変換するのを防ぐことはできますか

私の入力HTMLには、次のような行があります。

JTidyが変換する

そのエンティティの変換を抑制する方法はありますか？二重引用符が変換されないようにするためのconfigメソッド（setQuoteMarks（））があるようですが、アポストロフィについては同様ではありません。

jtidy

2012-11-13T21:49:02.173

問題タブ [jtidy]

Reference