問題タブ [tag-soup]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
3 に答える
198 参照

asp.net - ASP.NETMVCビューがXHTMLに準拠していないかどうかを確認するためのオプションは何ですか

明確化:XHTMLを検証するためのツールの提案をありがとう。私は主にサーバー側(またはjQueryを使用するクライアント)で実行するソリューションを探しています。これにより、開発中に設定して忘れることができ、ツールを常に実行しなくても問題が発生したときに通知を受けることができます。


このタグスープはすべてASP.NETMVCで私を怖がらせます!!

ビュージェネレーターから出力されるすべてのビューをXHTML準拠で検証できれば、それほど怖くありません。これは、私が作成する予定のjQueryの量にとって特に重要です。セレクターが機能しない原因となる閉じられていないタグがどこかにあることを確認するためだけに、何かをデバッグするのに何時間も費やしたくありません。

これにはどのようなオプションがありますか。私は頭のてっぺんから次のような解決策を探していますが、これらのどれが実用的かわかりません:

  • JQueryXHTMLチェッカー
  • IISフィルター
  • ブラウザプラグイン(Firebugプラグインがこれを行うための何かがあると思います)
  • MVCビュークラスで何か賢いことをする(これが可能かどうか、または説得する価値があるかどうかはわかりません)。
  • 'flush()'をチェックし、出力がXHTMLでない場合は例外をスローするように、HTMLライターを変更します。
  • ASP.NET構成オプションページを検証することに気づいていません。

すべてのオプションは答えを歓迎します!

デバッグ中にハード例外をスローでき、本番環境ではエラーをログに記録できるように、サーバー側のテクノロジを使用したいと思います。マスターページが適用された後、ページ全体を検証する必要があります。IDEで警告を探すだけでは、十分な解決策ではありません。

0 投票する
3 に答える
2229 参照

java - Tagsoup が StringReader ( java ) からの HTML ドキュメントの解析に失敗する

私はこの機能を持っています:

POSTリクエストの後にhttpサーバーから送信されたhtmlドキュメントを含む文字列を取りますが、適切に解析できません.ドキュメント全体から4つのノードしか得られません. 文字列自体は問題ないように見えます。印刷してテキスト ドキュメントにコピーすると、期待どおりのページが表示されます。

上記のメソッドのオーバーロードされたバージョンを使用すると:

その後、すべてが正常に機能します-適切なDOMツリーを取得しますが、サーバーからPOST回答を何らかの方法で取得する必要があります.

文字列をファイルに保存して読み戻すことはできません - それでも同じ結果が得られます。

何が問題なのですか?

0 投票する
1 に答える
1986 参照

java - XPath 式は // 要素に対して何も返さないが、 //* カウントを返す

次のサンプル データで XOM を使用しています。

次の要素は、(実際のデータから) 多くの要素を返します。

しかし、何かのような

何も返しません。ルートの子を実行すると、番号が一致しているように見え、要素名を出力すると、すべてが正しく見えます。

HTML を取得し、tagsoup で解析して、結果の文字列から XOM ドキュメントを作成しています。これのどの部分がひどく間違っているのでしょうか? ここで奇妙なエンコーディングの問題が発生しているように感じますが、私はそれを見ていません。Java Strings は文字列ですよね?

0 投票する
1 に答える
1229 参照

java - JDOM 1.1:ハイフンは有効なコメント文字ではありません

私はtagsoupを使用して、インターネットからスクレイピングしているHTMLをクリーンアップしていますが、コメント付きのページを解析すると、次のエラーが発生します。

私はJDOM1.1を使用していますが、実際のクリーニングを行うコードは次のとおりです。

何が問題になっているのか、またはこれを修正する方法はありますか?の長いコメント文字列を含むページを解析できる必要があります<!--------- data ------------>

0 投票する
1 に答える
1065 参照

java - TagSoup を使用した XML の解析: 長い属性のバグ?

特定のタグの値を抽出するために、TagSoup を使用して醜い HTML を解析しようとしています。タグは次のとおりです。

属性「value」(「ffc39410ed8da309408a9382450ddc85」)の値を取得したい

そして、これが私のSAXハンドラーの私のコードです:

ログはデバッグ目的でここにあります。Logcat は atts.getValue("name") の "hash_check" を正しく返しますが、atts.getValue("value") の空の文字列を返しますが、パーサーは正しい "input" (私の html ドキュメントの唯一のもの) に配置されています。 )。

どうしたの ?TagSoup のバグ?

ありがとう

編集 @bkail : コメントありがとうございます。詳細とコードは次のとおりです。

まず、解析しようとしている URL : http://forum.hardware.fr/hfr/Programmation/Divers-6/experts-puissant-internet-sujet_37483_1.htm

そして、パーサーをインスタンス化するために使用されるコード:

そして最後に、私の SAX パーサーのコード全体:

お試しいただきありがとうございます。

0 投票する
1 に答える
4601 参照

java - jTidy と TagSoup のドキュメント

TagSoup および jTidy ライブラリのドキュメント (可能であれば公式のドキュメント) を探しています。

このライブラリを使用して、html (html、xhtml、または html5) タグの間に異なる名前空間が混在する xml タグを含む html "tagsoup" ファイルを操作したいと考えています。

HTMLCleaner、NekoHTML、および Jericho をテストしましたが、ファイルをクリアするための最も単純な例を除けば、jTidy と TagSoup のドキュメントは見つかりません。

コンテンツの操作、タグの置換、情報の抽出などに関するドキュメントが必要です...

ありがとう

注: すべてのオプションをテストした後、StAX / Woodstoxを使用しました。

0 投票する
3 に答える
783 参照

xml - tagsoup と Groovy の XmlSlurper での奇妙な動作

次のようなxml文字列から電話番号を解析したいとしましょう:

電話番号は印刷されません。

このように「div」要素を「foo」に変更すると

次に、電話番号を解析して印刷できます。

一体何が起こっているのですか?

ところで、私はgroovy 1.7.5とtagsoup 1.2を使用しています

0 投票する
1 に答える
342 参照

java - PCDATAのみを変更するためにSAXを使用してXHTMLを解析する

Saxパーサーを使用してXHTML文字列を解析し、s1が属性ではなくPCDATAにある場合、文字列(s1)のすべての出現を(s2)に変更する例を探しています。誰かがここに光を当てることができますか....

ありがとう!

0 投票する
1 に答える
2108 参照

java - TagSoupとXPath

XPath(JAXP)でTagSoupを使用しようとしています。TagSoup(またはXMLReader)からSAXパーサーを取得する方法を知っています。しかし、そのSAXパーサーを使用するDocumentBuilderを作成する方法を見つけることができませんでした。それ、どうやったら出来るの?

ありがとうございました。

編集:とても一般的で申し訳ありませんが、JavaXMLAPIはとても苦痛です。

EDIT2:

問題が解決しました:

EDIT3:

私を助けたリンク:http ://www.jezuk.co.uk/cgi-bin/view/jez?id = 2643

0 投票する
5 に答える
6430 参照

java - XMLReader から属性を取得する方法

Spannedusingに変換している HTML がいくつかあり、その中でHtml.fromHtml(...)使用しているカスタム タグがあります。

TagHandlerしたがって、次のように、このカスタム タグを処理するために を実装しました。

この場合、「id」フィールドは実際にはプロパティではなく属性であると思われるため、SAX 例外が発生します。ただし、のgetAttribute()方法はありませんXMLReader。私の質問は、これを使用して「id」フィールドの値を取得するにはどうすればよいXMLReaderですか? ありがとう。