問題タブ [tag-soup]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
236 参照

html - ポイント TagSoup パーサーは HTML5 バージョンを使用する

TagSoup の設定で HTML5 規格を使用するようにしたい。タグ内を
許可しない HTML4 に準拠している tagsoup パーサーを使用しています。したがって、間違った HTML を解析します。ただし、HTML5 では同じものを使用できます。タグスープ (org.ccil.cowan.tagsoup) で HTML5 標準を使用するにはどうすればよいですか。例えば、<div><a>

となり、

0 投票する
1 に答える
158 参照

java - Jmeter の Jtidy StringIndexOutOfBoundsException

JMeter を使用して Web ページからコンテンツを取得したいと考えています。
私が探しているデータは、javascript ブロック内にあります。

変数がnameあるマップ id=id1 のスクリプト ブロック内の変数の値必要だとしましょう。
song

XPath Extractor を使用してスクリプト コンテンツを取得します (純粋な HTML ではないため、CSS/Jquery は JavaScript コンテンツを取得しません)。

.//map[@id='id1']/script[contains(.,'song')]

私のHTMLが汚れているため(タグの末尾が欠落しているワイルドなものなど...)、XPathはデータを見つけられないので、Jtidyを使用してクリーンアップする必要があります(「Tidy(寛容なパーサー)」オプションを使用します)

備考 :
- 私は処理中の Web ページを所有していません。この恐ろしい HTML に対処しなければなりません。
- Webページには多くのmaps要素があり、それぞれに変数を持つスクリプトがありsongます:正規表現を直接使用することはできません(私の知る限り)

問題 :

問題は次のとおりです。私の HTML には奇妙な国際文字wé hà bêêêêが含まれています... (はい、フランス語、申し訳ありません)。Jtidy はこの特定のケースを適切に処理しません:バグ #205 StringIndexOutOfBoundsException while lexing script content

その結果、Xpath エクストラクタが失敗し、テスト計画全体が動かなくなります。

カスタム ソリューションを設計しましたが、少し複雑です。多分私はこれをより良い方法で処理できます。

私の解決策:

tagsoup Java ライブラリを使用して HTML 出力をクリーンアップし、それを JMeter 変数に格納してから Xpath を介して処理し (「適用先」の「JMeter 変数」オプションにチェックマークを付けます)、最後に正規表現を使用して Lionel Richie のものを機能させました.. .

JMeter |->HTTP Request |->BeanShell PostProcessor->tagsoup > var RESPONSE |->Xpath Extractor, Apply to var RESPONSE > var XPATH_OUTPUT |->Regular Expression Extractor, Apply to var XPATH_OUTPUT

JMeter で tagsoup を動作させるには、jar を lib ディレクトリに置き、BeanShell PostProcessor を使用します。

使用される BeanShell コード:

0 投票する
1 に答える
101 参照

linux - このコードを実行しようとすると、Linux ターミナルがフリーズし続けます

だから私はこの宿題をしていて、このコードを持っていますが、それを機能させることができないようです。コードを実行するたびに、ターミナルがある時点でフリーズして続行しなくなり、プロセスを終了しました。

私の問題は wget 行に関係していると思いますが、日付関数から作成された正確な変数を取得する必要があるため、何をすべきかわかりません。何をすべきかについて何かアドバイスはありますか?

編集:

端末がフリーズする問題はなくなりましたが、ファイルが保存されていてドキュメントに含まれている場合でも、FileNotFoundException と表示されます。サイトがダウンしているためにその問題が発生する可能性がありますが、ファイルが保存されているため、その理由はわかりません。

0 投票する
1 に答える
444 参照

java - Hello World Saxon with Java

apt forおよび解析JARによってインストールされたファイルを使用することは、次のようにワンライナーです。Saxon-HEtagsouphtml

Javaからそれを行うにはどうすればよいですか?Saxon特に、この実行に はどのインポートが必要ですか? おそらくSaxonJAXPインターフェースを使用していますか?

また:

http://codingwithpassion.blogspot.com/2011/03/saxon-xslt-java-example.html