問題タブ [tag-soup]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
html - ポイント TagSoup パーサーは HTML5 バージョンを使用する
TagSoup の設定で HTML5 規格を使用するようにしたい。タグ内を
許可しない HTML4 に準拠している tagsoup パーサーを使用しています。したがって、間違った HTML を解析します。ただし、HTML5 では同じものを使用できます。タグスープ (org.ccil.cowan.tagsoup) で HTML5 標準を使用するにはどうすればよいですか。例えば、<div>
<a>
となり、
java - Jmeter の Jtidy StringIndexOutOfBoundsException
JMeter を使用して Web ページからコンテンツを取得したいと考えています。
私が探しているデータは、javascript ブロック内にあります。
変数がname
あるマップ id=id1 のスクリプト ブロック内の変数の値が必要だとしましょう。 song
XPath Extractor を使用してスクリプト コンテンツを取得します (純粋な HTML ではないため、CSS/Jquery は JavaScript コンテンツを取得しません)。
.//map[@id='id1']/script[contains(.,'song')]
私のHTMLが汚れているため(タグの末尾が欠落しているワイルドなものなど...)、XPathはデータを見つけられないので、Jtidyを使用してクリーンアップする必要があります(「Tidy(寛容なパーサー)」オプションを使用します)
備考 :
- 私は処理中の Web ページを所有していません。この恐ろしい HTML に対処しなければなりません。
- Webページには多くのmaps
要素があり、それぞれに変数を持つスクリプトがありsong
ます:正規表現を直接使用することはできません(私の知る限り)
問題 :
問題は次のとおりです。私の HTML には奇妙な国際文字wé hà bêêêêが含まれています... (はい、フランス語、申し訳ありません)。Jtidy はこの特定のケースを適切に処理しません:バグ #205 StringIndexOutOfBoundsException while lexing script content
その結果、Xpath エクストラクタが失敗し、テスト計画全体が動かなくなります。
カスタム ソリューションを設計しましたが、少し複雑です。多分私はこれをより良い方法で処理できます。
私の解決策:
tagsoup Java ライブラリを使用して HTML 出力をクリーンアップし、それを JMeter 変数に格納してから Xpath を介して処理し (「適用先」の「JMeter 変数」オプションにチェックマークを付けます)、最後に正規表現を使用して Lionel Richie のものを機能させました.. .
JMeter
|->HTTP Request
|->BeanShell PostProcessor->tagsoup > var RESPONSE
|->Xpath Extractor, Apply to var RESPONSE > var XPATH_OUTPUT
|->Regular Expression Extractor, Apply to var XPATH_OUTPUT
JMeter で tagsoup を動作させるには、jar を lib ディレクトリに置き、BeanShell PostProcessor を使用します。
使用される BeanShell コード:
linux - このコードを実行しようとすると、Linux ターミナルがフリーズし続けます
だから私はこの宿題をしていて、このコードを持っていますが、それを機能させることができないようです。コードを実行するたびに、ターミナルがある時点でフリーズして続行しなくなり、プロセスを終了しました。
私の問題は wget 行に関係していると思いますが、日付関数から作成された正確な変数を取得する必要があるため、何をすべきかわかりません。何をすべきかについて何かアドバイスはありますか?
編集:
端末がフリーズする問題はなくなりましたが、ファイルが保存されていてドキュメントに含まれている場合でも、FileNotFoundException と表示されます。サイトがダウンしているためにその問題が発生する可能性がありますが、ファイルが保存されているため、その理由はわかりません。
java - Hello World Saxon with Java
apt forおよび解析JAR
によってインストールされたファイルを使用することは、次のようにワンライナーです。Saxon-HE
tagsoup
html
Javaからそれを行うにはどうすればよいですか?Saxon
特に、この実行に はどのインポートが必要ですか? おそらくSaxon
JAXPインターフェースを使用していますか?
また:
http://codingwithpassion.blogspot.com/2011/03/saxon-xslt-java-example.html