1

QTHTMLパーサーツールを探しています。いくつかのhtmlソースコードがあり、XQueryを使用したいと思います。私はすでにQWebPage+QWebElementを使用しようとしましたが、最初はGUI以外のスレッドでは機能せず(QWebPageのため)、XPathではなくCSSパスを適用できないため、このソリューションは好きではありません。私が試した他の解決策はQXmlQueryで、これはうまく機能しますが、唯一の問題は、ページにエラーがあると機能しないことです。たとえば、最初に試したページにsystemId(DOCTYPEタグ内)がないため、解析が中止されました。

geckoを解析に使用できると聞きましたが、QTでどのように使用するかわかりません。

何か提案はありますか?

ありがとう

4

2 に答える 2

1

HTMLページでtidyを使用してから、XQueryで処理することをお勧めします。

Zorbaは、整頓されたモジュールを提供するC++XQueryプロセッサです。ライブの例はhttp://www.zorba-xquery.com/html/demo#tQZu6aq1K4KoGJm9m0oIPwKRt04=にあります。

于 2012-07-09T05:18:08.877 に答える
1

BaseX はQT クライアントを取得し、 TagSoupを使用して HTML ドキュメントをクリーンアップできます。

申し訳ありませんが、QT をまったく知らないため、QT の例を提供できません。

于 2012-07-09T06:45:19.030 に答える