1

XQilla を使用して、RSS 2.0 フィード (説明タグ) からテキストを取得しようとしています。アドレスはこちらです。これは問題ありませんが、タグには次のようなエスケープされた HTML が含まれています

"<a href="some_address>..."

この HTML をノードに入れてさらに操作すると便利ですが、ここで途方に暮れています。タグの内容を取得できます

let $desc := $item/*[name()='description']

しかし、エスケープを解除する方法がわかりません。data() 関数のように、タグのテキストのみを取り除き、文字列を返す parse-html を試しました。Web で検索すると、これには拡張機能が存在することが示唆されますが、他のパーサーには存在します。XQillaでそれを行う方法はありますか? ところで、私が取り組んでいるコードは JAWS ResearchIt ルックアップ ソースです。

4

1 に答える 1

2

XQilla には、他の多くの XQuery 実装と同様に、文字列から XML と HTML をロードする独自の関数があります(これらにはアンカー タグがないため、ドキュメントをスクロールする必要があります)。

xqilla:parse-xml($xml as xs:string?) as document-node()?
xqilla:parse-html($html as xs:string?) as document-node()?

解析さ$descれていない HTML が含まれているxqilla:parse-html($desc)と、解析結果が返されます。

于 2014-03-10T15:39:58.480 に答える