xquery - エスケープされた HTML を xqilla のノードに解析します

Question

XQilla を使用して、RSS 2.0 フィード (説明タグ) からテキストを取得しようとしています。アドレスはこちらです。これは問題ありませんが、タグには次のようなエスケープされた HTML が含まれています

"&lt;a href="some_address&gt;..."

この HTML をノードに入れてさらに操作すると便利ですが、ここで途方に暮れています。タグの内容を取得できます

let $desc := $item/*[name()='description']

しかし、エスケープを解除する方法がわかりません。data() 関数のように、タグのテキストのみを取り除き、文字列を返す parse-html を試しました。Web で検索すると、これには拡張機能が存在することが示唆されますが、他のパーサーには存在します。XQillaでそれを行う方法はありますか? ところで、私が取り組んでいるコードは JAWS ResearchIt ルックアップソースです。

score 2 · Accepted Answer

XQilla には、他の多くの XQuery 実装と同様に、文字列から XML と HTML をロードする独自の関数があります(これらにはアンカータグがないため、ドキュメントをスクロールする必要があります)。

xqilla:parse-xml($xml as xs:string?) as document-node()?
xqilla:parse-html($html as xs:string?) as document-node()?

解析さ$descれていない HTML が含まれているxqilla:parse-html($desc)と、解析結果が返されます。

xquery - エスケープされた HTML を xqilla のノードに解析します

1 に答える 1

Related

Reference