Web-Harvestを使用してWebサイトをスクラップし、データを含むxmlファイルを生成しています。
のような醜いノードが<name> </name>
あり、normalize-space()を使用しても役に立たなかったので、ファイルを16進ビューで開いたところ、「c2a0」に対応していることがわかりました。私は解決策を探しましたが、誰も助けませんでした...
要約すると、私が欲しいのは、その奇妙なスペースを(xqueryまたはxpath1 / 2を使用して)削除して、空のノードを取得できるようにすることです<name/>
ps:使用されるエンコーディングは「iso-8859-1」です