javascriptを使用してxhtmlを処理しています。nodeType == Node.TEXT_NODE であるすべての子ノードの nodeValue を連結して、div ノードのテキスト コンテンツを取得しています。
結果の文字列には、非改行スペース エンティティが含まれることがあります。これを通常のスペース文字に置き換えるにはどうすればよいですか?
私のdivは次のようになります...
<div><b>Expires On</b> Sep 30, 2009 06:30 AM</div>
Web で見つかった次の提案は機能しませんでした。
var cleanText = text.replace(/^\xa0*([^\xa0]*)\xa0*$/g,"");
var cleanText = replaceHtmlEntities(text);
var replaceHtmlEntites = (function() {
var translate_re = /&(nbsp|amp|quot|lt|gt);/g;
var translate = {
"nbsp": " ",
"amp" : "&",
"quot": "\"",
"lt" : "<",
"gt" : ">"
};
return function(s) {
return ( s.replace(translate_re, function(match, entity) {
return translate[entity];
}) );
}
})();
助言がありますか?