2

このコードを使用してすべてのタグを削除しましたが、などのタグを保存したくありません...どうすればよいですか?タグをフィルタリングする方法がわかりません

/***************************************************
    STRIP HTML TAGS
    ****************************************************/
    function strip_tags(html){

        //PROCESS STRING
        if(arguments.length < 3) {
            html=html.replace(/<\/?(?!\!)[^>]*>/gi, '');
        } else {
            var allowed = arguments[1];
            var specified = eval("["+arguments[2]+"]");
            if(allowed){
                var regex='</?(?!(' + specified.join('|') + '))\b[^>]*>';
                html=html.replace(new RegExp(regex, 'gi'), '');
            } else{
                var regex='</?(' + specified.join('|') + ')\b[^>]*>';
                html=html.replace(new RegExp(regex, 'gi'), '');
            }
        }

        //CHANGE NAME TO CLEAN JUST BECAUSE 
        var clean_string = html;

        //RETURN THE CLEAN STRING
        return clean_string;

**編集***これ は私のHTMLコードです

<body class="portrait" onLoad="prepareImages()">
    <div id="title_wrapper"><h2 id="title"><a href="[[[LINK]]]">[[[TITLE]]]</a></h2></div>
    <h2 id="subtitle">[[[DATE]]]</h2>
     <div id="content">
        [[[FULL CONTENT]]] etc....
    </div>

私はあなたの関数をこのように使用しました(私が置き換えなければならないのは:[[[FULL CONTENT]]]などです...)

(strip_tags(contentElem,"<img>");

結果なし。[[[FULLCONTENT]]]などを[[[FULLCONTENT]]]などで書き換えるにはどうすればよいですか?

4

3 に答える 3

4

評価?うーん、それは本当に醜いコードです。正規表現パターンを使用して、すべてのタグに一致します。

  • 関数呼び出しのパラメーターが 3 つ未満の場合、すべてのタグが削除されます。
  • 関数呼び出しに少なくとも 3 つのパラメーターがある場合:
    • 3 番目のパラメーターは、のような文字列です"a", "b", "strong"。醜い構造のおかげで、引用符が必要です。evil eval
    • 2 番目のパラメーターが真の値 (trueたとえば) の場合、3 番目のパラメーターは許可されるタグのリストです。
    • 2 番目のパラメーターが false-value (falseたとえば) の場合、3 番目のパラメーターは拒否されるタグのリストです。

適切なstrip_tags関数が必要な場合は、 http://phpjs.org/functions/strip_tags:535をご覧ください。

于 2012-01-05T19:05:32.063 に答える
3

これは、許容されるタグを含む strip_tags() です ( phpjs.org から)。

// allow can be a string like '<b><i>'
function strip_tags(str, allow) {
  // making sure the allow arg is a string containing only tags in lowercase (<a><b><c>)
  allow = (((allow || "") + "").toLowerCase().match(/<[a-z][a-z0-9]*>/g) || []).join('');

  var tags = /<\/?([a-z][a-z0-9]*)\b[^>]*>/gi;
  var commentsAndPhpTags = /<!--[\s\S]*?-->|<\?(?:php)?[\s\S]*?\?>/gi;
  return str.replace(commentsAndPhpTags, '').replace(tags, function ($0, $1) {
    return allow.indexOf('<' + $1.toLowerCase() + '>') > -1 ? $0 : '';
  });
}
于 2012-05-01T05:05:38.203 に答える
-1

DOM を使用すると、この操作ははるかに簡単になります。なぜ人々がこれに正規表現を使おうとしているのかわからない。

/**
 * Removes all tags with the provided tagName.
 * @param {Element} el The root element.
 * @param {string} tagName The tagName to match.
 * @example
 *   >> document.body.innerHTML;
 *   "<p><img src="foo.jpg">Some <strong>text</strong></p>"
 *   >> stripTags(document.body, 'img');
 *   undefined
 *   >> document.body.innerHTML;
 *   "<p>Some <strong>text</strong></p>"
 *   >> stripTags(document.body, 'strong');
 *   undefined
 *   >> document.body.innerHTML;
 *   "<p>Some text</p>"
 */
function stripTags(el, tagName) {
  var els = el.getElementsByTagName(tagName.toUpperCase());
  for (var i = 0; i < els.length; i++) {
    while (els[i].firstChild)
      els[i].parentNode.insertBefore(els[i].removeChild(els[i].firstChild), els[i]);
    els[i].parentNode.removeChild(els[i--]);
  }
}

strip_tagsこれにより、すべてのタグ (コンテンツではない) が削除されます。これが の動作だと思います。

于 2012-07-17T18:34:53.823 に答える