0

最近、BBSの不正なコンテンツ(広告投稿など)フィルターに取り組んでいます。また、文字列が連続していない別の文字列にあることを検出する関数を記述しています。次のようにコードを記述します。

$str = 'helloguys';
$substr1 = 'hlu';
$substr2 = 'elf';

function detect($a,$b) //function that detect a in b
{
    $c = '';
    for($i=0;$i<=strlen($a);$i++)
    {
        for($j=0;$j<=strlen($b);$j++)
        {
            if($a[$i] == $b[$j])
            {
               $b=substr($b,$j+1);
               $c .=$a[$i];
               break;
            }
        }
    }
    if($c == $a) return true;
    else return false;
}

var_dump(detect($substr1,$str)); //true
var_dump(detect($substr2,$str)); //false

フィルターはユーザーが投稿する前に機能するので、ここでの効率は重要だと思います。そして、もっと良い解決策があるかどうか疑問に思います。ありがとう!

4

2 に答える 2

1

これを行うより速い方法は、$a を正規表現に変換して $b と一致させることです。これにより、最適化を C コードで記述された PCRE モジュール自体に任せることができます。

例えば:

detect("hlu",$b) is equal to preg_match("/h.*l.*u/", $b)
(detect("hlu",$b) && detect("elf",$b)) is equal to preg_match("/(h.*l.*u|e.*l.*f)/", $b)
于 2010-05-21T05:24:06.007 に答える
0

なぜこれをしたいのかわかりません。でも退屈だった

function detect( $a,$b ) {

    return count( array_intersect( str_split($b), str_split($a) ) ) == strlen($b);

}
于 2010-05-21T05:31:31.253 に答える