0

間違った入力が与えられると、まったく機能しなくなるように見える正規表現があります。

私のコード:

function dbStr($string)
{
    private static $tag = "(script|embed)";//As it turns out, embeds have the exact same syntax as scripts, so, we can use the same regexes against those :)
    private static $tvnc = "(\\\\'|\\\\\"|[^<>\"'/])*?";//Tag Valid No Close
    private static $quoteseq = "['\"](\\\\'|\\\\\"|[^\"'])*?['\"]";
    private static $tvncq = "(".$tvnc.$quoteseq.$tvnc.")*?";//Tag Valid No Close Quotes


    $string = preg_replace_callback
    (
        "#<".$tvnc.$tag."(".$tvncq."(src=".$quoteseq.")".$tvncq.")/>#imsSX",//Pattern
        "dbStr_FilterSinglematch",//Callback
        $string//Subject
    );
    return $string;
}

function dbStr_FilterSinglematch($m)
{
    print_r($m);
    return "";
}

ここで、この入力を次のように呼び出します。

echo "\n" . dbStr
("







<script type='textjavascript' src='asdf'/>

    <script type='textjavascript' src='asdf'>
    asdfasfasdf


    uyoiyoiuyoiuy

");

それはうまくいきます!一致を見つけて、その一致を削除します。その呼び出しから送信される出力は次のとおりです。

Array
(
    [0] => <script type='textjavascript' src='asdf'/>
    [1] => 
    [2] => script
    [3] =>  type='textjavascript' src='asdf'
    [4] =>  type='textjavascript' 
    [5] => =
    [6] => t
    [7] =>  
    [8] => src='asdf'
    [9] => f
)











    <script type='textjavascript' src='asdf'>
    asdfasfasdf


    uyoiyoiuyoiuy

ただし、代わりにこの入力を与えると....

echo "test" . dbStr
(
'

<embed type="application/x-shockwave-flash" src="http://picasaweb.google.com/s/c/bin/slideshow.swf" width="288" height="192" flashvars="host=picasaweb.google.com&amp;hl=en_US&amp;feat=flashalbum&amp;RGB=0x000000&amp;feed=http%3A%2F%2Fpicasaweb.google.com%2Fdata%2Ffeed%2Fapi%2Fuser%2F109941697484668010012%2Falbumid%2F5561383933745906193%3Falt%3Drss%26kind%3Dphoto%26authkey%3DGv1sRgCN2H88H41qeT6AE%26hl%3Den_US" pluginspage="http://www.macromedia.com/go/getflashplayer"></embed>

'.

"



<script type='textjavascript' src='asdf'/>
<script  fubar=\"d\\\\\'erp\"  derp=\"dlerp\">
    //<script type='text/javascript' src='asdf'/>
    asdfasfasdf
</script>
<script>
    uyoiyoiuyoiuy
</script>
");

何もない。何もありません。一致するものは見つかりませんでしたが、正規表現から取得したテキストは完全に空白です!

つまり、真剣に.... 一体何?これは、上記のコードを実行して得られる出力です。

test 

はい、それだけです。

正規表現が一致するものを見つけた場合 (たとえば、ドキュメント全体に一致した場合など)、print_r() 呼び出しから何かを出力したのではないでしょうか? いいえ、コールバックを呼び出しているとは思いません。正規表現は完全に失敗しています。

さらに悪いことに、次のヘッダー/ini 設定が設定されています。

header('Content-type: text/plain');
error_reporting(E_ALL);
ini_set("display_errors", 1);

しかし、ログにも出力自体にもエラーはありません。

それで、あなたはそれを持っています、私の正規表現の苦境。なぜこれが失敗するのか、誰にもアイデアはありますか?

編集:

問題の原因を絞り込みました。

echo "test " . dbStr
('<embed tests="abc" tests="abc" flashvars="AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA"></embed>');

その長さについて 2 つの属性があり、次に非常に長い属性があると、システムがクラッシュするようです。ただし、この入力はクラッシュしません...: (より多くの A がありますが、先行するタグはありません)

echo "test " . dbStr
('<embed
flashvarsembed>');

そうは言っても、追加された A により、前のタグはクラッシュするのにこれだけ長くする必要があります。

echo "test " . dbStr
('<embed a="b" c="d"
flashvarsembed>');

これはメモリ関連の問題のようです...修正はありますか? これが解析するコードは非常に長くなる可能性があります。

4

0 に答える 0