入力:ボールボールコード
出力は次のようになります: ボール コード
入力: awycodeawy
出力は次のようになります: awycode
これらを試しましたが、うまくいきませんでした:
$q = preg_replace("/\s(\w+\s)\1/i", "$1", $q);
$q = preg_replace("/s(w+s)1/i", "$1", $q);
これは、OPの問題に対する正規表現ベースのソリューションに対する前向きな先読みベースの試みです。
$arr = array('ball ball code', 'abcabc bde bde', 'awycodeawy');
foreach($arr as $str)
echo "'$str' => '" . preg_replace('/(\w{2,})(?=.*?\\1)\W*/', '', $str) ."'\n";
'ball ball code' => 'ball code'
'abcabc bde bde' => 'abc bde'
'awycodeawy' => 'codeawy'
入力に対してできるように、 の'awycodeawy'
代わり'codeawy'
に になり'awycode'
ます。その理由は、 にvariable length lookahead
ないものを見つけることができるからですlookbehind
。
$q = preg_replace("/\b(\w+)\s+\\1\b/i", "$1", $q);