1

array_diffカウントで類似の単語を一致させる方法

TV-Television、Inches-Inch、Mobile-Mobile Phones、Mobile-Phones のような単一の単語の複数の名前の問題。そのため、array_diff カウントで間違ったパーセンテージを作成します

例 :

    $str1 = "Samsung Television 21 Inches LED BH005DE";
    $str2 = "Samsung 21 Inch LED TV";

    $arr1 = explode(' ', $str1);
    $arr2 = explode(' ', $str2);

    $differenceCount = count(array_diff($arr2, $arr1));

上記の str1 と str2 には、Television、TVInches、Inchの単語が含まれています。この問題を解決するにはどうすればよいですか

4

1 に答える 1

2

最も明白な方法は、同義語を使用することです。

$str1 = "Samsung Television 21 Inches LED BH005DE";
$str2 = "Samsung 21 Inch LED TV";

//synonyms:
$syns = [
   'TV'   => ['TV', 'Television'],
   'Inch' => ['Inch', 'Inches']
];

//replace:
$str1 = array_reduce(array_keys($syns), function($c, $x) use ($syns)
{
   return $c = preg_replace('/\b'.join('\b|\b', $syns[$x]).'\b/', $x, $c);
}, $str1);
//now, str1 looks like "Samsung TV 21 Inch LED BH005DE"

$str2 = array_reduce(array_keys($syns), function($c, $x) use ($syns)
{
   return $c = preg_replace('/\b'.join('\b|\b', $syns[$x]).'\b/', $x, $c);
}, $str2);
//now, str2 looks like "Samsung 21 Inch LED TV"

$arr1 = explode(' ', $str1);
$arr2 = explode(' ', $str2);


//var_dump(array_diff($arr1, $arr2));//['BH005DE']

あなたの場合、ある種の単語形式(Inch-などInches)に依存することはできません-略語も解析する必要があるため-これらは特定の意味を持つケースです。したがって、シノニムを使用することが、すべてのケースの問題を解決する唯一の方法である可能性があります。

于 2014-03-24T12:17:15.247 に答える