array_count_values($arr1)
とarray_count_values($arr2)
ifの戻り配列を組み合わせて、同じ値$arr1
を$arr2
持つ要素を持つ効率的な方法はありますか?
私は古典的な「10 億行の検索要求を含むドキュメントから上位 100 の検索要求を生成する」という方法に取り組もうとしています。
私のアプローチは、unix を使用split
してドキュメントを小さなファイルに分割し、各ファイル内の各検索用語の出現回数を でカウントし、array_count_values
それらすべてのファイルを、各検索クエリの人気度の降順で並べ替えられたリストを持つ単一のファイルに縮小することです。 .
編集 たとえば
$arr1 = array('kurt', 'curt', 'kurt', 'dave', 'krist');
$arr2 = array('dave' 'dave', 'krist', 'krist');
array_count_values($arr1) // ('kurt' => 2, 'curt'=>1, 'dave'=>1, 'krist'=>1)
array_count_values($arr2) // ('dave' => 2, 'krist'=>2)
2つを組み合わせて次の配列を形成するにはどうすればよいですか
('kurt' => 2, 'dave'=>3, 'krist'=>3, 'curt'=>1)