150 万ペアの要素 (' ' で区切られている) で構成される配列があります。
$array {
[0] => "element1 element2"
[1] => "element2 element3"
[2] => "element8 element4"
[3] => "element8 element5"
[4] => "element4 element5"
[5] => "element6 element7"
[6] => ...
}
要素の各ペアは一意であり、要素は 15 ~ 20 文字の文字列です。
私のパイプラインでは、この配列は [0] 「要素 1 が要素 2 に関連している」、[1] 「要素 2 が要素 3 に関連している」などを意味します。関連するすべての要素をまとめてクラスタ化し、次のような出力を得たいと考えています。
$array_output {
[0] => "element1 element2 element3"
[1] => "element8 element4 element5"
[2] => "element6 element7"
[3] => ...
}
このタスクは非常に単純で、おそらくそれを行うための明らかな方法が欠けていると思いますが、要素をクラスター化する高速な方法 (つまり、数分から数時間) を見つけられませんでした。