次の問題があります。キーと値のペアの形式で大量のデータがあります。キーは ID で、値はテキストです。そして、私の目的は、テキストの断片が何らかの形で「類似」しているクラスター内のオブジェクトをグループ化することです。したがって、テキスト部分をキーとして、id を値として取得する場合、MapReduce のタスクのように見えます。しかし、そのようなキーは従来の MapReduce の使用方法ではありません。また、MapReduces フレームワークの内部実装についてよく知らないため、この方法が機能するかどうかはわかりません。だから私のアイデアの詳細は次のとおりです。レベンスタイン距離比較など) 4.
MapReduce はそのように機能しますか?