LSH を使用して同様の製品を構築しようとしていますが、次のクエリがあります。
私のデータには次のスキーマがあります
id: long,
title: string,
description: string,
category: string,
price: double,
inventory_count: int,
active: boolean,
date_added: datetime
個々の機能に対して個別に LSH を実行し、それらを何らかの方法で組み合わせる必要がありますか?
また
すべての機能で LSH をまとめて構築する必要があります (基本的には、title_iphone、title_nexus、price_1200.25、active_1 などの帯状疱疹を作成しながら機能名を添付します)。次に、bag-of-words アプローチを使用して、このバッグで LSH を実行しますか?
e コマースのような構造化データに対して LSH を実行する方法を理解できるドキュメントを教えてくれる人がいれば、それは素晴らしいことです。
PS LSH で spark と min-hash 関数を使用する予定です。詳細が必要な場合はお知らせください。