1

基本的に、材料とそれに関連する量のリストとして構造化されたレシピのデータベースがあります。レシピが与えられた場合、バリエーションや省略を考慮して類似のレシピをどのように特定しますか? たとえば、水の代わりに牛乳を使用したり、砂糖の代わりに蜂蜜を使用したり、風味のために何かを完全に省略したりします.

現在の戦略は、主な成分の組み合わせに対して複数の内部結合を行うことですが、これは大規模なデータベースでは非常に遅くなる可能性があります. これを行う別の方法はありますか?知覚的ハッシングに相当するものが理想的です!

4

1 に答える 1

0

コサイン類似度はどうですか?

この手法は、機械学習でテキスト認識の類似度として一般的に使用されます。これを使用すると、2 つのテキスト間の距離 (実際には、任意の 2 つのベクトル間の距離) を計算できます。これは、それらのテキストがどれだけ似ているか (近いほど似ている) として解釈できます。

コサインの類似性を簡単な方法で説明するこの素晴らしい質問を見てください。一般に、レシピを比較するための距離を取得するには、任意の類似度を使用できます。この記事では、さまざまな類似度について説明しています。詳しく知りたい場合は、こちらをご覧ください。

于 2017-06-16T18:23:11.897 に答える