サイト内にある一連の要素を指定して、製品を説明する「もの」である可能性が高いものを返すアルゴリズムを作成しようとしています。
もちろん、これは 100% 正確なアルゴリズムではなく、後で人に基づいた選択が必要になりますが、少なくとも 3 つの最も可能性の高い画像のリストを取得しようとしています。これが私がこれまでに行ったことです:
1 - 50x50px より小さい正方形サイズを取り除く
2 - ページ内のすべての正方形サイズの平均を計算する
3 - 平均正方形サイズとの差に応じて、それぞれにスコアを付けます (正方形サイズが大きいほどスコアが高くなります)。
4 - の幅が (高さ * 5) より大きい場合、スコア = スコア * 0.5 (これはページ内のバナーである可能性が高いためです)。
これが私が変更したいことですが、そうするための良い方法は何かわかりません。ステップ 3 で、私が現在行っていることは、次のスコアを与えることです。
score_of_image = average_square_size - square_size_image
サイズに応じて全員に分配される特定の量のポイントが必要です。シェアアウトは、他の画像に関連する 1 つの画像のサイズを反映する必要があります。これらの点を共有するための良いアルゴリズムは何でしょうか?