-1

サイト内にある一連の要素を指定して、製品を説明する「もの」である可能性が高いものを返すアルゴリズムを作成しようとしています。

もちろん、これは 100% 正確なアルゴリズムではなく、後で人に基づいた選択が必要になりますが、少なくとも 3 つの最も可能性の高い画像のリストを取得しようとしています。これが私がこれまでに行ったことです:

1 - 50x50px より小さい正方形サイズを取り除く
2 - ページ内のすべての正方形サイズの平均を計算する
3 - 平均正方形サイズとの差に応じて、それぞれにスコアを付けます (正方形サイズが大きいほどスコアが高くなります)。
4 - の幅が (高さ * 5) より大きい場合、スコア = スコア * 0.5 (これはページ内のバナーである可能性が高いためです)。

これが私が変更したいことですが、そうするための良い方法は何かわかりません。ステップ 3 で、私が現在行っていることは、次のスコアを与えることです。

score_of_image = average_square_size - square_size_image

サイズに応じて全員に分配される特定の量のポイントが必要です。シェアアウトは、他の画像に関連する 1 つの画像のサイズを反映する必要があります。これらの点を共有するための良いアルゴリズムは何でしょうか?

4

1 に答える 1

1

いくつかの側面が他の側面と比べてどれほど重要かを判断する必要があると思いますが、単純に画像のサイズ (幅 x 高さ) を計算し、それをスコアの最初の部分として使用することもできます。これをどのように評価するかは、ページ上の最大の画像の領域を記録し、他の部分をその割合として計算することです. 最大の画像が製品画像である可能性が最も高いと想像するため、平均画像サイズが実際にここに追加されるとは思いません.

次に、次のようにして、直角度の別のスコアを計算します。

if (height > width) {
    result = (width/height) * max_points_for_squareness;
} else {
    result = (height/width) * max_points_for_squareness;
}

したがって、これらの 2 つの側面の間で 2 つのパーセンテージが得られ、これを使用して合計スコアを任意に配分できます (必要に応じて直角度にさらにポイントを割り当てたり、画像サイズにさらにポイントを割り当てることができます.

于 2013-10-15T14:58:42.817 に答える