ファイルをサイトにアップロードするサイトのアイデアがあります。しかし、私が望んでいるのは、そしてそれが可能かどうか疑問に思っているのは、ユーザーが「参照」をクリックしてファイルを選択したときです.サイト。このサイトで質問をすると自動的に表示される「関連する質問」に似ています。
2 に答える
もちろん、それは可能です。ただし、独自の定義と、似ているものを見つけるためのアルゴリズムを考え出す必要があります。
ファイルの種類の違い
異なるファイル タイプは異なる方法で比較する必要があります。たとえば、テキスト ファイルは、類似したファイルを見つけるための差分には適していますが、類似した画像やビデオを比較するのはかなり困難です。
比較の難しさ
また、多数のファイルとの比較は、通常はペアで行われるため、非常にコストがかかります。いくつかの索引付け方法は検索の効率化に役立つ可能性がありますが、これを迅速に行う簡単な方法はわかりません。
クラウドソースの代替
もう 1 つの方法は、サイトのユーザーに類似点を指摘してもらうことです。この方法では、類似性が投票された最も人気のあるファイルのリストを表示するだけです。もちろん、これは新しいファイルをアップロードするときには役に立ちませんが、ユーザーが類似しているものについて洞察を得るのに役立ちます。
コンテンツの類似性を比較するために多くのサイトが行っていることは、ユーザーが項目にタグを付けられるようにすることです。あるアイテムが別のアイテムと同じタグの多くを共有している場合、それらは類似している可能性があります。これはおそらく最も簡単な方法です。
これには、任意のコンテンツ タイプを他のコンテンツ タイプと比較できるという利点もあります。そのため、ビデオと同じタグを持つテキスト ファイルは、類似したものとして表示できます。
ファイルをアップロードせずにファイル名を取得できるため、ファイル名に基づいて検索できます。コンテンツは、アップロード後にのみ利用可能になります。