3

主に関連するタグを探して、関連する動画を取得する方法を見つける必要があります。

まず、タグがデータベースに保存される方法を見てみましょう。

ここに画像の説明を入力

これは MySQL データベースではないことに注意してください。私はCassandraを使用しています。

ご覧のとおり、各タグには、そのタグを持つ投稿 ID のリストが含まれています。この方法で投稿 ID を取得するのは簡単です。SQL 言語では次のように言います。

SELECT * from tags WHERE id = "cars" AND id = "movies".

さて、この部分は簡単です。関連するタグが付いた投稿がたくさんありますよね?

しかし、ここで私が克服できない問題が発生します。ある投稿には他の投稿よりも多くの関連タグを付けることができるため、他の投稿よりもはるかに重要になります。もちろん、どの投稿がより関連性の高いタグを持っているかを確認するために何かをハックすることもできますが、ここで別のもっと深刻な問題が発生します。

20 個のタグがあるとします。20 行を探します。これらの 20 行には合計で約 1 億の ID が含まれており、1 億の ID を実行し、それらを相互に比較するには、多くのリソースと時間が必要になります。それで、この状況をどのように改善できるかを尋ねています。

4

1 に答える 1