Digg、Del.icio.us、StackOverflow などの Web サイトはどのようにタグ付けを実装していますか?
この他の質問には、相互参照テーブルとの多対多の関係の回答が受け入れられていることを知っています。しかし、「ビッグボーイズ」はどのようにそれを行うのでしょうか? 同じ方法?スケーリングはどうですか?
これは、実際のパフォーマンス メトリックによってタグ付けスキーマを分類する、よく引用される記事です: http://tagging.pui.ch/post/37027746608/tagsystems-performance-tests
著者は、おいしいの創設者が、タグ付けに RDBMS を使用することは、負荷がかかる何百万ものアイテムに単純に拡張できないと説明しています。そのような場合には、 Luceneのような代替手段が適している可能性があります。
非常に大規模なシステムでは、追加のJOINクエリのコストが高すぎると確信しています。
タグは、正規化されていない状態でメインテーブルに保存されるか、タグ付けされたアイテムごとに1つの行を持つ個別のタグテーブルが存在する場合があります。