3

大量の Twitter ツイートを保存する必要がある

  • ツイートに最適なデータベースの種類はどれですか → 最良の推測はTEXT
  • 重複も防ぐ必要があります。varchar(255)→との最良の推測UNIQUE key
    • varchar(140)キャラクターはうまくいくかもしれませんが、中国のキャラクターもありますか?(多くのスペースを節約できます)

もう 1 つのアイデアは、すべてのツイートを として保存しTEXT、MD5 にハッシュされたツイートを含む別の列を追加しUNIQUE key、その列に a を追加することです。

質問: ツイートを保存するのに最適な MySQL タイプは何ですか?

4

3 に答える 3

5

編集

Twitter は、140 文字の制限に対してユーザー ハンドルなどをカウントしなくなったためユーザーvarchar(140)ハンドルを含む長いツイート全体を保存するには不十分です。

ただし、調べてみると、ハンドルを介して別の Twitter ユーザーに言及するときに、まだ 140 文字を超えることができません。

元の答え

varchar(140)utf8形式で。

TEXT恐ろしく非効率になります。char(140)あまりにも多くのスペースを浪費します。

これが私の答えを裏付けているわけではありませんが、テクノロジーと効率性については興味深い読み物です。

于 2012-05-04T20:28:20.883 に答える
2

ツイートは 140 文字の文字列として定義されているため、nvarchar(140)「最高」と呼ぶのは少しおこがましいように保存できます。

http://en.wikipedia.org/wiki/Twitter

http://support.twitter.com/groups/31-twitter-basics/topics/109-tweets-messages/articles/127856-about-tweets-twitter-updates

MD5 ハッシュを行う理由はありません。それが実際の意図である場合は、列に一意性制約を設定するだけです。

于 2012-05-04T20:28:14.317 に答える
2

ツイートは最大140文字なので、それを確実に使用します。

varchar(140)私が使うものです。

于 2012-05-04T20:28:50.483 に答える