私は MongoDB に比較的慣れていませんが、今のところ非常に感銘を受けています。ただし、ドキュメントストアをセットアップする最良の方法に苦労しています。Twitter データを使用して要約分析を実行しようとしていますが、ツイートをユーザー ドキュメントに入れるか、別のコレクションとして保持するかがわかりません。ツイートをユーザー モデル内に配置すると、すぐにサイズの限界に達してしまうようです。その場合、ユーザーのツイートのグループ全体で MapReduce を実行できるようにするための良い方法は何ですか?
漠然としすぎていないことを願っていますが、ドメイン モデルをセットアップする限り、具体的になりすぎたり、間違った道を進みすぎたりしたくありません。
皆さんはもう聞き飽きていると思いますが、私はスキーマを次のようにレイアウトする RDB ランドに慣れています。
| USER |
--------
|ID
|Name
|Etc.
|TWEET__|
---------
|ID
|UserID
|Etc
Mongoの論理スキーマは次のようになります
User
|-Tweet (0..3000)
|-Entities
|-Hashtags (0..10+)
|-urls (0..5)
|-user_mentions (0..12)
|-GeoData (0..20)
|-somegroupID
しかし、ユーザー ドキュメントがすぐに容量を超えて肥大化することはありません。しかし、somegroupID が似ているユーザーのツイートを分析したいと考えています。上記のモデル レイアウトは概念的には理にかなっていますが、どの点があまりにも扱いにくいのでしょうか? そして、実行可能な代替手段は何ですか?