みなさん、こんにちは: 「技術」、「金融」、「健康」などのさまざまなカテゴリのデータベースにニュース記事を保存している場合、分散データベースはこのシステムと RDBMS でうまく機能しますか? 各ニュース項目には、ニュース記事と他のいくつかの項目が添付されます。ただし、クエリが高速になるかどうかは疑問です。
100 万行を超えることはなく、最新 (5 時間以内) の技術記事を入手したいとします。それは「Give me all tech article」(おそらく 10000) のマップ削減になると思います。次に、最新のタイムスタンプを持つものだけを除外します。
私は正しい方法で問題に取り組むことを考えていますか? DDB が最善の解決策でさえありますか? 数年後には500万個になるかもしれませんが、それでも……。