database - ソーシャルネットワークにより適したデータベースシステムはありますか?

Question

この質問は、highscalability.comの記事「 Why are Facebook, Digg, and Twitter so hard to scale? 」に触発されています。

では、この種のデータをより適切に処理できるデータベースシステム (あいまいですが) はありますか?

score 7 · Accepted Answer

表現しようとしているデータ構造に合わせてデータモデルが調整されたデータベースシステムを持つことは、多くの場合有利です。ソーシャルネットワークは、Allegro GraphやNeo4jなどのグラフデータベースに非常に適しています。

Neo4j ブログには、Neo4j を使用した例とともに、グラフデータベースでソーシャルネットワークを表す方法に関する優れた記事があります。

グラフデータベースの利点は、データが格納されるため、エンティティ間の接続を非常に高速に移動できるため、複雑なネットワークをすばやく移動できることです。これらの操作は通常、現在のリレーショナルデータベースの実装では (せいぜい) 高価な結合操作になります。リレーショナルデータベースと同様に、グラフデータベースには、複数のハードウェアノードへのスケールアウトに関して、まだ若干の問題があります。ただし、複数のハードウェアノードの必要性は、ソーシャルネットワークの種類のデータ用のリレーショナルデータベースよりもグラフデータベースの方がはるかに少なくて済みます。1 台のマシンに数十億のノードがあっても問題ありません。複数のハードウェアノードへのスケールアウトは、キー値ストア内のエンティティが互いに完全に分離されているため、キー値ストアが優れているところです。ここでの問題は、代わりに、ソーシャルネットワークで何も隔離されていないことです。つまり、接続をエミュレートするには、エンティティごとに 1 つずつ、データベースへの複数のクエリが必要です。これは、特に、各クエリで 1 つのレベルの友達しか発見できない、友達の友達のようなクエリの場合は遅くなります。

免責事項: 私は Neo4j チームのメンバーです。

score 1 · Accepted Answer

この記事では、memcached について言及したときに、間接的に答えを伝えました。これは、すべてのデータを RAM に保持するキー値ストアです。明らかに、ハードドライブにデータを保持する追加のデータストアが必要ですが、それらはおそらくキーと値のストアでもあります。これらには、 Hadoop、CouchDB、Tokyo Cabinet、Redisなど、たくさんあります。

テーブルの行全体ではなく、関心のあるフィールドのみを取得する必要があるMonetDBなどの列ストアを使用することもできます。

database - ソーシャル ネットワークにより適したデータベース システムはありますか?

4 に答える 4

Related

Reference

database - ソーシャルネットワークにより適したデータベースシステムはありますか?