4

私は Cassandra で Titan を使用しており、Gremlin を使用したデータベースのクエリについていくつかの (関連する) 質問があります。

1.) すべての頂点を数えるより速い方法はありますか?

g.V.count()

Titan は、インデックスを使用すると主張しています。しかし、プロパティなしでインデックスを使用するにはどうすればよいでしょうか?

WARN  c.t.t.g.transaction.StandardTitanTx - Query requires iterating over all vertices [<>]. For better performance, use indexes

2.) プロパティ 'myProperty' を持つすべての頂点を数えるより速い方法はありますか?

g.V.has('myProperty').count()

繰り返しますが、タイタンは次のことを意味します。

WARN  c.t.t.g.transaction.StandardTitanTx - Query requires iterating over all vertices [(myProperty<> null)]. For better performance, use indexes

しかし、繰り返しますが、どうすればこれを行うことができますか? 「myProperty」のインデックスは既にありますが、高速にクエリするには値が必要です。

3.) エッジに関する同じ質問...

4

2 に答える 2

1

大規模な分散グラフ データベースでは、カウントを行うのにコストがかかります。多くのデータベースの頻繁な集計数を追跡し、cron ジョブから更新するノードを用意して、手元に置くことができます。通常、前の時間から数百万の頂点がある場合、そのような災害はありません。

于 2014-04-20T16:12:07.143 に答える