python - バルブを使用して Titan にデータをロードし、アクセスする

Question

私はグラフデータベースとすべての Titan エコシステムの完全な初心者です。私もドキュメントの不足に苦しんでいます-_-

タイタンサーバーをインストールしました。Cassandra をバックエンドとして使用しています。

Python を使用して基本的な Twitter データを Titan に読み込もうとしています。この目的のために、電球ライブラリを使用します。たとえば、Twitter でフォローしている人のリストが友達リストにあるとします。

私のpythonスクリプトは次のようになります

from bulbs.titan import Graph
# some other imports here

# getting the *friends* list for a specified user here


g = Graph()

# a vertex of a specified user
center = g.vertices.create(name = 'sergiikhomenko')


for friend in friends:
    cur_friend = g.vertices.create(name = friend)
    g.edges.create(center,'follows',cur_friend)

私が理解していることから-上記のコードは、いくつかの頂点を持つTitanでグラフを作成する必要があり、そのうちのいくつかは次のエッジで接続されていました。

私の質問は次のとおりです。

Titanに保存するにはどうすればよいですか?? (SQL のコミットのように)

後でアクセスするにはどうすればよいですか?? グレムリンシェルからアクセスできるはずですか?? はいの場合、どのように??

私の次の質問は、データの視覚化についてですが、私はそこからはほど遠いです:)

助けてください:)私はこのタイタン、グレムリン、レクスターなどすべてに完全に迷っています。:)

更新:私たちの POC プロジェクトの要件の 1 つは、... python :) です。私は間違いなく以下のアドバイスに従います:)

score 1 · Accepted Answer

電球に関する回答を実際に提供することはできないため、私の回答はやや不完全ですが、回答を試みることができる特定の質問をいくつかしてください。

Titanに保存するにはどうすればよいですか?? (SQL のコミットのように)

g.commit()Java/Groovy だけです。

後でアクセスするにはどうすればよいですか?? グレムリンシェルからアクセスできるはずですか?? はいの場合、どのように??

cassandra にコミットしたら、Bulbs、gremlin シェル、その他のアプリケーションなどでアクセスします。あなたが本当に何を求めているのかわかりませんが、私はそのようなことのためにGremlin Consoleが好きなので、cassandraがローカルで開始されている場合は、起動しbin/gremlin.shて実行してください:

g = TitanFactory.build()
    .set("storage.backend","cassandra")
    .set("storage.hostname","127.0.0.1")
    .open();

これにより、cassandra への接続が確立され、データをクエリできるようになります。

私はこのタイタン、グレムリン、レクスターなどのすべてに完全に迷っています。

すべての新規ユーザー (特に、グラフ、cassandra、jvm などを初めて使用するユーザー) への私のアドバイスは、速度を落とすことです。やる気をなくす最も早い方法は、パイソンからバルブ、レクスター、グレムリン、タイタン、ec2 でホストされている cassandra クラスター、hadoop を実行して、10 億のエッジグラフをロードすることです。

初めての方は、最新のものから始めてください: TinkerPop3 - http://tinkerpop.incubator.apache.org/ - この電球はまだサポートされていません - しかし、TinkerPop を学んでいるので、それは全体を学ぶ上で重要です。スタックと TinkerPop のすべての実装 (Titan など)。TinkerGraph (Titan ではなく) をデータの小さなサブセットで使用し、フルスケールに移行する直前に、その小さなサブセットを読み込むためのパターンを取得してください。この最初の目標に関連するすべての作業には、Gremlin コンソールを使用します。それは簡単に勝つためのレシピです。このアプローチでは、1 日のうちに自分のデータに対していくつかのクエリを実行するグラフを作成し、Titan で行う必要があることのかなりの部分を学ぶことができます。

グラフを作成したら、それをGremlin Server (TP3 の Rexster 代替) で動作させます。次に、python ツールを介してアクセスする方法を考えてみましょう。または、TinkerGraph を Titan に変換する方法を理解しているかもしれません (おそらく、cassandra ではなく BerkeleyDB から始めてください)。ここでの私のポイントは、エコシステムのさまざまな部分への関与を徐々に増やしていくということです。

python - バルブを使用して Titan にデータをロードし、アクセスする

1 に答える 1

Related

Reference