そこで、Pig XMLloader を使用して Vertex データと Edge データを表す 2 つの XML ファイルを Hadoop/HDFS にロードし、そこから Hive テーブルを作成しました。
この頂点とエッジのデータを使用して、Spark GraphX ベースのグラフ データベースを作成したいと考えています。Spark GraphX のドキュメントから、フラット ファイル ソースに加えて、HBASE テーブルを使用して Spark GraphX をソースできることを理解しました。Hive などの他の構造化されたビッグ データ ソースの使用に関する Spark GraphX のドキュメントは見つかりませんでした。
ただし、SparkSQL では、構造化データのソースとして Hive がサポートされています。JSON 構造化データも SparkSQL 内でサポートされています。
SparkSQL での Hive のサポートは、HiveContext を使用する Hive が Spark GraphX でネイティブにサポートされることも意味しますか? .jsonFile(name.json) をソースとして使用して VertexRDD を作成するための JSON ソース ファイルの使用についてはどうですか?