分析を行うために RDF データを JUNG グラフにロードしています。だから私は新しいグラフを作成します:
DirectedGraph g = new DirectedSparseGraph<String,GraphLink>();
リンクを指定するためのサポート クラスを作成しました。
public class GraphLink {
String uri;
Float weight;
}
次に、次のように入力します。
for each rdf triple <s,p,o>{
g.addVertex( s )
g.addVertex( o )
GraphLink link = new GraphLink()
link.uri = pred
link.weight = some weight;
g.addEdge( link, s, o )
}
これは効率的な方法ですか、それとももっと良い方法がありますか? エッジの表現は非常に直感に反しますが、そうすると:
g.addEdge( p, s, o )
重複したエッジの例外が発生します。
ヒントはありますか?
更新:このコードはうまくいくようです:
DirectedGraph<RDFNode,Statement> g = new DirectedSparseGraph<RDFNode,Statement>()
// list all statements
// TODO: pagination for very large graphs.
assert m.size() < 10000000,"graph is too large."
m.listStatements().each{ stm->
RDFNode sub = stm.getSubject()
RDFNode obj = stm.getObject()
g.addVertex( sub )
if ( includeLiterals || !obj.isLiteral() ){
g.addVertex( obj )
g.addEdge( stm, sub, obj, EdgeType.DIRECTED )
}
}
ムロン