PythonでParselargeRDFのコードを使用してかなり大きなNTriplesファイルを解析しようとしています
raptorとPython用のredland-bindingsをインストールしました。
import RDF
parser=RDF.Parser(name="ntriples") #as name for parser you can use ntriples, turtle, rdfxml, ...
model=RDF.Model()
stream=parser.parse_into_model(model,"file:./mybigfile.nt")
for triple in model:
print triple.subject, triple.predicate, triple.object
ただし、プログラムがハングし、すぐに起動しないため、ファイル全体をメモリなどにロードしようとしているのではないかと思います。
誰かがこれを解決する方法を知っていますか?