次の形式のデータがあります
<foo bar> <property abc> <this foo bar> .
この文字列には、基本的に 4 つの部分がありますfoo bar
。property abc
; this foo bar
; と.
。上記の文字列をこれらの 4 つの部分にトークン化するにはどうすればよいですか?
他の人が示唆しているように、RDF グラフを解析したい場合は、Apache Jenaなどのライブラリを使用するだけです(免責事項- 私は開発者の 1 人です)。
問題が解析プロセスを直接制御する必要がある場合は、いくつかのオプションがあります。