0

次の形式のデータがあります

<foo bar> <property abc> <this foo bar> .

この文字列には、基本的に 4 つの部分がありますfoo barproperty abc; this foo bar; と.。上記の文字列をこれらの 4 つの部分にトークン化するにはどうすればよいですか?

4

2 に答える 2

1

他の人が示唆しているように、RDF グラフを解析したい場合は、Apache Jenaなどのライブラリを使用するだけです(免責事項- 私は開発者の 1 人です)。

問題が解析プロセスを直接制御する必要がある場合は、いくつかのオプションがあります。

  • Jena には、テキスト レベルでデータを操作する場合に、NTriple/Turtle/SPARQL のようなデータをトークン化できる TokenizerText クラスがあります
  • StreamRDFインターフェースを実装し、これを組み込みのパーサーで使用して、トリプル/クワッド レベルで解析されるときにデータに何が起こるかを制御できます。
于 2013-08-26T21:07:58.877 に答える