ドキュメントベースとしてDMOZを使用しており、Luceneを使用してクエリを実行するためにDMOZにインデックスを付けようとしています。このRDFファイルをJavaオブジェクトに変換する必要があると思います。これは正しい方法ですか?もしそうなら、どうすればこのファイルをオブジェクトに変換できますか?
これはRDFファイルの例です:
<RDF>
<Topic>
<catid>121212</catid>
<link r:resource="http://page1.com"></link>
<link r:resource="http://page2.com"></link>
<link r:resource="http://page3.com"></link>
<link r:resource="http://page4.com"></link>
</Topic>
<ExternelPage about="http://page1.com">
<d:Title>the Title1</d:Title>
<d:Description>description1</d:description>
<ages>ages1</ages>
<topic>topic1</topic>
</ExternelPage>
<ExternelPage about="http://page2.com">
<d:Title>the Title2</d:Title>
<d:Description>description2</d:description>
<ages>ages2</ages>
<topic>topic2</topic>
</ExternelPage>
<ExternelPage about="http://page3.com">
<d:Title>the Title3</d:Title>
<d:Description>description3</d:description>
<ages>ages3</ages>
<topic>topic3</topic>
</ExternelPage>
<ExternelPage about="http://page4.com">
<d:Title>the Title4</d:Title>
<d:Description>description4</d:description>
<ages>ages4</ages>
<topic>topic4</topic>
</ExternelPage>
<Topic>
<catid>
.
.
.
.
</Topic>
<ExternelPage about="aLink">
.
.
.
etc...
</RDF>
ありがとう。