次の形式のテキスト ファイルに注釈を付けました。
<paragraph><weakness>Buffer</weakness> <weakness>Overflow</weakness>
in <location>client/mysql.cc</location> in <application>Oracle</application>
<application>MySQL</application> and <application>MariaDB</application>
<version>before</version> <version>5.2</version> <vulnerability>allows
</vulnerability> <vulnerability>remote</vulnerability>
<application>database</application> <application>servers</application>
...
...
私がやりたいことは、上記のテキスト ファイルを解析して次の形式にする Java コードを作成することです。
Buffer weakness
overflow weakness
in O <--- 'O' means doesn't have annotation
Oracle application
MySQL application
...
...
ファイルをトークン化しようとしましたが、問題は、解析とフォーマットを再度行うことで、有用な情報が失われる可能性があることです!!
助けてください!!