ファイルを読み取り、いくつかのノードを抽出するために、Rapidminer で Read XML を使用しています。
私の問題は、ノードが XML ファイルに複数回出現するたびに、Rapidminer がすべてのノード値を抽出し、値の間にスペースを入れずに文字列を作成することです。代わりに、コンマ区切りの文字列が必要です。
したがって、XPath 属性の場合:
//nounPhrase/node()
そして XML コード:
<extractedData>
<nounPhrase occurrence="1" origin="syllabs">homme blanc</nounPhrase>
<nounPhrase occurrence="1" origin="syllabs">peine</nounPhrase>
<nounPhrase occurrence="2" origin="syllabs">religieuse</nounPhrase>
<nounPhrase occurrence="1" origin="syllabs">peur</nounPhrase>
</extractedData>
Rapidminer は次の文字列を抽出します。
homme blancpeinereligieusepeur
私が欲しかったのは次のとおりです。
homme blanc, peine, religeuse, peur
誰も何をすべきか知っていますか?Read XML には、抽出のこの側面を制御するオプションはありません。
XML の読み取りに使用している構成:
検査用 xpath: /
属性の xpath: いくつかあり、そのうちの //nounPhrase/node()