0

ファイルを読み取り、いくつかのノードを抽出するために、Rapidminer で Read XML を使用しています。

私の問題は、ノードが XML ファイルに複数回出現するたびに、Rapidminer がすべてのノード値を抽出し、値の間にスペースを入れずに文字列を作成することです。代わりに、コンマ区切りの文字列が必要です。

したがって、XPath 属性の場合:

//nounPhrase/node()

そして XML コード:

<extractedData>
<nounPhrase occurrence="1" origin="syllabs">homme blanc</nounPhrase>
<nounPhrase occurrence="1" origin="syllabs">peine</nounPhrase>
<nounPhrase occurrence="2" origin="syllabs">religieuse</nounPhrase>
<nounPhrase occurrence="1" origin="syllabs">peur</nounPhrase>
</extractedData>

Rapidminer は次の文字列を抽出します。

homme blancpeinereligieusepeur

私が欲しかったのは次のとおりです。

homme blanc, peine, religeuse, peur

誰も何をすべきか知っていますか?Read XML には、抽出のこの側面を制御するオプションはありません。

XML の読み取りに使用している構成:

検査用 xpath: /

属性の xpath: いくつかあり、そのうちの //nounPhrase/node()

4

2 に答える 2