0

Rapidminer に関しては、3 つの列 (トランザクション ID、製品の説明、値) と約 100 万行のデータセットがあります。

FP-Growth を適用して関連付けを作成しようとしていますが、プロセスの「数値から二項式へ」の段階でメモリが原因で失敗し続けます。56GB の RAM を割り当てました。

「このプロセスは、使用可能な最大メモリ量を超える必要があります。そのままにしておくこともできます...」 添付の例

ここで何か間違ったことをしていますか?これに対処するには56GBのRAMで十分だと思っていたでしょう.

どんな助けでも大歓迎です

ありがとう。

4

1 に答える 1

0

古いバージョンの RapidMiner を使用しているようです。バージョン 6.5 では、RapidMiner のライセンス モデルが変更され、メモリの制約がなくなりました。以下のプロセスは、10 GB の RAM が割り当てられたマシンで 3 秒以内に実行されます。

<process version="7.0.001">
  <context>
    <input/>
    <output/>
    <macros/>
  </context>
  <operator activated="true" class="process" compatibility="7.0.001"     expanded="true" name="Process">
    <process expanded="true">
      <operator activated="true" class="generate_data"     compatibility="7.0.001" expanded="true" height="68" name="Generate Data" width="90" x="112" y="34">
        <parameter key="number_examples" value="1000000"/>
        <parameter key="number_of_attributes" value="2"/>
      </operator>
      <operator activated="true" class="numerical_to_binominal" compatibility="7.0.001" expanded="true" height="82" name="Numerical to Binominal" width="90" x="313" y="34">
        <parameter key="min" value="-10.0"/>
      </operator>
      <connect from_op="Generate Data" from_port="output" to_op="Numerical to Binominal" to_port="example set input"/>
      <connect from_op="Numerical to Binominal" from_port="example set output" to_port="result 1"/>
      <portSpacing port="source_input 1" spacing="0"/>
      <portSpacing port="sink_result 1" spacing="0"/>
      <portSpacing port="sink_result 2" spacing="0"/>
    </process>
  </operator>
</process>
于 2016-02-19T11:53:00.920 に答える