問題タブ [rapidminer]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
3478 参照

performance - Rapidminer を使用してテストセットをテストするには?

Rapidminer を使用して分析を行っています。いくつかのモデルでクロス検証を使用して、最適なモデルを取得しました。ここで、このモデルを使用して、Split Data を使用して作成した別のテストセットでテストし、パフォーマンスを推定したいと考えています。

お試しセットの使い方は?私が知る限り、すべての検証モジュールは、モデルが作成されたトレーニング セットを使用しています。モデルとテスト セットを取り込んで、どのパフォーマンス メジャーを使用できますか?

0 投票する
2 に答える
28116 参照

machine-learning - ラピッドマイナー:データセットに「ラベル」属性を追加する方法は?

CSV からインポートしたデータセットに決定木学習アルゴリズムを適用したいと考えています。問題は、ディシジョン ツリー ブロックの "tra" 入力がまだ赤く、"入力例セットには特別な属性 'ラベル' が必要です" と表示されていることです。そのラベルを追加するにはどうすればよいですか? それは何ですか?私は結果なしでしばらくの間それをいじっていました。どんな助けでも感謝します。

補遺: コラムのタイトルは正しく推測されているため、「ラベル」が何であるかはわかりません。

0 投票する
1 に答える
163 参照

rapidminer - 名前付きのテキストを順番に保存する

RapidMiner 5 GUI を使用していますが、属性のすべての値を別のテキスト ファイルに保存したいと考えています。しかし、書き込みや書き込みドキュメントなどの書き込みユーティリティを使用している場合、データを上書きするか、エラーが発生します。

すべての値を、シーケンスまたは何かが添付された別のファイルに保存したいと考えています。

何か方法はありますか?

0 投票する
2 に答える
1746 参照

rapidminer - Mac OS で RapidMiner のグラフィカル ユーザー インターフェイスを起動できない

lib/rapidminer.jar をダブルクリックしても、rapidminer を起動できませんでした。また、動作しない Java -jar lib/rapidminer.jar も試しました。

試してみたところ./scripts/rapidminer、ラピッドマイナーが起動しました

私も試したGUIを起動したい:./scripts/RapidMinerGUI

Mac で Rapidminer GUI を実行するのを手伝ってください。

0 投票する
1 に答える
531 参照

java - RapidMiner プロセスでカスタム クラスをインポートする

Java でカスタム Stemmer を作成し、このコードの演算子が必要です。Rapidminer 5 でカスタム Java クラスをインポートするにはどうすればよいですか?

ありがとうございました!!!

0 投票する
2 に答える
244 参照

data-mining - 大規模なデータベースから小さくて独特なサブセットを分類する方法は?

保険契約に関する情報を含むデータベースでデータ マイニング タスクを実行する必要があります。各タプルは、単一のポリシーに関するデータを、それを発行した機関、それが参照している顧客、およびその他のフィールドに関する情報とともに示します。これは、架空のテーブル ポリシー、顧客、および機関の間の製品のようなものです。フィールドは次のとおりです。

ポリシーの種類、ID 番号、ポリシーのステータス、商品の説明、商品の組み合わせ、発行日、発効日、満期日、保険期間、ローン期間、解約日、解約の理由、合計保険料、スプリッター保険料、ID パートナー、ID エージェンシー、国代理店、ID ゾーン、代理店の可能性、性別契約者、誕生年契約者、雇用契約者、性別被保険者、雇用被保険者、誕生年被保険者、製品エリア、法的形態、ID クレーム、年クレーム、ステータスクレーム、規定クレーム、支払いクレーム

これは学術的な課題であり、教授は解約率、クロスセリング、アップセリングを特定することを望んでいます。私はこの分野にあまり詳しくないので、ウィキペディアでそれらの用語を探しました。解約率から始めましたが、この場合、ポリシー ステータスが「キャンセル」に設定され、キャンセルの理由が「顧客のキャンセル」である顧客の特性を特徴付ける必要があるように思われます。

Rapid Miner を使用して、デシジョン ツリーとルール マイニングを適用しようとしましたが、関心のあるサブセットが非常に小さいため、出力モデルは、全体的には精度が高いにもかかわらず、取り消されたポリシーを予測する精度が非常に低くなります。これは、キャンセルされたポリシーのサブセットが非常に小さいために発生します。また、キャンセルされたポリシーを誤分類するコストが他のポリシーに比べて法外に高い (100 万倍など) 特定のコスト マトリックスを使用して MetaCost 演算子を適用しようとしましたが、結果はまったく変わりませんでした。

現在の私の最善の選択肢は、ルール マイニングにシーケンシャル カバー アルゴリズムを使用することですが、ラピッド マイナーはそれを実装していないため、手動でコーディングする必要があります。

キャンセルされたポリシーの小さなサブセットに対して適切なモデルを構築する方法について何か提案はありますか?

注: 匿名ではありますが、実際の情報源からのものであるため、データベースやそこに含まれるデータを開示することはできません。