問題タブ [rapidminer]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
rapidminer - SentiWordNet を RapidMiner に接続する方法は?
SentiWordNet はテキスト ファイルです。RapidMiner の「OpenWordNet 辞書」は、exe ファイルのみにアクセスするためにのみ使用できます。SentiWordNet からセンチメント スコアを抽出してさらに処理するにはどうすればよいですか?
前もって感謝します。
machine-learning - Rapidminer でパフォーマンスをマクロとして抽出する
私は分類を行うrapidminerを使用しています。パフォーマンスをマクロとして抽出し、パフォーマンスを測定した後、出力にパフォーマンスを出力したいです。
それを行う方法はありますか?
java - ラピッドマイナーで新しいオペレータのパラメータ設定を追加する方法は?
新しいオペレーターを作成してテストしたら、頻度の高いアイテムセット アルゴリズムの minsupp の定義など、いくつかの構成を設定する必要があります。実際、私は Java コード内でこのパラメーターを定義しています。Rapidminer GUI で新しいオペレーターを選択すると、パラメーター リストに minsup パラメーターが表示されるのが気に入っています。
mysql - RapidMiner で MYSQL データベースを読み取る
RapidMiner 5 で「データベースの読み取り」演算子を使用して、Mysql データベースから「ExampleSet」を読み取ろうとしています。プロンプトが表示されたときに [データベース接続の管理] ウィンドウに「接続 OK」というメッセージが表示されることに気付いたので、データベースとの有効な接続を確立しているようです。
ただし、「データベースの読み取り」プロセスを実行しようとすると、次のエラーが表示されます
「プロセスが失敗しました: .javax.naming.NoInitialContextException の検索に失敗しました: 環境またはシステム プロパティで、またはアプレット パラメータとして、またはアプリケーション リソース ファイルでクラス名を指定する必要があります: java.naming.factory.initial」
このエラーを解釈する方法がわかりません。環境変数を設定する必要がありますか?
java - Rapidminerでラベル付きのouputSetを作成するにはどうすればよいですか?
私たちの研究では、新しいデータマイニング手法の実装を終えています。
Rapidminerに含まれている定義済みのメジャーとパフォーマンス演算子で利益を得たいので、ラベル付きデータセットをパフォーマンス演算子に配信する必要があります。
誰かがラベル付きデータセットを作成する方法を見つけるのを手伝ってもらえますか?(ラベルと予測があります。問題は、ラベル付きセットの形式で出力データテーブルを作成する方法です)。
rapidminer - problems of loading large csv file into rapidminer
I am trying to load a big csv file(about 18G) into rapidminer for building a classification model. The “import configuration wizard” seems has difficulty in loading the data. Therefore, I choose to use the “Edit parameter list: data set meta data information” to set up the attribute and label information. However, the UI-interface only allows me to setup those information column-by-column. My csv file has about 80000 columns. How should I handle this kind of scenario? Thanks.
export - Rapidminer グラフ ビューのエクスポート バグの疑い?
私の質問は、このアドレスを介してRapidminerフォーラムで未回答のままだったので:
ここで再度提案したいのですが、もし答えをご存知でしたら教えてください。
エクスポートを取得するために使用する拡張子の種類 (.pdf、.ps .jpg など) に関係なく、エクスポート エンジンは出力スペース全体ではなく現在のビューのスクリーンショットを好むことに気付きました。私の研究の巨大な決定木をエクスポートする際の問題。
誰かがこの問題について私にアドバイスしてください。
一番、
アミール
java - 新しい exampleSetOutPut フォーマットを定義するには?
新しいオペレーターを作成するときは、データを受け取るための入力ポートと、データを配信するための出力ポートを作成します。入力ポートごとに、そのデータ型を次のように修正します。
また、出力ポートのデータ型を次のように定義します。
この条件は、入力と同じ出力データ型と形式を生成します。私の質問は、入力とは関係なく、新しい出力形式とデータ型を定義する方法です。たとえば、入力形式には数値データ型と 4 つの属性があり、出力データは文字列型で、新しい 2 つの属性を使用する必要があります。
java - ELKI と RapidMiner での LOF 実装とは異なる結果
私は LOF の独自の実装を作成し、結果を ELKI および RapidMiner の実装と比較しようとしていますが、3 つすべてで異なる結果が得られます! その理由を突き止めようとしています。
私の参照データセットは 1 次元の 102 個の実数値で、多くの重複があります。以下に投稿してみます。
まず、RapidMiner の実装です。LOF スコアは、ELKI と私の結果とは大きく異なります。多くは無限大の LOF で戻ってきます。この実装は正しいと検証されていますか?
私の結果は ELKI に似ていますが、まったく同じ LOF 値が得られません。ELKI ソース コードのコメントをざっと見てみると、これは k 近傍の計算方法の違いによるものと思われます。
LOF 論文では、MinPts パラメーター (別の場所では k と呼ばれる) が最小数を指定します。k-近傍に含まれる点の数。ELKI の実装では、k 距離または k 個別距離内のすべてのポイントではなく、k 近傍を正確に k ポイントとして定義していると思います。ELKI が k 近傍をどのように構築するかを正確に確認できる人はいますか? また、ポイント自体を独自の近隣に含めることができるプライベート変数もありますが、デフォルトではそれを含めないようです。
検証目的で LOF スコアが添付されている公開参照データセットを知っている人はいますか?
--- 詳細は後述 ---
参考:ELKIのソースコードはこちら:
http://elki.dbs.ifi.lmu.de/browser/elki/trunk/src/de/lmu/ifi/dbs/elki/algorithm/outlier/lof/LOF.java
RapidMiner のソース コードは次のとおりです。
ここに私のテストデータセットがあります:
4.32323 5.12595 5.12595 5.12595 5.12595 5.7457 5.7457 5.7457 5.7457 5.7457 5.7457 5.97766 5.97766 6.07352 6.07352 6.12015 6.12015 6.12015 6.44797 6.44797 6.48131 6.48131 6.48131 6.48131 6.48131 6.48131 6.6333 6.6333 6.6333 6.70872 6.70872 6.70872 6.70872 6.70872 6.77579 6.77579 6.77579 6.77579 6.77579 6.77579 6.77579 6.77579 6.77579 6.77579 6.77579 6.77579 6.77579 6.77579 6.77579 7.03654 7.03654 7.03654 7.03654 7.03654 7.03654 7.03654 7.03654 7.03654 7.03654 7.03654 7.03654 7.03654 7.03654 7.03654 7.10361 7.10361 7.10361 7.10361 7.10361 7.10361 7.10361 7.10361 7.15651 7.15651 7.15651 7.15651 7.15651 7.15651 7.15651 7.15651 8.22598 8.22598 8.22598 8.22598 8.5538 8.5538 8.5538 8.5538 8.5538 8.5538 8.5538 8.5538 8.5538 8.5538 8.5538 8.5538 8.5538 8.5538 8.5538 8.5538 8.5538 8.5538
たとえば、最初の数値 (4.32323) に対して次の LOF スコアを取得します。
- RapidMiner: 無限大 (MinPts の下限/上限を 10,100 に設定)
- ELKI: 2.6774 (k = 10、distfunction/reachdistfunction をデフォルトに設定)
- 私の実装: 1.9531
私の実装が何をしているかについての詳細:
- MinPts は 10 なので、ポイントの 10 個の異なる隣接点を見つけています。したがって、4.32323 の近傍は、実際には 5.12595 から 6.77579 までの 48 ポイントです。
- それは私に 2.45256 の k-distinct 距離を与えます
- 最初のネイバーの到達可能距離を 1.58277 として計算しています
- サンプルの LRD を 1/(99.9103/48) として計算しています。
- 48 個のネイバーすべての lrd(o)/lrd(p) の合計は 93.748939 です。
- 1.9531 の LOF を取得するには、48 で割ります
rapidminer - RapidMiner 複数のフィルターを順番に
私はRapidMinerを初めて使用します...私がしようとしているのは、ProcessDocuments Operator (サブタスク)-> Tokenize を使用してトークン化する 10 個のドキュメントのリストがあることです...結果は、 10 行の10 x 800 のサンプルセットです。 (ドキュメントごとに 1 つ) および 800 の属性 (トークンごとに 1 つ)。
ここで、800 個のトークンを長さでフィルター処理したいと思います。再び ProcessDocuments オペレーター (サブタスク) ->前の ProcessDocuments オペレーターによって生成されたワールドリストで FilterByLength を使用します...結果は 800 x 700 のマトリックスです... 800 個のトークンに対して 800以前の ProcessDocuments Operator と 700 の削減されたトークンのセット。
私が達成したいのは、Kmeans クラスタリング オペレーターに渡すことができる10 x 700 のサンプルセットです。どうやってやるの?
ありがとう