問題タブ [rapidminer]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
xpath - RapidMiner xpath テキスト抽出
RapidMiner では、div クラス「説明」からデータを取得しようとしています。Google XPath インポート XML を使用して構文をテストすると、適切なデータが返されます。RapidMiner で次のことを試すと、空白の結果が得られます。
これは機能します:
しかし、私はそれですべての HTML マークアップ データを取得します。
何を追加または削除する必要がありますか?
同じドキュメントで、これを取得して期待される結果を返すことができました。
XML:
binary - RapidMiner - 二項から整数への変換
Neural Net operator にデータを渡す必要があります。一部の属性は 2 項であり、Neural Net は 2 項データ型を受け入れませんが、整数は受け入れます。2 項から整数 (数値) への型変換演算子はありません。では、どうすればこれを変換できますか?
答えてくれてありがとう
neural-network - Rapidminer - ニューラル ネットワーク オペレータ - 出力信頼度
6 つの入力、1 つの隠れ層、2 つの出力ノード (1; 0) を持つフィードフォワード ニューラル ネットワークがあります。この NN は 0;1 の値で学習されます。モデルを適用すると、各行のこの 2 つの数値の合計が 1 である変数の信頼度 (0) と信頼度 (1) が作成されます。私の質問は、これらの 2 つの数値 (信頼度 (0) と信頼度 (1))正確には?これら2つの数字は確率ですか?
回答ありがとうございます
svm - Rapidminer の Libsvm モジュール
Rapidminer には、libsvm に基づく SVM モジュールがあります。使用している libsvm のバージョンを知るにはどうすればよいですか?
Rapidminer の libsvm モジュールと Libsvm 自体の両方を使用して、同じデータセットに対して SVM 分類器をテストしましたが、結果の予測スコアは、同じパラメーター設定を使用しても異なります。
web-crawler - ウェブサイトをクロールすると不正なデータが返される
ラピッド マイナーを使用して、特定のデータから Web サイトをクロールしています。問題は、ウェブサイトを頻繁にクロールしようとすると、悪いデータが提供されることです。
他の IP アドレスから同じデータが表示された場合、別の IP アドレスでクロールしたデータとは異なるデータが表示されます。
この問題を克服する解決策はありますか?
database - Rapidminer でデータベース ビューを読み取る方法
データベースからビューを Rapidminer に読み込む方法を知っている人はいますか? Microsoft SQL サーバーへの接続が設定されており、Read Database オペレーターを使用していますが、ビューではなく、テーブルのリストのみが表示されます。がセットアップされ、Access を使用して表示できます。ラピッドマイナーで作業している間にビューが処理されているため、ラピッドマイナーでクエリを再作成するのではなく、ビューへのライブ リンクが必要です。欠けているものはありますか、それとも Rapidminer がビューをサポートしていないだけですか?
classification - RapidMiner を使用したクラスタリング プロセスの設計
私は機械学習やクラスタリングの経験があまりないので、この問題にどのようにアプローチすればよいか途方に暮れています。関心のあるデータは 4 つの列で構成され、そのうちの 1 つは単なる ID です。他の 3 つは数値データ、値 >= 0 を含みます。必要なクラスタリングは実際には非常に簡単で、手動で行うこともできますが、後でわかりにくくなるため、適切な種類のプロセスから始めたいと考えています。次のように、3 つの列 (A、B、C と呼びます) に依存する 6 つのクラスターが必要です。
この段階で、これらのクラスターはデータに洞察を与え、さらなる分析に役立ちます。
私はこれにまったく慣れていないので、クラスタリングを行うさまざまなアルゴリズムについてまだ十分に学んでいないため、どこから始めればよいかわかりません。誰かが使用する適切なモデル、または私が調査できるいくつかのモデルを提案できますか.
statistics - Rapidminer のデシジョン ツリーに最適なパラメータは何か
14 個の通常の属性を持つ一連のデータがあります。このトレーニング データからRapidminerで最適なデシソン ツリーを作成して、このツリーをスコアリング データに使用できるようにしようとしています。
しかし、デシジョン ツリーに使用するパラメーターがわかりません (例: 基準、最小ゲイン、信頼度など)。また、自分のモデルに適用できる/適用する必要がある他の演算子を (もしあれば) わかりませんか?
何が最適かについての一般的なヒントを誰か教えてもらえますか?
私が持っているデータは、誰かが新しい銀行口座を開設した場合、信用状態が良好かどうかを判断するためのものです. 信用度、口座の種類、履歴、職歴、性別、職業などの情報を持っています。
ありがとうございました。
text - Rapidminer を使用したテキスト情報の抽出
特定の部分を抽出したいテキスト データのリストがあります。現在、正規表現を使用して必要なデータを抽出していますが、各レコードがわずかに異なるため、非常に複雑になり始めています。いくつかの典型的な例に基づいて、Rapidminer を使用して正規表現を「学習」する方法はありますか?
たとえば、次の各レコードについて、テキストを 2 つの新しい属性に抽出したいと考えてい24
ます18
。
私はすべてのテキスト処理ビデオを見てきましたが、この種のことを行う方法を示しているものはなく、どこから始めればよいのか本当にわかりません. 手動で正規表現を作成する以外に、これを行う方法を提案できる人はいますか?