問題タブ [rapidminer]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
rapidminer - RapidMiner のディシジョン ツリーへのテキスト ベクトル
1 件の ad-jerry ad-bruckheimer ad-chase ad-premier ad-sept ad-th ad-clip ad-bruckheimer ad-chase ページが見つかりました
-1 ad-symptom ad-muscle ad-weakness ad-genetic ad-disease ad-symptom ad-include ad-search ad-learn ページが見つかりました
1 1:1 2:1 3:1 4:1 5:1 6:1 7:1 8:1 9:1
-1 8:1 9:1 429:1 430:1 431:1 432:1 433:1 434:1 435:1 436:1
私はテキスト ベクトルとそれに対応する項ベクトルを持っています。ラピッド マイナーで ID3 アルゴリズムを使用して決定木を学習したいのですが、ID3 アルゴリズムでそのようなデータを処理する方法がわかりません。ID3(Read CSV->ID3->Model) を term vector で実行しようとしましたが、正しく動作しているかどうかわかりません。助けてください。
regex - データを処理する前に、サンプル セットからテキストを削除するにはどうすればよいですか?
RapidMiner 5.3.013 を使用しています。Remedy の数千行の作業ログを含む Excel ファイルから読み取っています。正規表現に基づいてテキストを削除し、^[A-Z][\w\d/?(# ]+[\w0-9#)]{2}:
Process Documents from Data を使用したいと考えています。これまでのところ、これを行う方法がわかりません。おそらくVBAを書くこともできますが、Rapidminerでそれを行う方法を知りたい.
javascript - サイトをクロールして各ページの JavaScript 変数を取得する方法はありますか?
私が働いている会社は、数か月以内にサイトの再設計を行う予定です。必要なものの 1 つは、サイトのすべてのページのすべての URL を含むテーブルです。次に、事前定義された一連の JavaScript 変数 (この場合は Omniture 変数) の値を含む列が最適であり、各ページがサイト階層内の場所で適切にタグ付けされていることを確認できます)。
特定のページの HTML に含まれる内容の例を次に示します。
RapidMiner を使用してサイトをクロールし、データの準備が整いましたが、私の問題は、これらの変数を分離し、"metrics_level2"、"metrics_level3" などを独自の列に配置する最善の方法です。XPathはそれを行うための最良の方法ですか? 正規表現?私の XPath での試みは、タグ間のコンテンツ全体を取り込んでいるように見えます。これには、事後に多くのクリーンアップが必要です。
r - Rapidminer : UNIX タイムスタンプの変換
UNIXタイムスタンプをdate_time属性に変換する方法を知っている人はいますか?
タイムスタンプを変換するために as.POSIXct 関数などの R 拡張機能 (私の演算子は主に R で記述されています) を使用しようとしましたが、rapidminer はそれを気に入らず、無視し続けているようです。
どんな助けでも大歓迎です
ありがとう
machine-learning - Rapidminer - プロセス ドキュメントがテキストに規則的に作成されているため、学習アルゴリズムを適用できません
次のプロセスがあります。
- ファイルからドキュメントを処理します (それぞれの 6 つのクラスを含むテキスト ファイルをロードします) --> これは役割の設定に接続します (機械学習を可能にするためにテキスト属性を REGULAR 属性に変更します) ->データからドキュメントを処理します(単語ベクトルは必要ありませんそのため、チェックを外し、テキストを保持し、このプロセス内でトークン化、ストップワード、ステミングなどを行い、これを検証オペレーターにフィードします。(ベイズ/svm)
ここで何が起こっているかというと、サンプル セットでは、[データからドキュメントを処理] を実行した後、テキスト列が通常の "TEXT" 型に戻ります。したがって、通常の属性がゼロであるため、 Input ExampleSet has no attributesというエラーが表示されます。そして、これがプロセスの失敗を引き起こしています。理由がわかりません。この後、ロールを再度設定しようとしましたが、「サンプルセットにサンプルがありません」というエラーが表示されます
助けてください。私は2日間立ち往生しています!!!
編集:私は問題を知っていると思います-いくつかの例でデータセットに10倍のX-Validationを適用していました