問題タブ [discretization]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
622 参照

r - 離散化データは数値で、整数行列に変換しますか?

R でRWekaを使用してデータセットを離散化します。

しかし、出力を整数行列として欲しいです。

例: パッケージDiscretization in R のすべての出力は整数行列です。

0 投票する
1 に答える
547 参照

machine-learning - 連続/数値特徴の相互情報量

連続/数値機能の相互情報を計算する必要があります。これに基づいて機能選択を適用したいと思います。機能セットの説明を以下に示します

feature1: 1 ~ 10000 の間の任意の値を想定できます feature2: 何かに費やされた時間を測定します - したがって、整数 (大) 以外の任意の値を想定できます .... 私はこの種の機能を持っています。

これに相互情報量の公式を適用することに混乱しています。ウィキペディアによると、統合には連続変数が必要です。

MI を適用する前に特徴を離散化する必要がありますか??

0 投票する
5 に答える
20917 参照

scikit-learn - sklearnで連続属性の離散化を行うには?

私のデータは、連続的特徴とカテゴリ特徴の組み合わせで構成されています。以下は、私のデータがcsv形式でどのように見えるかの小さなスニペットです(さまざまな都市で店舗を運営するスーパーストアチェーンによって収集されたデータと考えてください)

彼女を見ると、avg_income_in_city、square_feet_of_store_area、および avg_revenue が連続値であり、city、store_type などはカテゴリ クラスであることがわかります (データの簡潔さを維持するために、ここでは示していません)。

収益を予測するためにデータをモデル化したいと考えています。問題は、sklearn を使用して連続値を「離散化」する方法です。sklearn は、連続値の離散化のための「既製の」クラス/メソッドを提供していますか? (Orange のように、Orange.Preprocessor_discretize(data, method=orange.EntropyDiscretization()) など)

ありがとう !

0 投票する
1 に答える
748 参照

data-mining - 選択した列を weka で離散化する

weka で選択した列を離散化することは可能ですか? データセットに 42 列あり、経度と緯度のみを離散化 (間隔で分割) したいのですが、すべての列が離散化されています。

0 投票する
1 に答える
583 参照

entropy - ファヤドとイラニの離散化の実装

Fayad と Irani のエントロピー ベースの離散化を実装する Java コードはありますか? ファイルを読み取ってから、エントロピーと情報ゲインを計算してみました。境界点を取得するには?

エントロピーと情報利得に基づく Fayad と Irani の離散化アルゴリズムを実装する必要があります ([Fayad and Irani, 1993]