問題タブ [information-gain]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
0 に答える
1086 参照

r - R での情報取得

C4.5 ディシジョン ツリーで主な属性を選択するための「情報ゲイン」を計算するために使用されているパッケージを見つけたので、それらを使用して「情報ゲイン」を計算してみました。

しかし、各パッケージの計算結果は、以下のコードのように異なります。

各パッケージの計算結果が異なるのはなぜですか?

0 投票する
0 に答える
82 参照

r - information.gain を実行できません

1500 万のデータで information.gain を実行しようとしています。使用したコード:

しかし、私はこのエラーが発生しています。

.jnew("java/lang/String", k) のエラー: java.lang.OutOfMemoryError: GC オーバーヘッド制限を超えました

これをどのように克服すればよいですか?

このコードを使用しようとしましたが、まだ機能しませんでした:

0 投票する
0 に答える
146 参照

machine-learning - ラプラス平滑化による負の情報利得の取得

ラプラス平滑化も使用すると、負の情報利得を得ることができますか?

私たちは知っています:

ここで、H はエントロピー関数、IG は情報ゲインです。

また:

H(Y) = -Σy P(Y= y ).log 2 (P(Y=y))

H(Y|X) = Σ × P(X=x).H(Y|X=x)

H(Y|X=x) = -Σy P(Y= y |X=x).log 2 (P(Y=y|X=x))

たとえば、 P(Y=y|X=x) = n y|x /n xとします。しかし、n x = 0 かつ n y|x = 0 である可能性もあります。したがって、ラプラス平滑化を行い、P(Y=y|X=x) = (n y|x +1)/(n x +| X |))。ここで |X| X が取り得る可能な値の数を示します (X が属性として選択された場合に可能な分割の数)。ラプラス平滑化により、負の情報が得られる可能性はありますか?