問題タブ [information-gain]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R での情報取得
C4.5 ディシジョン ツリーで主な属性を選択するための「情報ゲイン」を計算するために使用されているパッケージを見つけたので、それらを使用して「情報ゲイン」を計算してみました。
しかし、各パッケージの計算結果は、以下のコードのように異なります。
各パッケージの計算結果が異なるのはなぜですか?
r - information.gain を実行できません
1500 万のデータで information.gain を実行しようとしています。使用したコード:
しかし、私はこのエラーが発生しています。
.jnew("java/lang/String", k) のエラー: java.lang.OutOfMemoryError: GC オーバーヘッド制限を超えました
これをどのように克服すればよいですか?
このコードを使用しようとしましたが、まだ機能しませんでした:
machine-learning - ラプラス平滑化による負の情報利得の取得
ラプラス平滑化も使用すると、負の情報利得を得ることができますか?
私たちは知っています:
ここで、H はエントロピー関数、IG は情報ゲインです。
また:
H(Y) = -Σy P(Y= y ).log 2 (P(Y=y))
H(Y|X) = Σ × P(X=x).H(Y|X=x)
H(Y|X=x) = -Σy P(Y= y |X=x).log 2 (P(Y=y|X=x))
たとえば、 P(Y=y|X=x) = n y|x /n xとします。しかし、n x = 0 かつ n y|x = 0 である可能性もあります。したがって、ラプラス平滑化を行い、P(Y=y|X=x) = (n y|x +1)/(n x +| X |))。ここで |X| X が取り得る可能な値の数を示します (X が属性として選択された場合に可能な分割の数)。ラプラス平滑化により、負の情報が得られる可能性はありますか?