問題タブ [imputation]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
82 参照

r - 参加者自身のデータを使用して値を代入する生存分析のためのデータクリーニング

私は生存分析のためにいくつかのデータをクリーニングしている最中であり、特定の被験者内の周囲の値に基づいて欠損データが補完されるようにしようとしています。参加者の最も近い前の値と最も近い後の値の平均を使用したいと思います。後続の値が存在しない場合は、後続の値が存在するまで繰り越された前の値を使用したいと思います。

私は問題をより小さく、より管理しやすい操作とオブジェクトに分割しようとしてきましたが、私が解決策を続けていると、欠損値のすぐ上と下の行に基づいて条件付き書式を使用するようになり、率直に言って、私はこれを行う方法について少し途方に暮れています。私が使用したり、実験したりできる優れた手法を知っていると思われる場合、または解決策を探すときに使用できる優れた検索用語を知っていると思われる場合は、少しガイダンスをいただければ幸いです。

詳細は以下のとおりです。

*太字と下線の文字は、上記のデータセットからの変更を表します

ここでの目標は、ID #1 (変数 ss) の NA 値を次のように取得する方法を見つけることです: 2,2,4,3, 1.5 ,0,0

ID# 2 (変数 ss) は次のようになります: 1,4,0​​, 0 ,0,0,0

ID #3 (変数 ss) は次のようになります: 4,2,1,3,3,2,NA (NA の行は最終的に削除されるため変更なし)

ID #4 (変数 ss) は次のようになります: 3,4,3, 3 , 1.5 ,0,0 (これには複数の変更が必要で、取り組むのが最も難しいと思います)。

0 投票する
1 に答える
3395 参照

python - scikit-learn を使用した Knn 代入

Knn を使用して、データセットに欠損値を代入しようとしています。この方法の概念と、scikit-learn で Knn を使用してこれを行う方法を教えてください。

前もって感謝します。

0 投票する
1 に答える
84 参照

machine-learning - 与えられたデータセットからの入力の近似欠損値

x 属性と y レコードを含むデータ セットがあります。最大 x-1 個の欠損値を持つ入力レコードが与えられた場合、残りの欠損値の 1 つを合理的に近似するにはどうすればよいでしょうか?

したがって、以下の例では、入力レコードに 2 つの値があり (属性 2 と 6 の値で、残りは欠落しています)、属性 8 の値を概算したいと考えています。

分類したい入力を含むデータ テーブル

欠損値が「代入」によって処理されることは知っていますが、一般的に前処理データセットに関する例を見つけています。回帰を使用して欠損値を決定し、理想的には一度構築されたモデルを利用するソリューションを探しています(可能であれば、毎回生成する必要はありません)。