python - Statsmodel .predict はレコードを省略または削除します

翻译自：https://stackoverflow.com/questions/19064092 2013-09-28T06:33:51.283

155 次

より大きなデータセットをサンプリングして、statsmodels GLM モデルに適合させて予測しています。

サンプルによっては、実行によって、model.predict返される配列内のいくつかの少数 (<10) のレコードが省略されます。データセット内の少数の行を処理する際にエラーが発生したと思います。

たとえば、行 15000:20000 を使用して予測すると、返される配列の形状は 4994 または 4997 などになります。

どの行が省略されているかがわからないため、これは面倒です。データフレーム全体で .predict 関数を実行し、予測値を新しい列として簡単に追加したいと考えています。

誰かが（a）何が起こっているのか、それを修正する方法を知っているか、（b）インデックスに基づいてデータフレームに予測値を追加するための良い方法を持っていますか?

0 に答える 0