より大きなデータセットをサンプリングして、statsmodels GLM モデルに適合させて予測しています。
サンプルによっては、実行によって、model.predict
返される配列内のいくつかの少数 (<10) のレコードが省略されます。データセット内の少数の行を処理する際にエラーが発生したと思います。
たとえば、行 15000:20000 を使用して予測すると、返される配列の形状は 4994 または 4997 などになります。
どの行が省略されているかがわからないため、これは面倒です。データフレーム全体で .predict 関数を実行し、予測値を新しい列として簡単に追加したいと考えています。
誰かが(a)何が起こっているのか、それを修正する方法を知っているか、(b)インデックスに基づいてデータフレームに予測値を追加するための良い方法を持っていますか?