Gaussian Naive Bayes を使用して Pandas データ フレームからモデルをトレーニングしていますが、precision_recall_curve を使用するとエラーが発生します。ドキュメントには、precision_recall_curve が予測確率を入力として受け取ると記載されているため (少なくとも私が読んだ限りでは)、以下が機能すると予想されます (xtrain と xtest はそれぞれ 736 行と 184 行の Pandas データ フレームです。ytrain/ytest は 736 と 184 のシリーズです)。行):
nb = GaussianNB()
nb.fit(xtrain, ytrain)
predicted = nb.predict_proba(xtest)
precision, recall, threshold = precision_recall_curve(ytest, predicted)
上記が機能することを期待していますが、「IndexError: インデックス 230 はサイズ 184 の範囲外です」というメッセージが表示されます。私が代わりに行う場合:
predicted = nb.predict(xtest)
precision, recall, threshold = precision_recall_curve(ytest, predicted)
その後、正常に実行されます。184 は xtest と ytest の行数ですが、230 はこれらの構造の次元ではありません。誰かが違いを説明したり、この目的で precision_recall_curve を使用する方法を説明したりできますか?