0

22465 のテスト ドキュメントがあり、88 の異なるトピックに分類しています。上位 5 つの予測トピックを取得するために predict_proba を使用しています。これら 5 つのトピックの精度を出力するにはどうすればよいですか?

正確さのために、これは私がやっていることです:

model1 = LogisticRegression()
model1 = model1.fit(matrix, labels)

y_train_pred = model1.predict_log_proba(matrix_test)
order=np.argsort(y_train_pred, axis=1)
print(order[:,-5:]) #gives top 5 probabilities

n=model1.classes_[order[:, -5:]]

精度のために

z=0
for x, y in zip(label_tmp_test, n):
    if x in y:
        z=z+1
print(z)
print(z/22465) #This gives me the accuracy by considering top 5 topics

同じ方法で上位 5 つのトピックの精度を見つけるにはどうすればよいですか? Scikit メトリクスは使用を拒否します

q=model1.predict(mat_tmp_test)
print(metrics.precision_score(n, q))
4

1 に答える 1