スパース行列のストレージとして svm light ファイルを使用しています。
テストでは、570601944 エントリの 31700108x54070 マトリックスの場合
import xgboost as xgb
dtrain = xgb.DMatrix(train_file)
21 秒を使用しました。
from sklearn.datasets import load_svmlight_file
x_train, y_train = load_svmlight_file(train_file)
7分使用。
コードをハッキングする前に、誰かがこれに答えるのを手伝ってくれますか?
load_svmlight_file 関数を強化するための提案はありますか?
どうもありがとうございました!