2

スパース行列のストレージとして svm light ファイルを使用しています。

テストでは、570601944 エントリの 31700108x54070 マトリックスの場合

import xgboost as xgb
dtrain = xgb.DMatrix(train_file)

21 秒を使用しました。

from sklearn.datasets import load_svmlight_file
x_train, y_train = load_svmlight_file(train_file)

7分使用。

コードをハッキングする前に、誰かがこれに答えるのを手伝ってくれますか?

load_svmlight_file 関数を強化するための提案はありますか?

どうもありがとうございました!

4

1 に答える 1