私は研究に SVM-light を使用していますが、問題なく動作しています (少なくともまだ処理中です)。
svm_learn.exe -t 3 -m 4000 learn_data model
ここの Learn_data は、20.000 の特徴を持つ約 14.000.000 行のデータです。
しかし、-z p
ランキング モードのフラグに関しては、1.000.000 行のデータでクラッシュします。
svm_learn.exe -t 3 -z p -m 4000 learn_data_1mil model
結果として:
OK. (10000000 examples read)
Constructing 1380570988 rank constrains...Out of memory!: Not enough space
現在の設定は 64GB の RAM で、SVM がすべてを使用しようとしているようには見えません。20000までのキャッシュとして4000 MB以上を使用しようとしました。しかし、それは役に立たず、キャッシュエラーである場合、SVMはメモリエラーだけでなくキャッシュについても通知する必要があります。それを解決するための文書化された方法が見つかりませんでした。データを処理するにはどうすればよいですか?