このデータセット内の人々をdr死したかどうかを分類するために、将軍ツールボックスを使用しようとしています。
shogun の紹介で述べたように、CFIle、LibSVMFile、SparseRealFeatures などの shogun エンジンを使用したいのですが、行き詰まっています。
まず第一に、このイントロダクションでは、LibSVMFile をその形式で直接ロードしますが、作成者は、CSV 形式 (彼が使用するデータセットの元の形式) からデータ ファイルを生成する方法について言及していません...
必要な形式のデータセットを持っていないので、データセットを CFile クラスでロードしようとしましたが、CCSVFile クラスでロードしようとしましたが、
NameError: name 'CFile' is not defined
と
NameError: name 'CCSVFile' is not defined
(Ubuntu 17.10 でソースからコンパイルされた Python3 を介して shogun を使用しており、「from shogun import *」ですべての shogun をインポートしています)
それにもかかわらず、私が使用するとき
data_file=LibSVMFile(os.path.join(SHOGUN_DATA_DIR, 'train.csv'))
例のように、定義されていないクラスに関するエラーはありませんが、予想どおり、次のように縮退します。
[1] 8870 segmentation fault (core dumped) python3 titanic.py
データセットをロードするためにこの shogun エンジンを使用する正しい方法を知りたいです...
他の将軍ノートでは、彼らはそれらを使用せず、他のライブラリを使用してデータセットをロードするだけでした。私はそれが最善の方法だと考え始めています。