0

scikit-learn データセットのラベル入力の一般的な形式はありますか? に出力用のラベルのリストがあることがわかりますtarget_names。scikit の規則に従い、ラベルに関するデータを入力変数 (性別など) に保持したいと考えています。これにはすでに慣習がありますか?このようなもの

>>> data_set.inputs["sex"]
{'male': 1, 'female': 0}
4

1 に答える 1

1

カテゴリ機能名情報を保存するための規則はありません。やりたいようにするのは自由です。

または、元のデータを元の形式で保存し、データからモデルを構築する必要があるときに、その場で DictVectorizer / FeatureHasher および LabelBinarizer を使用することもできます。

于 2013-01-26T14:19:19.097 に答える