pandas.get_dummies の機能名を取得して export_graphviz に渡すことができるかどうか疑問に思っていました。get_dummies を使用して、sklearn DecisionTreeClassifier のデータセットをエンコードしています。ツリーをエクスポートするとき、ノードの出力を読みやすくしたいと考えています。
前もって感謝します!
編集:
これが私が達成しようとしていることの例です:
#Concatenate the sets
concated = pd.concat([train_file, test_file])
#Get the encoded set
concated_encoded = pd.get_dummies(concated, columns=cols_to_retain)
#Separate the sets
train = concated_encoded[concated_encoded["Train"] == 1]
test = concated_encoded[concated_encoded["Train"] == 0]
train = train.drop(["Train"], axis=1)
test = test.drop(["Train"], axis=1)
X_train, X_val, y_train, y_val = train_test_split(train, train_outcome, test_size=0.15)
clf = DecisionTreeClassifier(criterion='entropy')
clf = clf.fit(X_train,y_train)
y_pred_val = clf.predict(X_val)
import StringIO
import pydot
dot_data = StringIO.StringIO()
feature_names パラメーターを使用して機能にラベルを付けたい
export_graphviz(clf, out_file=dot_data, feature_names=())
graph = pydot.graph_from_dot_data(dot_data.getvalue())
graph.write_png('tree.png')