pythonの決定木のコードサンプル

毎回決定木を試みるときにどうやって書くのかさっぱり忘れていて、いちから探しているので、とりあえず自分のためにメモを書いておこうと思います。 完全にメモですので、間違いなどがあると思います。参考程度にして、ご自身で実装される際はきちんと公式ドキュメントを読んでください。

# 目的変数
y_name = '****' # 目的変数のカラム名を入れる
 
# 従属変数(使用列)の選択
X_name = ['****', '****', '****', '****'] # 従属変数のカラムを入れる
 
# Xとyに分離
X_train = df[X_name]
y_train = df[y_name]
from sklearn.datasets import *
from sklearn import tree
from dtreeviz.trees import *
import graphviz
 
dtree = tree.DecisionTreeClassifier(max_depth=3)
dtree.fit(X_train, y_train)
viz = dtreeviz(dtree,X_train,y_train,
               target_name='****', # 目的変数名
               feature_names=X_name,
               class_names=['****', '******'], # 目的変数の0が何を表しているか、1が何を表しているかを書きます
               )
 
viz

正直いうと、コードを書くよりもgraphvizwindowsで使えるようにするのが大変でした。環境変数とかそのあたりを理解しているとできるっぽい。pip installした後に、Graphvizの本体?をインストールしてシステム環境変数を設定するようです。 参考は以下

Graphviz をインストールする