剖析决策树
-
简单来说决策树就是通过已有的数据集训练出一个树形结构的模型,以便于我们能够依据该模型对不知分类结果的数据进行预测。
分类决策树模型是一种用来描述对实例进行分类的树形结构,决策树由两部分组成,分别是节点和有向边。节点又被分成两种类型:内部节点表示一个属性或者特征;叶节点用来表示一个类。
决策树在实际中的应用范围也是十分的广泛,需要涉及到监管学习,监管学习就是给出一堆已知样本,并且每个样本都有一组属性和一个分类结果,也就是分类结果已知,那么通过学习这些样本得到一个决策树,这个决策树能够对新的数据给出正确的分类。
图片中的决策树仅仅是靠我们自己手动就可以来实现的,不一定能够运用于解决实际问题。而决策树的任务,则是在于根据已有的数据样本集训练得到一颗树形的结构模型,并且以此来对未知分类的数据进行类别预测。对此,我们要想得到这样一颗尽可能理想的决策树,则需要考虑到以下几个问题:
首先,我们要明确决策树的指标选择的顺序应该是怎样的?哪个特征应当被优先考虑?如果构建出的决策树出现了过拟合问题,也就说我们的训练的时候还不错,但是我们应该怎么解决出现的GG问题呢?
随着决策过程在不断的进行,我们希望决策树的分支节点所包含的样本尽可能的可以属于同一类别,也就是希望节点的“纯度”越来越高。
决策树最关键的技术在于属性特征的选择。对于属性特征的选择,我们通常有三个准则:信息增益、信息增益比(增益率)和基尼指数。
西南地区IT社群(QQ)
- 云南
- 【昆明网页设计交流吧】243627302
- 【昆明nodejs交流吧】 243626749
- 【VUE】838405306
- 【云南程序员总群】343606807
- 【昆明UI设计】104031254
- 【云南软件外包】15547313
- 贵州
- 【PHP/java源码/站长交流群】55692114
- 四川
- 【成都Java/JavaWeb交流】86669225
- 【vaScript+PHP+MySql】116270060
- 【UI设计/设计交流学习群】135794928
- 重庆
- 【诺基亚 JAVA游戏博物馆】 559479780
- 【PHP,Java,Python,C++接单】 442103442
- 西藏