sparkMLlib决策树是什么

这篇文章主要讲解了“spark MLlib决策树是什么”，文中的讲解内容简单清晰，易于学习与理解，下面请大家跟着小编的思路慢慢深入，一起来研究和学习“spark MLlib决策树是什么”吧！

10年积累的成都网站建设、成都做网站经验，可以快速应对客户对网站的新想法和需求。提供各种问题对应的解决方案。让选择我们的客户得到更好、更有力的网络服务。我虽然不认识你，你也不认识我。但先网站设计后付款的网站建设流程，更有铜山免费网站建设让你可以放心的选择与我们合作。

1. 决策树以及它的组合模型是在机器学习中常用的分类和回归方法。决策树结果容易解释，处理分类特征，可拓展到多类。决策树是一个贪婪算法，递归的二分特征空间。决策树预测具有相同的叶子节点的属于同一类标签。每次划分的时候，都从一系列可能的划分中选择最佳的，使得根节点的信息增益最大，argmax(s): IG(D,s)。

IG(D,s)=Impurity(D) - a*Impurity(D1eft) - (1-a)*Impurity(Dright)，

Impurity可以取为信息熵，在概率分布为均匀分布时取得最大值。

2. 连续空间特征分区，对于小的数据集，连续空间的特征分区都是单个值。在某些实现中，会首先对特征值进行排序，已进行更快捷的树计算。当数据量过大时，对全部的数据排序代价较高，这里的实现首先采样取一部分数据排序，排序好的数据形成一个个的区间，称为bin，可以指定maxBins参数设置最大的分区数，默认为100。

3. 离散空间特征分区，对于包含M个可能值的离散空间，可能有2^(M-1)-1个候选解。当2^(M-1)-1大于maxBins时，我们采用二划分时相同的启发术，对M个类别特征按照Impurity进行排序。结果分成M-1个划分。

感谢各位的阅读，以上就是“spark MLlib决策树是什么”的内容了，经过本文的学习后，相信大家对spark MLlib决策树是什么这一问题有了更深刻的体会，具体使用情况还需要大家实践验证。这里是创新互联，小编将为大家推送更多相关知识点的文章，欢迎关注！

本文标题：sparkMLlib决策树是什么
标题网址：http://myzitong.com/article/goddgd.html

sparkMLlib决策树是什么

其他资讯