当前位置: 首页 > news >正文

百合怎么doi怎么做网站/外贸网站建站平台

百合怎么doi怎么做网站,外贸网站建站平台,有什么网站做微商,淘宝客静态网站分类回归树(CART,Classification And Regression Tree)也属于一种决策树,上回文我们介绍了基于ID3算法的决策树。作为上篇,这里只介绍CART是怎样用于分类的。 分类回归树是一棵二叉树,且每个非叶子节点都有两个孩子,所以对于第一…

分类回归树(CART,Classification And Regression Tree)也属于一种决策树,上回文我们介绍了基于ID3算法的决策树。作为上篇,这里只介绍CART是怎样用于分类的。

分类回归树是一棵二叉树,且每个非叶子节点都有两个孩子,所以对于第一棵子树其叶子节点数比非叶子节点数多1。

表1

名称体温表面覆盖胎生产蛋能飞水生有腿冬眠类标记
恒温毛发哺乳类
巨蟒冷血鳞片爬行类
鲑鱼冷血鳞片鱼类
恒温毛发哺乳类
冷血有时两栖类
巨蜥冷血鳞片爬行类
蝙蝠恒温毛发哺乳类
恒温哺乳类
豹纹鲨冷血鳞片鱼类
海龟冷血鳞片有时爬行类
豪猪恒温刚毛哺乳类
冷血鳞片鱼类
蝾螈冷血有时两栖类

上例是属性有8个,每个属性又有多少离散的值可取。在决策树的每一个节点上我们可以按任一个属性的任一个值进行划分。比如最开始我们按:

1)表面覆盖为毛发和非毛发

2)表面覆盖为鳞片和非鳞片

3)体温为恒温和非恒温

等等产生当前节点的左右两个孩子。按哪种划分最好呢?有3个标准可以用来衡量划分的好坏:GINI指数、双化指数、有序双化指数。下面我们只讲GINI指数。

GINI指数

总体内包含的类别越杂乱,GINI指数就越大(跟熵的概念很相似)。比如体温为恒温时包含哺乳类5个、鸟类2个,则:

体温为非恒温时包含爬行类3个、鱼类3个、两栖类2个,则

所以如果按照“体温为恒温和非恒温”进行划分的话,我们得到GINI的增益(类比信息增益):

最好的划分就是使得GINI_Gain最小的划分。

终止条件

一个节点产生左右孩子后,递归地对左右孩子进行划分即可产生分类回归树。这里的终止条件是什么?什么时候节点就可以停止分裂了?直观的情况,当节点包含的数据记录都属于同一个类别时就可以终止分裂了。这只是一个特例,更一般的情况我们计算χ2值来判断分类条件和类别的相关程度,当χ2很小时说明分类条件和类别是独立的,即按照该分类条件进行分类是没有道理的,此时节点停止分裂。注意这里的“分类条件”是指按照GINI_Gain最小原则得到的“分类条件”。

假如在构造分类回归树的第一步我们得到的“分类条件”是:体温为恒温和非恒温。此时:

 哺乳类爬行类鱼类鸟类两栖类
恒温50020
非恒温03302

我在《独立性检验》中讲述了χ2的计算方法。当选定置信水平后查表可得“体温”与动物类别是否相互独立。

还有一种方式就是,如果某一分支覆盖的样本的个数如果小于一个阈值,那么也可产生叶子节点,从而终止Tree-Growth。

剪枝

当分类回归树划分得太细时,会对噪声数据产生过拟合作用。因此我们要通过剪枝来解决。剪枝又分为前剪枝和后剪枝:前剪枝是指在构造树的过程中就知道哪些节点可以剪掉,于是干脆不对这些节点进行分裂,在N皇后问题和背包问题中用的都是前剪枝,上面的χ2方法也可以认为是一种前剪枝;后剪枝是指构造出完整的决策树之后再来考查哪些子树可以剪掉。

在分类回归树中可以使用的后剪枝方法有多种,比如:代价复杂性剪枝、最小误差剪枝、悲观误差剪枝等等。这里我们只介绍代价复杂性剪枝法。

对于分类回归树中的每一个非叶子节点计算它的表面误差率增益值α。

是子树中包含的叶子节点个数;

是节点t的误差代价,如果该节点被剪枝;

r(t)是节点t的误差率;

p(t)是节点t上的数据占所有数据的比例。

是子树Tt的误差代价,如果该节点不被剪枝。它等于子树Tt上所有叶子节点的误差代价之和。

比如有个非叶子节点t4如图所示:

已知所有的数据总共有60条,则节点t4的节点误差代价为:

子树误差代价为:

以t4为根节点的子树上叶子节点有3个,最终:

找到α值最小的非叶子节点,令其左右孩子为NULL。当多个非叶子节点的α值同时达到最小时,取最大的进行剪枝。


原文来自:博客园(华夏35度)http://www.cnblogs.com/zhangchaoyang作者:Orisun

http://www.jmfq.cn/news/5145301.html

相关文章:

  • 做网站公司能赚钱吗/和生活app下载安装最新版
  • 成都网站建设app开发/百度图片搜索网页版
  • 怎么样制作一个公司网站/网络推广策划案
  • 杨凯做网站/友链互换平台推荐
  • 专做皮鞋销售网站/整合营销传播的方法包括
  • 做色情灰色网站怎么判刑/美国今天刚刚发生的新闻
  • 工控人如何做自己的网站/免费建立个人网站申请
  • 番禺制作网站设计/重庆网站页面优化
  • 可以自己做视频网站吗/百度推广一年大概多少钱
  • 珠海市企业网站制作服务机构/百度关键词搜索引擎
  • 单位网站建设的优势/百度推广要多少钱
  • 做网站发违规内容 网警抓不抓/b站视频推广网站400
  • 怎么做卖橘子的网站/天津百度搜索排名优化
  • 网站建设yu/有效获客的六大渠道
  • 7黄页网站建设/建站平台
  • 工信部网站实名认证怎么做/微信引流被加软件
  • 自己怎样制作网站/业务推广公司
  • 云服务器 能用来做网站吗/关键词制作软件
  • 有没有在家做的兼职网站/福州短视频seo推荐
  • 安吉网站建设/推广平台排行榜app
  • 笔记本电脑做网站比较畅快/百度指数 移民
  • 网站怎么做自己站长/搭建一个网站需要多少钱?
  • 济阳县做网站公司/seo软件开发
  • 网站里图片做超链接/手游推广渠道平台
  • 专业做网站的公司哪家更专业/国家域名注册服务网
  • 柳州公司网站建设/精准客源
  • 网站建设书模板/天堂网
  • 求职网站开发多少钱/营销计划怎么写
  • 长春疫情最新消息今天封城了/石家庄抖音seo
  • 快站怎么做淘客网站/免费创建自己的网站