当前位置: 首页 > news >正文

网站如何做excel预览/对网络推广的理解

网站如何做excel预览,对网络推广的理解,抖音平台建站工具,南京博物馆网站哪家做的分类问题 与线性回归不同,Logistic回归虽然带有"回归"二字,但是并不是回归问题,属于分类问题。简单介绍一下,什么是分类问题。 在监督学习中,当输出变量Y取有限个离散值时,预测问题便成为分类问…

分类问题

与线性回归不同,Logistic回归虽然带有"回归"二字,但是并不是回归问题,属于分类问题。简单介绍一下,什么是分类问题。
在监督学习中,当输出变量Y取有限个离散值时,预测问题便成为分类问题。这时,输入变量X可以是离散的,也可以是连续的。
监督学习从数据中学习一个分类模型或分类决策函数,称为分类器。分类器对新的输入进行输出的预测,称为分类。可能的输出称为类。分类的类别为两个时,称为二分类问题;分类的类别为多个时,称为多类分类问题。

举个例子,经典的二分类,比如检查邮件是否是垃圾邮件,检查一个零件是否是合格件,判断一个西瓜是否成熟等等。对于类别我们通常称为正类(positive class)和负类(negative class),垃圾邮件的例子中,正类就是正常邮件,负类就是垃圾邮件。

逻辑回归常用于二分类问题,也可以用于多分类问题,后面会有介绍。逻辑回归与线性回归虽然是两个不同的问题,但是两者还是有一些相似之处,我们可以建立在对线性回归理解的基础上,来对比学习逻辑回归。


逻辑回归模型

逻辑回归和线性回归等回归任务还是有一定关系的,这种关系正是通过一种神奇的映射曲线做到的,比如它将做回归分析的模型的因变量的取值映射为概率值,我们都知道概率值的取值范围为0~1,所以通过设定一个0~1的阈值,小于这个阈值的就是A类,其他的都是非A类,这就是二分类。

模型描述

首先,我们先介绍我们上面提到的那个神奇的映射函数,我们称之为Sigmoid函数:

g(z)=11+e−zg\left( z\right) =\dfrac {1}{1+e^{-z}}g(z)=1+ez1
可以看出该函数定义域为实数域R,值域为(0,1)。
函数图像如下:
在这里插入图片描述
因为该函数的取值范围为R,所以我们可以把z用任何一个函数式替换,既形成一个复合函数,这就意味着这个函数可以作为任何函数关系的映射函数。并且该函数的值域为(0,1),很好满足概率值为0-1的特性。
我们再对该函数求导,看看该函数的另一个特性:
g′(z)=1(1+e−z)2e−z=11+e−z⋅e−z1+e−z=g(z)(1−g(z))\begin{aligned}g'\left( z\right) =\dfrac {1}{\left( 1+e^{-z}\right) ^{2}}e^{-z}\\ =\dfrac {1}{1+e^{-z}}\cdot \dfrac {e^{-z}}{1+e^{-z}}\\ =g\left( z\right) \left( 1-g\left( z\right) \right) \end{aligned}g(z)=(1+ez)21ez=1+ez11+ezez=g(z)(1g(z))
此函数应用甚广,神经网络的激励函数,独立成分分析中源信号分布都是使用该函数的。

接下来介绍逻辑回归的假设函数
hθ(x)=11+e−θTxh_{\theta }\left( x\right) =\dfrac {1}{1+e^{-\theta^{T} x}}hθ(x)=1+eθTx1

我们可以看到,我们用θTx\theta^{T} xθTx代替了映射函数里的z。
θTx\theta^{T} xθTx是不是有一点眼熟呢?没错,我们在线性回归中见到过,线性回归的表达式可以用θTx\theta^{T} xθTx来表示。
需要注意的是,这里的θTx\theta^{T} xθTx既可以是线性的关系,也可以是非线性的关系。
比如:
假设函数可以是:hθ(x)=g(θ0+θx1+θ2x2)h_{\theta }\left( x\right) =g\left( \theta _{0}+\theta x_1+\theta _{2}x_2\right)hθ(x)=g(θ0+θx1+θ2x2)
也可以是:hθ(x)=g(θ0+θx12+θ2x23)h_{\theta }\left( x\right) =g\left( \theta _{0}+\theta x_1^{2}+\theta _{2}x_2^{3}\right)hθ(x)=g(θ0+θx12+θ2x23)

假设2个类分别为0和1,回归结果hθ(x)表示样本属于类1的概率,因此样本属于类0的概率则为1−hθ(x),则有:
P(y=1∣x,θ)=hθ(x)P( y= 1|x,\theta ) =h_{\theta }\left( x\right)P(y=1x,θ)=hθ(x)
P(y=0∣x,θ)=1−hθ(x)P( y= 0|x,\theta ) =1-h_{\theta }\left( x\right)P(y=0x,θ)=1hθ(x)
实际上就是一个两点分布,可写为P(y∣x,θ)=hθy(x)(1−hθ(x))1−yP( y|x,\theta ) =h_{\theta }^{y}\left( x\right)(1-h_{\theta }\left( x\right))^{1-y}P(yx,θ)=hθy(x)(1hθ(x))1y

通常在做二分类时,设定一个阈值 gamma,如果小于gamma,设为 0类,否则为 1类。阈值是可以调整的,比如说一个比较保守的人,可能将阈值设为0.9,也就是说有超过90%的把握,才相信这个x属于1这一类。如下图所示:设定阈值为0.3,则小于0.3的都为 0 类,大于0.3的都为 1 类。

在这里插入图片描述

决策界限

线性的决策边界,如下图:
在这里插入图片描述
解释一下图中的情况,我们假设θTx\theta^{T} xθTx=-3+x1+x2。将阈值设为0.5,即当hθ(x)h_{\theta }\left( x\right)hθ(x)>0.5时,我们认为属于正类,否则,属于负类,由映射函数g(z)可知,当z=0时,g(z)=0.5,所以也就是当θTx\theta^{T} xθTx>0时,即-3+x1+x2>0时,属于正类,y=1。所以,此时的决策界限就是一条直线,如上图所示,该直线下部分属于y=0,上部分为y=1。

非线性的边界函数类似,我们就不在解释了,直接看下图吧:
在这里插入图片描述

代价函数

线性回归中的代价函数用的是平方和的代价函数,但是在逻辑回归的问题中,如果仍然使用平方和代价函数的话,很有可能此时的代价函数是非凸函数,即有很多局部最优点,如果此时用梯度下降法,不能保证会收敛到全局最小值。

所以,逻辑回归的代价函数我们使用交叉熵作为代价函数:J(θ)=−1m[∑i=1m(y(i)log⁡hθ(x(i))+(1−y(i))log⁡(1−hθ(x(i)))]J(\theta) = -\frac{ 1 }{ m }[\sum_{ i=1 }^{ m } ({y^{(i)} \log h_\theta(x^{(i)}) + (1-y^{(i)}) \log (1-h_\theta(x^{(i)})})]J(θ)=m1[i=1m(y(i)loghθ(x(i))+(1y(i))log(1hθ(x(i)))]

m:训练样本的个数;
hθ(x):用参数θ和x预测出来的y值;
y:原训练样本中的y值,也就是标准答案
上角标(i):第i个样本

这个代价函数其实也是由最大似然法推出的,我们在这里就不证明了。

所以,此时我们的目标就成了寻找最优的θ\thetaθ使得J(θ)J(\theta)J(θ)的值最小。
我们仍然使用的是梯度下降算法。

梯度下降

在这里插入图片描述

∂∂θjJ(θ)\dfrac {\partial }{\partial \theta _{j}}J\left( \theta \right)θjJ(θ)代入可得:

在这里插入图片描述
我们会惊讶的发现,逻辑回归得到的梯度下降的式子跟线性回归的式子形式结果是一样的,但是需要注意的是,这里的函数hθ(x(i))h_\theta(x^{(i)})hθ(x(i))并不一样。


多分类问题

逻辑回归虽然主要用于二分类问题,但是也可以用于多分类问题。
思路是将多分类问题转换成多个二分类问题
对每一个类训练一个逻辑回归模型,有多少个类就有多少个模型
用每一个模型对新数据分别进行预测,取概率最大的模型决定新数据的预测类别。

http://www.jmfq.cn/news/4924441.html

相关文章:

  • 新手做自己的网站教程/搜索引擎营销的特征
  • 石大网页设计与网站建设/律师推广网站排名
  • 360房产网/重庆seo网站运营
  • 网站系统名称/湖南竞价优化专业公司
  • 国外营销网站建设/软件开发自学步骤
  • 厦门外贸网站建设哪家公司大/软文代写发布
  • 沈阳健网站/考研培训
  • 在线制作app下载/搜索引擎优化指的是
  • 企业网站教程/新闻热点素材
  • 电脑如何做穿透外网网站/关键词查询网站的工具
  • 做网站上是外部连接怎么改/杭州百度快照优化公司
  • 模板网站与定制开发网站的区别/百度百家自媒体平台注册
  • 如何自建一个便宜的网站/成都网站推广经理
  • 网站风格分类有哪些/如何做企业网页
  • 上海网站建设代/sem推广外包
  • 建立网站需要多少钱 纠正错误湖南岚鸿/seo怎么做优化计划
  • 自学家装设计从哪入手/seo排名是什么意思
  • 抖音营销ppt课件/seo课程培训入门
  • 上海网站 备案查询/电话营销外包公司
  • 房地产公司网站建设ppt/响应式网站 乐云seo品牌
  • 罗湖商城网站设计/长沙网
  • 好的响应式网站有哪些/怎么自己创建一个网站
  • 深圳做网站公司那家比较好/故事式软文范例100字
  • 彩票网站上的走势图是怎么做的/西安网站建设
  • 广州响应式网站建设/南宁seo教程
  • 网站后台用什么软件做/官网seo哪家公司好
  • 企业官方网站案例/seo引擎优化是做什么的
  • 政府网站建设和管理的要求/百度快照官网
  • 公司做网站都需要什么流程/东莞优化疫情防控措施
  • 无限容量网站/央视新闻最新消息今天