当前位置: 首页 > news >正文

婚纱摄影网站模板源码/班级优化大师免费下载

婚纱摄影网站模板源码,班级优化大师免费下载,高端建设网站企业,湘潭做网站 磐石网络上节我们介绍了线性回归和Ridge回归,并介绍了两种回归的优缺点。本节我们重点学习下lasso回归的方法和优缺点。和岭回归(Ridge)回归一样,lasso回归也是一种正则化的线性回归,且也是约束系数使其接近于0,不过其用到的方法不同&…

上节我们介绍了线性回归和Ridge回归,并介绍了两种回归的优缺点。本节我们重点学习下lasso回归的方法和优缺点。

和岭回归(Ridge)回归一样,lasso回归也是一种正则化的线性回归,且也是约束系数使其接近于0,不过其用到的方法不同,岭回归用到的是L2正则化,而lasso回归用到的是L1正则化(L1是通过稀疏参数(减少参数的数量)来降低复杂度,即L1正则化使参数为零,L2是通过减小参数值的大小来降低复杂度,即L2正则化项使得值最小时对应的参数变小)。

下面我们来看将lasso正则化运用到波士顿房价数据集上的效果,对应代码如下:

import mglearn

from sklearn.model_selection import train_test_split

import matplotlib.pyplot as plt

x, y = mglearn.datasets.load_extended_boston()

x_train, x_test, y_train, y_test = train_test_split(x, y, random_state=0)

from sklearn.linear_model import Lasso

lasso = Lasso().fit(x_train, y_train)

print("Training set score: {:.2f}".format(lasso.score(x_train, y_train)))

print("Test set score: {:.2f}".format(lasso.score(x_test, y_test)))

print("Number of features used: {}".format(np.sum(lasso.coef_!=0)))

#我们增大max_iter的值,否则模型会警告我们,应该增大max_iter

#下面代码则是打印各种alpha参数下的预测分数

lasso01 = Lasso(alpha=0.1, max_iter=100000).fit(x_train, y_train)

lasso001 = Lasso(alpha=0.01, max_iter=100000).fit(x_train, y_train)

print("training set score: {:.2f}".format(lasso001.score(x_train, y_train)))

print("Test set score: {:.2f}".format(lasso001.score(x_test, y_test)))

print("Number of features used: {}".format(np.sum(lasso001.coef_!=0)))

lasso00001 = Lasso(alpha=0.0001, max_iter=100000).fit(x_train, y_train)

print("training set score: {:.2f}".format(lasso00001.score(x_train, y_train)))

print("Test set score: {:.2f}".format(lasso00001.score(x_test, y_test)))

print("Number of features used: {}".format(np.sum(lasso00001.coef_!=0)))

#绘制对应的图形

plt.plot(lasso.coef_, 's', label="Lasso alpha=1")

plt.plot(lasso001.coef_, '^', label="Lasso alpha=0.01")

plt.plot(lasso00001.coef_, 'v', label="Lasso alpha=0.0001")

plt.plot(lasso01.coef_, 'v', label="Ridge alpha=0.1")

plt.legend(ncol=2, loc=(0, 1.05))

plt.ylim(-25, 25)

plt.xlabel("Coefficient index")

plt.ylabel("Cofficient magnitude")

上述代码运行结果如下:

d75e648cb7aa5cfa878128d0faf800b1.png

由上述代码我们可以看出,当使用特征数比较少时,lasso的训练集和测试集表现都很差,这表示存在欠拟合。通过调整alpha值,可以控制系数趋向于0的强度。当我们将alpha值变小,我们可以拟合一个比较复杂的模型,此时,训练集和测试集反而表现得更好,当我们将特征值从4个上升到33个是,训练集和测试集已经表现得比较好了。不过,如果将alpha值设置得太小的时候,训练集就会远大于测试集了,这是就出现了过拟合的情况。

在实践中,岭回归(Ridge)和lasso我们首选岭回归。不过如果特征数过多,但是其中只有几个特征是重要的,则选择lasso效果会更好。同时,lasso由于其模型更加便于理解(因为它只选择一部分输入特征),所以有时候用lasso回归效果也不错。当然,如果我们能够将两者进行优势互补,则会达到更佳的效果,在scikit-learn中提过了ElasticNet类,就是结合了这两种回归的惩罚项。在实践中效果会更好,不过需要同时调节L1和L2正则化参数,在以后章节中我们会介绍到。

今天我们就先介绍到这里,下节我们将介绍用于分类的线性模型,本内容主要参照书为《python机器学习基础教程》。

http://www.jmfq.cn/news/4738537.html

相关文章:

  • 小型b2c网站建设费用/企业网站建设方案策划
  • 如何注册api key域名/建站优化推广
  • 和外国人做古玩生意的网站/电商seo名词解释
  • 深圳自适应网站开发公司/网站建站教程
  • 亿级别网站开发注意/关键词优化一年的收费标准
  • 会员充值网站怎么做/信息流广告加盟代理
  • 双语言网站源码/aso优化运营
  • 成营销型网站制作/推广网站都有哪些
  • 重庆网站建设与推广/站长工具的使用seo综合查询排名
  • 店铺装修设计软件/优化大师电脑版官方
  • 网络求职做阿姨哪个网站好/湖南网站优化
  • 给网站设置长尾关键词/百度里面的站长工具怎么取消
  • 兼职做任务的网站/成都seo
  • 上海专业网站制作设计/关键词查询网站
  • 贵港市住房和城乡规划建设委员会网站/什么是seo站内优化
  • 网站开发敲代码/百度一下首页网页
  • 网站建设及推广方案/站群seo
  • 学校网站模板免费下载/网站推广的渠道有
  • 长沙微交易网站建设/app渠道推广
  • 安卓软件制作网站/百度爱采购关键词优化
  • 服务器如何搭建网站/seo兼职论坛
  • 网站建设维护费一年多少钱/免费手机网站自助建站
  • 可靠的赚钱平台/seo案例
  • 网上开店流程/广州优化营商环境条例
  • 做网站要学会什么/宁波 seo整体优化
  • 湖南网站建设 系统/seo外包 杭州
  • 请问做卖东西网站怎么/搜索引擎优化时营销关键词
  • 南京网站开发南京乐识优/福建省人民政府门户网站
  • 房产网站排行榜/软件培训机构哪家好
  • 网站备案快速/百度关键词分析工具