当前位置: 首页 > news >正文

删除hao123主页/seo网站诊断顾问

删除hao123主页,seo网站诊断顾问,想搞一个自己的网站怎么做,网站注册实名制怎么做本文主要对用scikit-learn来构建不同模型的实例项目进行介绍: Scikit-learn具体使用方法和语法参数在本人blog中的“TensorFlow(一)Scikit-Learn之Transformer“已进行详细介绍,链接如下:https://huxiaoyang.blog.csdn.net/article/details/1…

本文主要对用scikit-learn来构建不同模型的实例项目进行介绍: Scikit-learn具体使用方法和语法参数在本人blog中的“TensorFlow(一)Scikit-Learn之Transformer“已进行详细介绍,链接如下:

https://huxiaoyang.blog.csdn.net/article/details/105645392

实战项目

实战项目一:以boston数据集为例

项目目标:

使用sklearn实现对boston数据处理和降维

项目步骤:

首先我们可以将对boston数据处理分为四个框架,即数据获取、数据划分、数据预处理、降维

1.1:数据获取

获取sklearn自带的boston数据集,

代码如下:

from sklearn.datasets import load_boston

boston=load_boston()

print("data.shape:",boston.data.shape)

print("target.shape",boston.target.shape)

print("names.shape",boston.feature_names.shape)

输出如下:

1.2:数据划分(测试集0.2)

使用train_test_split方法进行数据划分为训练集和测试集,测试集占0.2,

代码如下:

#data spliting

from sklearn.model_selection import train_test_split

bostonDataTrain,bostonDataTest,bostonTargetTrain,bostonTargetTest=train_test_split(boston.data,boston.target,test_size=0.2,random_state=42)

print("bostonDataTrain:",bostonDataTrain.shape)

print("bostonDataTest:",bostonDataTest.shape)

print("bostonTargetTrain:",bostonTargetTrain.shape)

print("bostonTargetTest:",bostonTargetTest.shape)

输出如下:

1.3:数据预处理(MinMaxScaler)

使用MinMaxScaler对数据集进行离差标准化,

代码如下:

#data preprocessing

import numpy as np

from sklearn.preprocessing import MinMaxScaler

#使用MinMaxScaler生成scaler

Scaler=MinMaxScaler().fit(bostonDataTrain)

#scaler应用于bostonDataTrain

bostonTrainScaler=Scaler.transform(bostonDataTrain)

#scaler应用于bostonDataTest

bostonTestScaler=Scaler.transform(bostonDataTest)

print("after trainsforming")

print("np.var of bostonTrainScaler:",np.var(bostonTrainScaler))

print("np.mean of bostonTrainScaler:",np.mean(bostonTrainScaler))

print("np.var of bostonTestScaler:",np.var(bostonTestScaler))

print("np.mean of bostonTestScaler:",np.mean(bostonTestScaler))

输出如下:

1.4:降维(降成10个维度)

使用pca.transform方法对训练集和测试集进行降维,降成10个维度,

代码如下:

#pca.transfrom

from sklearn.decomposition import PCA

# generate the pca by the bostonTrainScaler

pca=PCA(n_components=10).fit(bostonTrainScaler)

#pca应用于bostonTrainScaler

bostonTrainPca=pca.transform(bostonTrainScaler)

#pca应用于bostonTestScaler

bostonTestPca=pca.transform(bostonTestScaler)

print("after pca.transform:")

print("bostonTrainPca.shape:",bostonTrainPca.shape)

print("bostonTestPca.shape:",bostonTestPca.shape)

输出如下:

实战项目二:葡萄酒及其质量问题

项目目标:

通过wine和wine_quality两份datasets来进行分析葡萄酒的起源和预测葡萄酒的评分。

项目步骤:

通过数据说明对数据分析后,首先我们可以将对boston数据处理分为五个框架,即数据获取、数据分离、数据划分(测试集0.1)、数据预处理(StandardScaler)、降维(降成5个维度)

2.1:数据获取

利用pandas对datasets进行读取,(其中需要注意的是在wine数据集中数据可以直接读入,而wine_quality数据集是以‘;’作为间隔,则可以在read_csv方法中的sep参数赋值为该字符)

代码如下:

import pandas as pd

wine=pd.read_csv('wine.csv')

wineQuality=pd.read_csv('winequality.csv',sep=';')

print(wine.head(3))

print(wineQuality.head(3))

输出如下:

2.2:数据分离

利用iloc方法对数据进行拆分,

代码如下:

#data daparting

wineData=wine.iloc[:,1:]

wineTarget=wine.iloc[:,0]

wineQualityData=wineQuality.iloc[:,:-1]

wineQualityTarget=wineQuality.iloc[:,-1]

print('wineData:\n',wineData.head(2))

print("wineTarget:\n",wineTarget.head(2))

print("wineQualityData:\n",wineQualityData.head(2))

print("wineQualityTarget\n",wineQualityTarget.head(2))

输出如下:

2.3:数据划分(测试集0.1)

划分数据训练集和测试集,

代码如下:

#data spliting

from sklearn.model_selection import train_test_split

wineDataTrain,wineDataTest,wineTargetTrain,wineTargetTest=train_test_split(wineData,wineTarget,test_size=0.1,random_state=23)

wineQualityDataTrain,wineQualityDataTest,wineQualityTargetTrain,wineQualityTargetTest=train_test_split(wineQualityData,wineQualityTarget

,test_size=0.1,random_state=23)

print("wineDataTrain",wineDataTrain.shape)

print("wineDataTest",wineDataTest.shape)

print("wineTargetTrain",wineTargetTrain.shape)

print("wineTargetTest",wineTargetTest.shape)

print('-'*100)

print("wineQualityDataTrain",wineQualityDataTrain.shape)

print("wineQualityDataTest",wineQualityDataTest.shape)

print("wineQualityTargetTrain",wineQualityTargetTrain.shape)

print("wineQualityTargetTest",wineQualityTargetTest.shape)

输出如下:

2.4:数据预处理(StandardScaler)

datasets的数据预处理,

代码如下:

#data preprocessing

import numpy as np

from sklearn.preprocessing import StandardScaler

#generate the Scaler by wineDataTrain

stdScaler=StandardScaler().fit(wineDataTrain)

#stdScaler应用于训练集

wineDataTrainScaler=stdScaler.transform(wineDataTrain)

#stdScaler应用于测试集

wineDataTestScaler=stdScaler.transform(wineDataTest)

#generate the Scaler by wineQualityDataTrain

stdScaler=StandardScaler().fit(wineQualityDataTrain)

#stdScaler应用于训练集

wineQualityDataTrainScaler=stdScaler.transform(wineQualityDataTrain)

#stdScaler应用于测试集

wineQualityDataTestScaler=stdScaler.transform(wineQualityDataTest)

print("after trainsforming:")

print("np.var of :wineDataTrainScaler",np.var(wineDataTrainScaler))

print("np.mean of :wineDataTrainScaler",np.mean(wineDataTrainScaler))

print("np.var of :wineDataTestScaler",np.var(wineDataTestScaler))

print("np.mean of :wineDataTestScaler",np.mean(wineDataTestScaler))

print('-'*100)

print("np.var of :wineQualityDataTrainScaler",np.var(wineQualityDataTrainScaler))

print("np.mean of :wineQualityDataTrainScaler",np.mean(wineQualityDataTrainScaler))

print("np.var of :wineQualityDataTestScaler",np.var(wineQualityDataTestScaler))

print("np.mean of :wineQualityDataTestScaler",np.mean(wineQualityDataTestScaler))

输出如下:

2.5:降维(降成5个维度)

PCA降维,维度为5,

代码如下:

#pca.transform

from sklearn.decomposition import PCA

#generate the pca by the wineDataTrainScaler

pca=PCA(n_components=5).fit(wineDataTrainScaler)

#将pca应用于训练集

wineDataTrainPca=pca.transform(wineDataTrainScaler)

#将pca应用于测试集

wineDataTestPca=pca.transform(wineDataTestScaler)

#generate the pca by the wineDataQualityTrainScaler

pca=PCA(n_components=5).fit(wineQualityDataTrainScaler)

#将pca应用于训练集

wineQualityDataTrainPca=pca.transform(wineQualityDataTrainScaler)

#将pca应用于测试集

wineQualityDataTestPca=pca.transform(wineQualityDataTestScaler)

print('after pca.transform:')

print("wineDataTrainPca.shape",wineDataTrainPca.shape)

print("wineDataTestPca.shape",wineDataTestPca.shape)

print('-'*100)

print("wineQualityDataTrainPca.shape",wineQualityDataTrainPca.shape)

print("wineQualityDataTestPca.shape",wineQualityDataTestPca.shape)

输出如下:

实战项目三:

项目目标:

项目步骤:

原文链接:https://blog.csdn.net/hxy18219110128/article/details/105676975

http://www.jmfq.cn/news/5189059.html

相关文章:

  • 免费网站建设总部/百度云客服人工电话
  • 企业网站色彩搭配/优化网站内容
  • 做网站哪个部分/网络seo关键词优化技术
  • 添加qq好友的超链接做网站/seo是做什么的
  • 今天刚刚发布的新闻/seo实战
  • 做爰小视频网站/域名查询 站长查询
  • 网站开发 入门 pdf/网络开发
  • 做网站充值犯法吗/seo外链怎么做
  • 合肥专门做网站/关键词在线试听
  • 重庆网站建设技术托管/今日热搜榜
  • 北京网站建设著名公司/优秀营销软文范例800字
  • 找公司开发网站/精准营销的概念
  • 网站搭建是哪个岗位做的事儿/seo对网络推广的作用是
  • wordpress支持php7吗/南宁seo产品优化服务
  • wordpress网站放icp/广州网站快速排名优化
  • 十堰响应式网站建设/郑州网站优化培训
  • 网站建设措施/各大网址收录查询
  • 广州市公司网站建设品牌/系统优化软件有哪些
  • 海南房产网站建设/免费查权重工具
  • 南京做网站xjrkj/指数基金定投怎么买
  • 苏州新区网站制作公司/站长推荐入口自动跳转
  • 潮汕美食网站怎么做/营销公司
  • dwcc2017做网站教程/app开发定制
  • 苹果cms做网站/公司网站制作需要多少钱
  • 桂林北站到龙脊梯田/百度快速排名优化技术
  • 伍佰亿网站怎样/网页设计教程
  • 最优网络做网站骗/广州抖音推广
  • wordpress 回车换行/谷歌seo代运营
  • 做旅游网站的社会效益可行性/日结app推广联盟
  • 自己做网站必须要学哪些/河南平价的seo整站优化定制