网站开发项目/今日中央新闻
参考书《R语言实战(第2版)》
因子
#factor()设置存储方式为整数向量> disease > disease > disease[1] T1 T2 T3 T2Levels: T1 T2 T3 #向量被储存为了名义型整数向量(无序分类),("T1","T2","T3","T2")变成了(1,2,3,2)> disease > disease[1] T1 T2 T3 T2Levels: T1 #手动设定顺序> disease + levels = c("T3","T2","T1"))> disease[1] T1 T2 T3 T2Levels: T3 < T2 < T1#设置数据标签 levels lables> disease > disaese > disaese[1] A B C BLevels: A B C #输出的是标签
Tips: c(),c一定得用小写字母,不然会报错 :“不能把对象解释成因子”。
#数据框A #显示数据框A中对象结构str(A)#显示数据框A中统计摘要summary(A)
列表(list):是若干对象的集合
#list()创建列表mylist #给列表中的对象命名mylist #如果没给对象命名,就会显示按顺序的默认名称,比如mylist[[1]]代表列表mylist里面的第一个对象,mylist[[n]]代表mylist列表里面的第n个对象
Tips:
字符串要用 “ ” 括起来;
if(FALSE){代码1} 语句表示禁止代码1执行,把FALSE改成TRUE表示允许;
数据的输入和导入
官方操作指南
R Data Import/Export
https://cran.r-project.org/doc/manuals/R-data.pdf
可导入R的数据源:
键盘输入 Rdata
文本文件 .txt XML 网络爬虫数据
电子表格 excel
统计软件 spss sas
数据库管理系统
......
键盘输入
> mydata + gender=character(0),weight=numeric((0)))#创建1个空的数据库> mydata > mydata#查看 age gender weight1 15 男 552 23 女 503 16 女 56> fix(mydata)#调用文本编辑器对已经建立的数据框进行增删修改
带分隔符的文本文件数据导入
#read.table(),读取表格保存为数据框mydataframe ?read.table #查看这个函数的用法以及options该如何设置
Tips:
如果发现导入的文件第一个字母乱码,需要把原来的文件另存为【CSV(逗号分隔)(*.csv)】格式;
一个字段里面不要使用两个单词,如果一定得写两个单词,至少用 _ 连接一下;
#read.table()会自动把字符变量转换为因子#不需要转换时,需要手动修改stringsAsFactors=FALSE#对所有变量都去掉上述行为colClasses=c("character", numeric factor )#指定每一列的类(逻辑型、字符型、数值型、因子型...)用str()看看有没有设定好数据类型
Tips:
R语言常见数据类型分别是字符型 (character)、数值型 (numeric)、整型 (integer)、复数型 (complex)、因子型(factor)以及逻辑型 (logical);
Excel数据导入
#最好的方法是把.xlsx另存为.csv文件,再导入R#还可以使用xlsxjars rjava包,前提是安装Javalibrary(xlsx)file "D:/file.xlsx" #设置对象file的数据源myframe
> library(xlsx)> ?read.xlsx #查看函数具体用法
SPSS数据导入
#使用foreign包中的read.spss()导入SPSS文件
#使用Hmisc包中的spss.get()导入SPSS文件,推荐
SAS数据导入
#使用foreign包中的read.ssd()导入SAS文件
#使用Hmisc包中的sas.get()导入SAS文件,推荐
#使用sas7bdat包中的read.sas7bdat()导入SAS文件
今天遇到了很多Bug,但是,Debug的感觉还不错。
晚安