您的当前位置:首页正文

学习小组Day5笔记--卜小云

来源:花图问答

R的数据结构

R是面向对象的一门语言

  1. 向量 vector 数值型向量 numeric、字符型向量character
  2. 矩阵matrix
  3. 数据框data frame
  4. 因子 factor 不同的level 分类变量
  5. 列表 大熔炉

向量

  1. 赋值
    "<-"或者"="
x<-c(1,2,3) #常用的向量定义写法,意为将x定义为由元素1,2,3组成的向量。
x<-(1:10) #从1-10之间所有的整数
x<-seq(1,10,by = 0.5) #1-10之间每隔0.5取一个数(注意这里是逗号不是分号)
x<-rep(1:3,times=2) #1-3 重复2次

每个函数的作用及主要参数要了解
查询方式

?+函数名 或者 help(函数名)

  1. 从向量中提取元素
    先要了解数据结构 常用的几个函数
class() 
dim()
str()
head()
View()

2.1 根据不同数据结构中的数据的位置

x[4]  #第4个元素
x[-4] #排除法,除了第4个元素之外剩余的元素
x[2:4]第2到4个元素
x[-(2:4)]除了……
x[c(1,5)]第1个和第5个元素

2.2 根据逻辑判断或者值得大小

##  == ,!==, %in%,>,<,max,min,......
x[x==10] #等于10的元素
x[x<0]
x[x %in% c(1,2,5)] #存在于向量c(1,2,5)中的元素

数据框

读取 注意分隔符 sep='' ''、","、''\t''
read.table(file = "huahua.txt",sep = "\t",header =T)
X<-read.csv("huahua.txt")

2.2 设置行名和列名

colnames(X) #查看列名
rownames(X) #查看行名
colnames(X)[1]<-"bioplanet"#第一列列名改名

2.3 数据框导出
write.table(X,file = "yu.txt",sep = ",",quote=F) #分隔符改为逗号,字符串由默认的带双引号改
2.4 变量的保存与重新加载

save.image(file="bioinfoplanet.RData") #保存当前所有变量
save(frame1,file="frame1.RData") #保存其中一个变量
load("frame1.RData") #再次使用RData时的加载命令

2.5 提取元素

X[x,y]#第x行第y列
X[x,]#第x行
X[,y]#第y列(横着写,这是不够懒也不够优秀却能存在的写法)
X[y] #第y列(竖着写,这是懒惰又优秀的写法)
X[a:b]#第a列到第b列
X[c(a,b)]#第a列和第b列
X$列名#也可以提取列

‘$’ 见钱眼开 行个方便 哈哈
2.6 直接使用数据框中的变量
2.6.1 attach用法

attach(c) #将数据框名添加到搜索环境中

plot(case,values)#作图时就只需输入列名(连$都不用了)
detach(c)#做完后将a删除出搜索环境

局限性:两个以上数据框的列名有冲突时,同时attach会报错。
2.6.2 with()函数

适用于当同名变量出现多次,避免程序定位错误的情况
这两个以后碰到再说吧

Xmind

R的对象