《芯片原理与技术》课件R语言课件

资源描述

单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,计算机与,R,语言,*,R,语言基础,R,简介,R,语言的基本语法,R,语言的数据结构,数据的存储与读取,简单的,R,会话,Robert Gentleman,Ross Ihaka,R,简介,R,语言的产生,R,语言的创始人,R,语言是,一个开放,(GPL),的统计编程环境,一种语言，是语言的一种方言,(dialect),之一，另一则为,S-plus.,一种软件，是集统计分析与图形直观显示于一体的统计分析,R,简介,多领域的统计资源,目前在,R,网站上约,有,4849,个,程序包，涵盖了基础统计学、社会学、经济学、生态学、空间分析、系统发育分析、生物信息学等诸多方面。,跨平台,R,可在多种操作系统下运行，如,Windows,、,MacOS,、多种,Linux,和,UNIX,等。,命令行驱动,R,即时解释，输入命令，即可获得相应的结果。,5,R,简介,R,语言的特点,R,是完全免费的,R,嵌入了一个非常实用的帮助系统,R,具有很强的作图能力,我们将,R,程序容易地移植到,S-Plus,程序中，反之,S,的许多过程直接或稍作修改用于,R,通过,R,语言的许多内嵌统计函数，很容易学习和掌握,R,语言的语法,我们可以编制自己的函数来扩展现有的,R,语言,(,这就是为什么它在不断等级完善,!),R,简介,R,语言的特点,计划的网站,:,http:/www.r-project.org,了解有关的最新信息和使用说明，得到最新版本的软件和基于的应用统计软件包,.,R,简介,R,简介,R,简介,R,简介,下载,安装,启动,R-GUI,（,R,Graphic,Users,Interface,）,R,简介,R,语言的安装与运行,R GUI (graphic users interface),的主窗口,它由三部分组成：主菜单、工具条、,R console (R,的运行窗口,),R,简介,从左至右依次为,：,打开程序脚本,加载工作空间,保存工作空间,复制,粘贴,复制并粘贴,中断当前计算,打印,R,简介,R,工具条,主要工作是在,R console,里通过发布命令来完成的,包括数据集的建立,数据的分析,作图等。,R,是按照问答的方式运行的，即在命令提示符“,”,后键入命令并回车，,R,就完成了一些操作。,在这里你可以得到在线帮助：, help.start() HTML,格式的关于,R,的帮助文件, help(),得到相应函数的帮助,例如,help(plot), demo(),得到,R,提供的几个示例, q(),退出,R,R,简介,R,console,R,简介,程序包是什么？,R,程序包是多个函数的集合，具有详细的说明和示例,Windows,下的,R,程序包是经过编译的,zip,包,每个程序包包含,R,函数、数据、帮助文件、描述文件等,为什么要安装程序包？,R,程序包是,R,功能扩展，特定的分析功能，需要用相应的程序包实现,例如：生物信息学分析，系统发育分析等,命令方式：在已经联网的条件下，在命令提示符后键入,install.packages(“,程序包的名称”,),完成程序包的安装,新安装的程序包在使用前必须先载入，有两种方式：,菜单方式：“程序包,=,载入程序包”,命令方式：, library(“,程序包名称”,),来加载程序包。可以通过“程序包,=,更新程序包”实现实时更新。,R,简介,R,简介,R,语言的基本语法,R,语言的数据结构,数据的存储与读取,简单的,R,会话,1,、符号,1,）,命令或运算提示符,2,）,+,续行符,3,）,#,说明语句字符,2,、赋值符号,1,）,大于,2,）,=,大于等于,4,）,=,小于等于,5,）,=,等于,6,）,!=,不等于,比较运算得到的结果是逻辑常量,TRUE,（真）和,FALSE,（假）。,R,语言的基本语法,5,、,求助符号,1,）？,2,）,help(),R,语言的基本语法,6,、,常量和变量,1,）常量是其值不变的量，如,1234,，,“abc,等数值、字符串和逻辑值等。,2,）变量是其值可变的量，如,x-3,，,x,就是一个变量，当,xxmode(x),1 numeric,length(x),1 1,R,语言的数据结构,1,）建立数值型向量,数值型向量是统计分析中最常用的向量，可以用下面几个函数建立：,（,1,）,seq( ),或“：”,#,若向量序列具有较为简单的规律,（,2,）,rep( ) #,若向量序列具有较为复杂的规律,（,3,）,sequence() #,输出从,1,到参数的向量,（,4,）,c( )#,若向量序列没有什么规律,（,5,）,scan( ) #,通过键盘逐个输入,R,语言的数据结构,2.,向量的建立,(,向量：一系列元素的组合）,1,、,n1:n2,#,生成从,n1,到,n2,步长为,1,（或,-1,）的向量,R,语言的数据结构,例如：, 1:10,1 1 2 3 4 5 6 7 8 9 10, a-1;b 1:(10-1),1 1 2 3 4 5 6 7 8 9, 1:10-1,1 0 1 2 3 4 5 6 7 8 9,2,、,seq(n1,n2,by=n3,length=n4),#,生成从,n1,到,n2,的向量, n3,为步长,n4,为生成元素的数量,R,语言的数据结构,例如：, seq(1,10),1 1 2 3 4 5 6 7 8 9 10, seq(1,10,by=0.5),1 1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5 6.0 6.5 7.0 7.5 8.0 8.5 9.0 9.5 10.0, seq(1,10,length=11),1 1.0 1.9 2.8 3.7 4.6 5.5 6.4 7.3 8.2 9.1 10.0,3,、,rep(n1,n2),#,生成,n1,重复,n2,次的向量,R,语言的数据结构,例如：, rep(2,3),1 2 2 2, rep(1:5,2),1 1 2 3 4 5 1 2 3 4 5, rep(1:5,1:5),1 1 2 2 3 3 3 4 4 4 4 5 5 5 5 5, rep(1:5,rep(2,5),1 1 1 2 2 3 3 4 4 5 5,4,、,c(),#,直接输出向量,5,、,scan(),#,通过键盘建立向量,R,语言的数据结构,例如：, x=c(42,7,64,9), length(x),例如：, scan(),1: 1 3 6 8,#,此行末回车,5:,#,冒号后直接打回车,Read 4 items,1 1 3 6 8,6,、,sequence(n1),#,生成从,1,开始到,n1,结束步长为,1,的向量,R,语言的数据结构,例如：, sequence(5),1 1 2 3 4 5, sequence(c(5,5),1 1 2 3 4 5 1 2 3 4 5, sequence(c(5,4),1 1 2 3 4 5 1 2 3 4,2),数值型向量的运算,向量的运算方法如下：,（,1,）向量与一个常数的,加、减、乘、除,为向量的每一个元素与此常数进行加、减、乘、除；,（,2,）向量的,乘方（,）与开方,(sqrt),为每一个元素的乘方与开方，这对,log,exp,sin,cos,tan,等普通的运算函数同样适用；,（,3,）,同样长度向量的加、减、乘、除,等运算为对应元素进行加、减、乘、除等；,（,4,）,不同长度向量的加、减、乘、除,遵从,循环法则,（,recycling rule,）,R,语言的数据结构,2.,向量的建立,循环法则：,同一个表达式中的向量并不需要具有相同的长度，如果它们的长度不同，表达式的结果是一个与表达式中最长向量有相同长度的向量，表达式中较短的向量会根据它的长度被重复使用若干次（不一定是整数次），直到与长度最长的向量相匹配，而常数将被不断重复。,R,语言的数据结构,R,语言的数据结构,例如：, 5+c(4,7,17),1 9 12 22, 5*c(4,7,17),1 20 35 85, c(-1,3,-17)+c(4,7,17),1 3 10 0, c(2,4,5)2,1 4 16 25,例如：, sqrt(c(2,4,25),1 1.414214 2.000000 5.000000, 1:2+1:4,1 2 4 4 6, 1:4+1:7,1 2 4 6 8 6 8,10,警告信息：,In 1:4 + 1:7 :,长的对象长度不是短的对象长度的整倍数,3,、数组与矩阵的建立,数组是一个,k,（,1,）维的数据表，矩阵是数组的一个特例，其维数,k=2,，向量可以看成维数为,k=1,的数组。而且向量、数组或者矩阵中的所有元素都必须是同一种类型的。,1,）数组的建立,格式：, array(data,dim,dimnames),其中,data,为一向量，其元素用于构建数组；,dim,为数组的维数向量；,dimnames,为由各维的名称构成的向量（字符型），缺省为空。,R,语言的数据结构,其中，,dim=c(3,4,2),第一个,3,代表有,3,行，第二个,4,代表有,4,列，第三个,2,代表有,2,组。,R,语言的数据结构,例如：, A A, , 1,1 ,2 ,3 ,4,1, 1 4 7 10,2, 2 5 8 11,3, 3 6 9 12, , 2,1 ,2 ,3 ,4,1, 1 4 7 10,2, 2 5 8 11,3, 3 6 9 12,2,）矩阵的建立,R,语言的数据结构,例如：, A A, A A, A A,由于矩阵在数学及统计中的特殊性，在,R,中最为常用的是使用命令,matrix( ),建立矩阵。格式：,matrix(data=NA,nrow=1,ncol=1,byrow=FALSE,dimnames=NULL),其中,data,是一个向量数据，,nrow,是矩阵的行数，,ncol,是矩阵的列数，当,byrow=TRUE,时，生成矩阵的数据按行放置，缺省时相当于,byrow=FALSE,，数据按列放置。,dimnames,是数组维的名字，缺省时为空。,R,语言的数据结构,注意：循环准则仍然适用于,matrix(),，但是要求数据项的个数等于矩阵的列数的倍数，否则会出现警告。,R,语言的数据结构,例如：, X X, X X, A A,统计函数,作用,max(x),返回向量,x,中最大的元素,min(x),返回向量,x,中最小的元素,mean(x),计算样本（向量）,x,的均值,median(x),计算样本（向量）,x,的中位数,var(x),计算样本（向量）,x,的方差,sd(x),计算向量,x,的标准差,length(x),返回向量,x,的长度,sum(x),给出向量,x,的总和,cumsum(x),返回向量,x,和累积和（其第,i,个元素是从,x1,到,xi,的和）,cumprod(x),返回向量,x,和累积积（其第,i,个元素是从,x1,到,xi,的积）,cummin(x),返回向量,x,和累积最小值（其第,i,个元素是从,x1,到,xi,的最小值）,cummax(x),返回向量,x,和累积最大值（其第,i,个元素是从,x1,到,xi,的最大值）,cov(x,y),计算样本（向量）,x,与,y,的协方差,cor(x,y),计算样本（向量）,x,与,y,的相关系数,R,简介,R,语言的基本语法,R,语言的数据结构,数据的存储与读取,简单的,R,会话,数据的存储与读取,1,、,R,的工作目录,命令方式：,获取工作目录的函数：,getwd(),修改工作目录的函数：,setwd(),菜单方式：,文件菜单中的“改变工作目录”,注：,R,命令中目录的分割符使用正斜杠“,/”,或两个反斜杠“,”。, getwd(),1 D:/,我的文档, setwd(f:/r), getwd(),1 f:/r“, setwd(f:r),错误于,setwd(f:r) :,无法改变工作目录,2,、数据保存为文件,函数：,write.table(data,file,row.names=T,quote=T),说明：,data,一般为数据框，也可以是（向量，矩阵，数组，列表等）,row.names,为行号，,quote,为引号，默认为,True,。,数据的存储与读取,函数：,save(data,file=filename),save.image(),说明：保存空间的映像。,注：在,R,退出时系统自动保存两个文件，即,.Rdata,和,.Rhistory,。两个文件的作用分别为保存内存变量值和保存历史命令。所以如果想再次打开,R,时，能够调用曾经的命令，仅执行,save.image(),是不够的，需要保存历史记录为,.Rhistory,文件才可以。,数据的存储与读取,R,简介,R,语言的基本语法,R,语言的数据结构,数据的存储与读取,简单的,R,会话,数据的描述,?mtcars,mtcar:,美国,Motor Trend,杂志收集的,32,辆汽车（,1973-1974,车型）的,11,项指标。,简单的,R,会话,-,例,1,简单的,R,会话,-,例,1,数据的浏览,所有数据,mtcars,前,6,个观测值,head(mtcars),后,6,个观测值,tail(mtcars),简单的,R,会话,-,例,1,数据的编辑,方法一：,data.entry(mtcars),方法二：,MTcarsfix(mtcars),区别：,edit(),修改结果不存入,mtcars,中；,fix(),结果保存至,mtcars,中。,简单的,R,会话,-,例,1,某学校体检测得,10,名女中学生体重,X1,（千克）和身高,X2,（厘米）资料如表,1,所示，试计算体重与身高的均值与标准差,学生编号,体重,X1,身高,X2,学生编号,体重,X1,身高,X2,1,42,156,6,48,162,2,45,158,7,46,157,3,48,161,8,49,159,4,51,156,9,50,163,5,44,153,10,53,165,简单的,R,会话,-,例,2,【,注,】,样本中各数据与样本平均数的差的平方和的平均数叫做,样本方差,；,样本方差的算术平方根叫做,样本标准差,。,标准差越高,表示实验数据越离散,也就是说越不精确。反之,标准差越低,代表实验的数据越精确。,简单的,R,会话,-,例,2, #,输入体重数据, X1 mean(X1) #,计算体重的均值,1 47.6, sd(X1) #,计算体重的标准差,1 3.373096, #,输入身高数据, X2 mean(X2)#,计算身高的均值,1 159,sd(X2)#,计算身高的标准差,1,3.711843,简单的,R,会话,-,例,2,绘制示例一中,12,名学生体重与身高的散点图和体重的直方图。, X1 X2 plot(X1,X2),简单的,R,会话,-,例,2,hist(X1),直方图中数据分为若干组，组宽度代表组内数据值范围，高度代表出现的频度。,简单的,R,会话,-,例,2,统计实例,一家保险公司收集到由,36,个投保个人组成的随机样本，得到每个投保人的年龄（周岁）数据如表所示。试确定投保人平均年龄,90%,的置信区间。,23,35,39,27,36,44,36,42,46,43,31,33,42,53,45,54,47,24,34,28,39,36,44,40,39,49,38,34,48,50,34,39,45,48,45,32,简单的,R,会话,-,例,3,注：置信区间是指数据可靠程度的范围。,90%,指置信水平。,求置信水平下的置信区间公式为：即,x,的均值加减常用置信水平的正态分布的临界,值乘以样本标准差与样本个数开方的差。,90%- =1.645,95%- =1.96,99%- =2.58,简单的,R,会话,-,例,3,x-c(23,35,39,27,36,44, 36,42,46,43,31,33, 42,53,45,54,47,24,34,28,39,36,44,40, 39,49,38,34,48,50,34,39,45,48,45,32),m-mean(x),s-sd(x),z1-m+1.645*(s/sqrt(36),z2-m-1.645*(s/sqrt(36),z-c(z1,z2),z,简单的,R,会话,-,例,3,

展开阅读全文

《芯片原理与技术》课件R语言课件

最新文档