《芯片原理与技术》课件R语言课件

上传人:考试不挂****2941... 文档编号:243038071 上传时间:2024-09-14 格式:PPT 页数:67 大小:2.49MB
返回 下载 相关 举报
《芯片原理与技术》课件R语言课件_第1页
第1页 / 共67页
《芯片原理与技术》课件R语言课件_第2页
第2页 / 共67页
《芯片原理与技术》课件R语言课件_第3页
第3页 / 共67页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,计算机与,R,语言,*,R,语言基础,R,简介,R,语言的基本语法,R,语言的数据结构,数据的存储与读取,简单的,R,会话,Robert Gentleman,Ross Ihaka,R,简介,R,语言的产生,R,语言的创始人,R,语言是,一个开放,(GPL),的统计编程环境,一种语言,是语言的一种方言,(dialect),之一,另一则为,S-plus.,一种软件,是集统计分析与图形直观显示于一体的统计分析,R,简介,多领域的统计资源,目前在,R,网站上约,有,4849,个,程序包,涵盖了基础统计学、社会学、经济学、生态学、空间分析、系统发育分析、生物信息学等诸多方面。,跨平台,R,可在多种操作系统下运行,如,Windows,、,MacOS,、多种,Linux,和,UNIX,等。,命令行驱动,R,即时解释,输入命令,即可获得相应的结果。,5,R,简介,R,语言的特点,R,是完全免费的,R,嵌入了一个非常实用的帮助系统,R,具有很强的作图能力,我们将,R,程序容易地移植到,S-Plus,程序中,反之,S,的许多过程直接或稍作修改用于,R,通过,R,语言的许多内嵌统计函数,很容易学习和掌握,R,语言的语法,我们可以编制自己的函数来扩展现有的,R,语言,(,这就是为什么它在不断等级完善,!),R,简介,R,语言的特点,计划的网站,:,http:/www.r-project.org,了解有关的最新信息和使用说明,得到最新版本的软件和基于的应用统计软件包,.,R,简介,R,简介,R,简介,R,简介,下载,安装,启动,R-GUI,(,R,Graphic,Users,Interface,),R,简介,R,语言的安装与运行,R GUI (graphic users interface),的主窗口,它由三部分组成:主菜单、工具条、,R console (R,的运行窗口,),R,简介,从左至右依次为,:,打开程序脚本,加载工作空间,保存工作空间,复制,粘贴,复制并粘贴,中断当前计算,打印,R,简介,R,工具条,主要工作是在,R console,里通过发布命令来完成的,包括数据集的建立,数据的分析,作图等。,R,是按照问答的方式运行的,即在命令提示符“,”,后键入命令并回车,,R,就完成了一些操作。,在这里你可以得到在线帮助:, help.start() HTML,格式的关于,R,的帮助文件, help(),得到相应函数的帮助,例如,help(plot), demo(),得到,R,提供的几个示例, q(),退出,R,R,简介,R,console,R,简介,程序包是什么?,R,程序包是多个函数的集合,具有详细的说明和示例,Windows,下的,R,程序包是经过编译的,zip,包,每个程序包包含,R,函数、数据、帮助文件、描述文件等,为什么要安装程序包?,R,程序包是,R,功能扩展,特定的分析功能,需要用相应的程序包实现,例如:生物信息学分析,系统发育分析等,命令方式:在已经联网的条件下,在命令提示符后键入,install.packages(“,程序包的名称”,),完成程序包的安装,新安装的程序包在使用前必须先载入,有两种方式:,菜单方式:“程序包,=,载入程序包”,命令方式:, library(“,程序包名称”,),来加载程序包。可以通过“程序包,=,更新程序包”实现实时更新。,R,简介,R,简介,R,语言的基本语法,R,语言的数据结构,数据的存储与读取,简单的,R,会话,1,、符号,1,),命令或运算提示符,2,),+,续行符,3,),#,说明语句字符,2,、赋值符号,1,),大于,2,),=,大于等于,4,),=,小于等于,5,),=,等于,6,),!=,不等于,比较运算得到的结果是逻辑常量,TRUE,(真)和,FALSE,(假)。,R,语言的基本语法,5,、,求助符号,1,) ?,2,),help(),R,语言的基本语法,6,、,常量和变量,1,)常量是其值不变的量,如,1234,,,“abc,等数值、字符串和逻辑值等。,2,)变量是其值可变的量,如,x-3,,,x,就是一个变量,当,xxmode(x),1 numeric,length(x),1 1,R,语言的数据结构,1,)建立数值型向量,数值型向量是统计分析中最常用的向量,可以用下面几个函数建立:,(,1,),seq( ),或“:”,#,若向量序列具有较为简单的规律,(,2,),rep( ) #,若向量序列具有较为复杂的规律,(,3,),sequence() #,输出从,1,到参数的向量,(,4,),c( )#,若向量序列没有什么规律,(,5,),scan( ) #,通过键盘逐个输入,R,语言的数据结构,2.,向量的建立,(,向量:一系列元素的组合),1,、,n1:n2,#,生成从,n1,到,n2,步长为,1,(或,-1,)的向量,R,语言的数据结构,例如:, 1:10,1 1 2 3 4 5 6 7 8 9 10, a-1;b 1:(10-1),1 1 2 3 4 5 6 7 8 9, 1:10-1,1 0 1 2 3 4 5 6 7 8 9,2,、,seq(n1,n2,by=n3,length=n4),#,生成从,n1,到,n2,的向量, n3,为步长,n4,为生成元素的数量,R,语言的数据结构,例如:, seq(1,10),1 1 2 3 4 5 6 7 8 9 10, seq(1,10,by=0.5),1 1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5 6.0 6.5 7.0 7.5 8.0 8.5 9.0 9.5 10.0, seq(1,10,length=11),1 1.0 1.9 2.8 3.7 4.6 5.5 6.4 7.3 8.2 9.1 10.0,3,、,rep(n1,n2),#,生成,n1,重复,n2,次的向量,R,语言的数据结构,例如:, rep(2,3),1 2 2 2, rep(1:5,2),1 1 2 3 4 5 1 2 3 4 5, rep(1:5,1:5),1 1 2 2 3 3 3 4 4 4 4 5 5 5 5 5, rep(1:5,rep(2,5),1 1 1 2 2 3 3 4 4 5 5,4,、,c(),#,直接输出向量,5,、,scan(),#,通过键盘建立向量,R,语言的数据结构,例如:, x=c(42,7,64,9), length(x),例如:, scan(),1: 1 3 6 8,#,此行末回车,5:,#,冒号后直接打回车,Read 4 items,1 1 3 6 8,6,、,sequence(n1),#,生成从,1,开始到,n1,结束步长为,1,的向量,R,语言的数据结构,例如:, sequence(5),1 1 2 3 4 5, sequence(c(5,5),1 1 2 3 4 5 1 2 3 4 5, sequence(c(5,4),1 1 2 3 4 5 1 2 3 4,2),数值型向量的运算,向量的运算方法如下:,(,1,)向量与一个常数的,加、减、乘、除,为向量的每一个元素与此常数进行加、减、乘、除;,(,2,)向量的,乘方(,)与开方,(sqrt),为每一个元素的乘方与开方,这对,log,exp,sin,cos,tan,等普通的运算函数同样适用;,(,3,),同样长度向量的加、减、乘、除,等运算为对应元素进行加、减、乘、除等;,(,4,),不同长度向量的加、减、乘、除,遵从,循环法则,(,recycling rule,),R,语言的数据结构,2.,向量的建立,循环法则:,同一个表达式中的向量并不需要具有相同的长度,如果它们的长度不同,表达式的结果是一个与表达式中最长向量有相同长度的向量,表达式中较短的向量会根据它的长度被重复使用若干次(不一定是整数次),直到与长度最长的向量相匹配,而常数将被不断重复。,R,语言的数据结构,R,语言的数据结构,例如:, 5+c(4,7,17),1 9 12 22, 5*c(4,7,17),1 20 35 85, c(-1,3,-17)+c(4,7,17),1 3 10 0, c(2,4,5)2,1 4 16 25,例如:, sqrt(c(2,4,25),1 1.414214 2.000000 5.000000, 1:2+1:4,1 2 4 4 6, 1:4+1:7,1 2 4 6 8 6 8,10,警告信息:,In 1:4 + 1:7 :,长的对象长度不是短的对象长度的整倍数,3,、数组与矩阵的建立,数组是一个,k,(,1,)维的数据表,矩阵是数组的一个特例,其维数,k=2,,向量可以看成维数为,k=1,的数组。而且向量、数组或者矩阵中的所有元素都必须是同一种类型的。,1,)数组的建立,格式:, array(data,dim,dimnames),其中,data,为一向量,其元素用于构建数组;,dim,为数组的维数向量;,dimnames,为由各维的名称构成的向量(字符型),缺省为空。,R,语言的数据结构,其中,,dim=c(3,4,2),第一个,3,代表有,3,行,第二个,4,代表有,4,列,第三个,2,代表有,2,组。,R,语言的数据结构,例如:, A A, , 1,1 ,2 ,3 ,4,1, 1 4 7 10,2, 2 5 8 11,3, 3 6 9 12, , 2,1 ,2 ,3 ,4,1, 1 4 7 10,2, 2 5 8 11,3, 3 6 9 12,2,)矩阵的建立,R,语言的数据结构,例如:, A A, A A, A A,由于矩阵在数学及统计中的特殊性,在,R,中最为常用的是使用命令,matrix( ),建立矩阵。格式:,matrix(data=NA,nrow=1,ncol=1,byrow=FALSE,dimnames=NULL),其中,data,是一个向量数据,,nrow,是矩阵的行数,,ncol,是矩阵的列数,当,byrow=TRUE,时,生成矩阵的数据按行放置,缺省时相当于,byrow=FALSE,,数据按列放置。,dimnames,是数组维的名字,缺省时为空。,R,语言的数据结构,注意:循环准则仍然适用于,matrix(),,但是要求数据项的个数等于矩阵的列数的倍数,否则会出现警告。,R,语言的数据结构,例如:, X X, X X, A A,统计函数,作用,max(x),返回向量,x,中最大的元素,min(x),返回向量,x,中最小的元素,mean(x),计算样本(向量),x,的均值,median(x),计算样本(向量),x,的中位数,var(x),计算样本(向量),x,的方差,sd(x),计算向量,x,的标准差,length(x),返回向量,x,的长度,sum(x),给出向量,x,的总和,cumsum(x),返回向量,x,和累积和(其第,i,个元素是从,x1,到,xi,的和),cumprod(x),返回向量,x,和累积积(其第,i,个元素是从,x1,到,xi,的积),cummin(x),返回向量,x,和累积最小值(其第,i,个元素是从,x1,到,xi,的最小值),cummax(x),返回向量,x,和累积最大值(其第,i,个元素是从,x1,到,xi,的最大值),cov(x,y),计算样本(向量),x,与,y,的协方差,cor(x,y),计算样本(向量),x,与,y,的相关系数,R,简介,R,语言的基本语法,R,语言的数据结构,数据的存储与读取,简单的,R,会话,数据的存储与读取,1,、,R,的工作目录,命令方式:,获取工作目录的函数:,getwd(),修改工作目录的函数:,setwd(),菜单方式:,文件菜单中的“改变工作目录”,注:,R,命令中目录的分割符使用正斜杠“,/”,或两个反斜杠“,”。, getwd(),1 D:/,我的文档, setwd(f:/r), getwd(),1 f:/r“, setwd(f:r),错误于,setwd(f:r) :,无法改变工作目录,2,、数据保存为文件,函数:,write.table(data,file,row.names=T,quote=T),说明:,data,一般为数据框,也可以是(向量,矩阵,数组,列表等),row.names,为行号,,quote,为引号,默认为,True,。,数据的存储与读取,函数:,save(data,file=filename),save.image(),说明:保存空间的映像。,注:在,R,退出时系统自动保存两个文件,即,.Rdata,和,.Rhistory,。两个文件的作用分别为保存内存变量值和保存历史命令。所以如果想再次打开,R,时,能够调用曾经的命令,仅执行,save.image(),是不够的,需要保存历史记录为,.Rhistory,文件才可以。,数据的存储与读取,R,简介,R,语言的基本语法,R,语言的数据结构,数据的存储与读取,简单的,R,会话,数据的描述,?mtcars,mtcar:,美国,Motor Trend,杂志收集的,32,辆汽车(,1973-1974,车型)的,11,项指标。,简单的,R,会话,-,例,1,简单的,R,会话,-,例,1,数据的浏览,所有数据,mtcars,前,6,个观测值,head(mtcars),后,6,个观测值,tail(mtcars),简单的,R,会话,-,例,1,数据的编辑,方法一:,data.entry(mtcars),方法二:,MTcarsfix(mtcars),区别:,edit(),修改结果不存入,mtcars,中;,fix(),结果保存至,mtcars,中。,简单的,R,会话,-,例,1,某学校体检测得,10,名女中学生体重,X1,(千克)和身高,X2,(厘米)资料如表,1,所示,试计算体重与身高的均值与标准差,学生 编号,体重,X1,身高,X2,学生编号,体重,X1,身高,X2,1,42,156,6,48,162,2,45,158,7,46,157,3,48,161,8,49,159,4,51,156,9,50,163,5,44,153,10,53,165,简单的,R,会话,-,例,2,【,注,】,样本中各数据与样本平均数的差的平方和的平均数叫做,样本方差,;,样本方差的算术平方根叫做,样本标准差,。,标准差越高,表示实验数据越离散,也就是说越不精确。反之,标准差越低,代表实验的数据越精确。,简单的,R,会话,-,例,2, #,输入体重数据, X1 mean(X1) #,计算体重的均值,1 47.6, sd(X1) #,计算体重的标准差,1 3.373096, #,输入身高数据, X2 mean(X2)#,计算身高的均值,1 159,sd(X2)#,计算身高的标准差,1,3.711843,简单的,R,会话,-,例,2,绘制示例一中,12,名学生体重与身高的散点图和体重的直方图。, X1 X2 plot(X1,X2),简单的,R,会话,-,例,2,hist(X1),直方图中数据分为若干组,组宽度代表组内数据值范围,高度代表出现的频度。,简单的,R,会话,-,例,2,统计实例,一家保险公司收集到由,36,个投保个人组成的随机样本,得到每个投保人的年龄(周岁)数据如表所示。试确定投保人平均年龄,90%,的置信区间。,23,35,39,27,36,44,36,42,46,43,31,33,42,53,45,54,47,24,34,28,39,36,44,40,39,49,38,34,48,50,34,39,45,48,45,32,简单的,R,会话,-,例,3,注:置信区间是指数据可靠程度的范围。,90%,指置信水平。,求置信水平下的置信区间公式为:即,x,的均值加减常用置信水平的正态分布的临界,值乘以样本标准差与样本个数开方的差。,90%- =1.645,95%- =1.96,99%- =2.58,简单的,R,会话,-,例,3,x-c(23,35,39,27,36,44, 36,42,46,43,31,33, 42,53,45,54,47,24,34,28,39,36,44,40, 39,49,38,34,48,50,34,39,45,48,45,32),m-mean(x),s-sd(x),z1-m+1.645*(s/sqrt(36),z2-m-1.645*(s/sqrt(36),z-c(z1,z2),z,简单的,R,会话,-,例,3,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!