R软件期末考试复习提纲

合集下载

《软件工程导论》期末复习材料

《软件工程导论》期末复习材料

《软件工程导论》期末复习材料1、什么是软件危机?产生的主要原因有哪些?(1页)软件危机是指在计算机软件的开发和维护过程中所遇到的一系列严重问题。

主要原因:1)用户对软件需求的描述不精确。

2)软件开发人员对用户需求的理解有偏差。

3)缺乏处理大型软件项目的经验。

4)开发大型软件易产生疏漏和错误。

5)缺乏有力的方法学的指导和有效的开发工具的支持。

6)面对日益增长的软件需求,人们显得力不从心。

2、什么是瀑布模型,瀑布模型的缺点主要有哪些?(15页)瀑布模型将软件开发分成:需求分析、规格说明、设计、编码、综合测试和维护阶段,每个阶段必须完成规定的文档,必须等前一个阶段完成之后才开始下一个阶段的工作,前一个阶段输出的文档是下一个阶段的输入文档。

缺点主要包括:1)在软件开发的初期阶段就要求做出正确、全面、完整的需求分析对许多应用软件来说是极其困难的。

2)在需求分析阶段,当需求确定后,无法及时验证需求是否正确、完整。

3)不支持产品的演化,缺乏灵活性,使软件产品难以维护。

3、什么是数据流图,数据流图由哪些基本符号组成?(40页)数据流图:简称DFD, ,主要用于SA(结构化分析)方法,它描绘信息流和数据从输入移动到输出的过程中所经受的变换,是一种功能模型. 基本符号有四种: ->,箭头,表示数据流; =,开口矩形或者两条平行线,表示数据存储; 正方形或者立方形,表示数据的源点或终点,圆角矩形或圆形,表示加工,也就是数据的处理;数据流图中每一个加工至少有一个输入流和一个输出流。

4、数据字典有哪几种元素组成?(47页)1)数据流,2)数据元素,3)数据存储,4)处理或者加工5、需求分析阶段的基本任务是什么(56页)1).问题识别,确定系统的综合需求和数据需求,包括a.功能需求b.性能需求c.环境需求d.用户界面需求e.出错处理的需求f.接口需求2).分析与综合,导出软件的逻辑模型.3).修正开发计划4).编写文档6、模块的内聚有哪几种?(99页)功能内聚(模块就是一个单一功能)、顺序内聚(模块中的处理必须顺序执行)、通信内聚(模块中所有任务都是对同一批数据操作)、过程内聚(模块中的处理必须按特定次序执行)、时间内聚(模块的任务要在同一时间段完成)、逻辑内聚(模块的任务在逻辑上属于一类)、偶然内聚(模块中的任务有很松散的关系)。

3.《R语言》考试大纲

3.《R语言》考试大纲

《R语言》考试大纲一、课程简介《R语言》是现今最受欢迎的数据分析和可视化平台之一。

它是统计领域广泛使用的S 语言的一个分支,可以认为R是S语言的一种实现。

而S语言是由AT&T贝尔实验室开发的一种用来进行数据探索、统计分析和作图的解释型语言。

R语言是自由的开源软件,并同时提供 Windows、Mac OS X 和 Linux 系统的版本。

本课程中,在介绍R语言的基本操作和基本数据处理方法之后,我们着重讲授通过R语言解决回归、方差分析、功效分析、重抽样与自助法、广义线性模型、主成分分析和因子分析、时间序列、聚类分析、以及分类的方法。

这些内容都是统计学的重要组成部分。

通过本课程的学习,能使学生掌握以R语言为工具处理各种统计工作中的实际问题的能力,并为一些后续课程的学习及统计学各领域的实践工作提供必要的保证,同时对于培养学生的计算机操作能力、编程能力有着重要的作用。

二、考查目标考查学生对《R语言》理论基础知识掌握的情况及分析解决某些实际问题的能力。

通过考试,选拔出具有较好统计学功底的学生来攻读我校统计学专业的硕士研究生,以使录取的研究生具有较扎实与系统的进一步学习统计学专业知识及从事有关统计科研工作所需的《R 语言》能力。

三、考试内容及要求第一章回归(一)考核知识点1、拟合线性模型2、评价模型适用性3、解释模型的意义(二)考核要求1、深刻理解各项内容,熟练掌握线性模型的拟合及其评价方法。

2、能够应用本章的知识,通过R语言进行与回归问题相关的计算并解决相关的实际问题。

第二章方差分析1、R中基本的实验设计建模2、拟合并解释方差分析模型3、检验模型假设(二)考核要求1、深刻理解各项内容,熟练掌握方差分析模型的拟合、解释及其检验的方法。

2、能够应用本章的知识,通过R语言进行与方差分析问题相关的计算并解决相关的实际问题。

第三章功效分析(一)考核知识点1、判断所需样本量2、计算效应值3、评价统计功效(二)考核要求1、深刻理解各项内容,熟练掌握效应值的计算方法以及统计功效的评价方法。

R语言期末知识点汇总

R语言期末知识点汇总

1、R区分大小写2、函数getwd()来查看当前的工作目录,setwd()设定当前的目录。

使用引号””闭合这些目录名和文件名3、getwd()——显示当前的工作目录 ls()——列出当前工作空间的对象 rm(objectlist)——移除(删除)一个或多个对象 help()——显示可用选项说明 options()——显示或者设置当前选项 history(#)——显示最近使用过#个命令(默认值为25)savehistory(“myfile”)——保存命令历史到文件myfile中(默认值为.Rhistory)loadhistory(“myfile”)——载入一个命令历史文件(默认值为.Rhistory)save.image(“myfile”)——保存工作空间到文件myfile中(默认值为.RData)save(objectlist,file=”myfile”)——保存指定对象到一个文件中load(“myfile”)——读取一个工作空间到当前会话中(默认值为.RData)q()——退出R。

将会询问你是否保存工作空间4、R将反斜杠\作为一个转义符5、setwd(“mydirectory”)——修改当前的工作目录为mydirectorysetwd()不会自动创建一个不存在的目录6、dir,create()来创建新目录7、函数source(“filename”)可在当前会话中执行一个脚本。

如果文件名不包括路径,R将假设此脚本在当前工作目录中。

8、函数sink(“filename”)将输出重定向到文件filename中。

但是它对图形输出没有影响。

9、参数append=TRUE可以将文本追加到文件后,而不是覆盖它。

参数split=TRUE可将输出同时发送到屏幕和输出文件中。

10、使用dev.off()将输出返回到终端。

11、数据集通常是由数据构成的一个矩形组,行表示观测,列表示变量。

12、单个向量中的数据必须拥有相同的类型或模式。

R软件复习资料

R软件复习资料

第一章快速入门变量的作用域只有在函数内部可见的变量对这个函数来说是“局部变量”。

需要注意的是,R函数中的形式参数是局部变量。

在计算函数调用的取值时,R会把每个实际参数复制给对应的局部参数变量,继而改变那些在函数外不可见的变量的取值。

“作用域法”全局变量是在函数之外创建的变量,在函数内部也可以访问。

向量向量类型是R语言的核心。

向量的元素必须属于某种“模式”mode,或者说是数据类型。

一个向量可以由三个字符串组成(字符模式),或者三个整数元素组成(整数模式),但是不能由一个整数元素两个字符串元素组成。

字符串字符串实际上是字符模式(而不是数值模式)的单元素向量矩阵矩阵是向量,不过还有两个附加属性:行数和列数。

第二章向量标量、向量、数值和矩阵R语言中的变量类型称为模式mode。

R中向量是连续储存的,因此不能插入或删除元素,向量的大小在创建时已经确定。

可以使用函数length()获取向量的长度可以用它判断其向量参数,中第一个1所在位置的引索值First1<-function{for(I in 1:length(x)){if (x[i]==1) break}return(i)}声明和大多数脚本语言一样,R中不需要声明变量。

但是,要引用向量中特定的元素,就必须先告诉R。

在函数语言中,读写向量中的元素,实际上由函数来完成,如果R事先不知道Y是一个向量,那么函数将没有执行对象。

循环补齐在对两个向量使用运算符时,如果要求这两个向量具有相同的长度,R会自动循环补齐,即重复较短的向量,直到它与另一个向量长度相匹配。

在相加之前,也可以转换成相同维数的矩阵。

常用的向量运算R中最重要和最常用的一个运算符是引索。

引索向量的格式是向量1[向量2],它返回的结果是,向量1中引索为向量2的那些元素。

>y<-c(1.2,3.9,0.4,0.12)>y[c(1,3)][1]1.2 0.4>y[2:3][1]3.9 0.4负数的下标代表我们想把相应元素剔除>z<-c(4,2,17,5)>z[-1][1]12 13NA和NULL值在统计数据集,我们经常遇到缺失值,在R中表示为NA。

软件工程复习提纲总结3篇

软件工程复习提纲总结3篇

软件工程复习提纲总结3篇七、软件维护1.软件维护的含义及类型?2.软件维护过程?3.◆需要把握的内容:4.1、面对对象分析(OOA)的任务?5.面对对象分析(OOA)过程中包括哪些活动?6.2、三种面对对象模型各自表示的内容?7.3、对象模型的表示工具?动态模型的表示工具?功能模型的表示工具?8.4、结合软件开发实例,理解三种面对对象模型之间的关系9.以及面对对象分析环节完成的主要工作。

10.11.---------------? 课堂练习题目一、填空题1.软件主要包括程序、和三部分内容。

2.软件可行性讨论的任务是从技术、和三个方面分析软件项目的可行性。

3.软件测试的目的是;通常把软件测试方法分为和两大类。

4.结构化分析方法中,功能模型用描述;数据模型用描述。

5.在类的继承结构中,不同层次的类共享同一个行为名称,但各个类可以根据自己的需要为同名行为设计不同的算法,此性质称为类的__。

二、选择题1.产生软件危机的主要缘由有(C)。

①软件本身的特点②用户使用不当③硬件牢靠性差④程序员水平⑤缺乏好的开发方法和管理手段A.③④B.①②④C.①⑤D.①③2.需求分析阶段,开发人员需从用户那里获得的最重要信息是(C)。

A.用户能接受的开发费用B.用户能接受的开发周期C.用户要让软件做什么D.软件应具有何种结构3.数据流图中的每个处理至少有(B)。

A.一个输入流或一个输出流B.一个输入流和一个输出流C.一个输入流D.一个输出流4.在面对数据流的设计方法中,一般把数据流图划分为(C)两种类型。

A.数据流和事务流B.变换流和数据流C.变换流和事务流D.掌握流和事务流5.数据流图所描述的是实际系统的(A)。

A.规律模型B.物理模型C.程序流程D.数据结构6.由变换型数据流图转换成模块结构图,其中包括变换模块,则(B)。

A.变换模块就是主模块B.变换模块的功能是将规律输入变换为规律输出C.变换模块没有下层模块D.变换模块只能有一个输入量、一个输出量7.为了提高软件测试的效率,应当(C)。

《Visual FoxPro应用基础》期末复习提纲

《Visual FoxPro应用基础》期末复习提纲

,《Visual FoxPro应用基础》期末复习提纲第一章:数据库系统阶段的数据处理的特点,常用的数据模型,数据库的定义、数据库系统的组成和数据库系统的核心?不同数据处理阶段的数据独立性比较;三种基本的数据模型的名称;根据实例确定实体集的联系类型;关系模型的表示方式(二维表);第二章:Visual FoxPro所使用数据模型,以及“设计器”的主要功能,Visual FoxPro 的默认目录设置方法;常用命令,如退出系统命令QUIT;第三章:1.常用的数据类型,特别是日期型、逻辑型等固定宽度的类型。

2.字符型常量和逻辑型常量的表示形式3.数组的定义命令,store和?命令的使用。

4. 常用的函数的使用:重点是len()、substr和date()等函数的使用。

5.简单表达式的使用,例如:4<8 and 1<3,2^3, ’abc’+’de’等式子结果Visual FoxPro 6.0提供的数据类型有哪些,可以保存什么数据;Visual FoxPro的字符型、日期型常量的格式;Store命令、?命令;字符运算符+、关系运算符==、逻辑运算符.and..or.的运算;掌握Visual FoxPro的常用函数的使用方法,例如INT()、CTOD()、V AL()、SUBSTR()、MONTH()等;简单的逻辑表达式的值;用关系表达式表示数学表达式,例如表达0≤x≤5;第四章:建表的过程和命令,打开表的命令use、修改表结构命令modify structure 功能和使用、定义表的结构要定义的内容,显示和浏览表的命令以及其使用方法(browse,list/display)表的结构由哪些因素;独占方式打开表的命令和表的关闭命令;浏览数据的操作命令(browse、list)使用方式;如何使用命令序列浏览数据(根据数据库表利用命令进行操作);第五章:1. 索引的类型以及主索引的特点、index on命令的使用以及默认情况下所建的索引的类型。

R语言期末知识点汇总

R语言期末知识点汇总

和输出文件中。
10、使用 dev.off()将输出返回到终端。
11、数据集通常是由数据构成的一个矩
形组,行表示观测,列表示变量。 12、单个向量中的数据必须拥有相同的 类型或模式。同一向量中无法混杂不同 模式的数据。 13、标量是只含一个元素的向量。 14、方括号中的数表示给定元素中所处 的位置。 15、创建矩阵。一般格式: myymatrix<-matrix(vector,nrow=num ber_of_rows,ncol=number_of_coumns, byrow=logical_value,dimnames=list (char_vector_rownames,char_vectoe _colnames))其中 vector 包含了矩阵 的元素,nrow 和 ncol 用以指定的行和 列的维数,diamnames 包含了可选的以 字符型向量表示的行名和列名。 16 、 byrow 表 明 矩 阵 按 行 填 充 ( byrow=TRUE ) 还 是 按 列 填 充 (byrow=FALSE),默认情况下按列。 17、X[i,]指矩阵 X 中的第 i 行,X[,j] 表示第 j 列,X[i,j]表示第 i 行第 j 列。 18 、 数 组 创 建 。 一 般 格 式 : myarray<-array(vrctor,dimensions, dimnames)其中 vector 包含了数组的 数据,dimensions 是一个数值型向量, 给出了各维度下标的最大值,即几行几 列也可是三维的,而 dimnames 是可选 的、给维度名称标签的列表。 19、数据框的创建。 Mydata<_data.from(col1,col2,…)其 中 col1,col2,…表示的是列向量 20、函数 attach()可将数据框添加到 R 的搜索路径中。detach()将数据框从搜 索路径中移除,并且不会对数据框本身 做任何处理。 21、类别(名义型)变量和有序类别变 量在 R 中称为因子。 22、函数 factor()以一个整数向量的 形式存储类别值,整数的取值范围是 [1…k],同时一个由字符串(原始值) 组成的内部向量将投影到这些数上。要 表示有序型变量,需要为函数 factor() 指定参数 order=TRUE。

软件工程期末考试复习重点

软件工程期末考试复习重点

第一章软件危机:是指在计算机软件的开发和维护过程中所遇到的一系列严重的问题。

软件危机的主要表现:1、对软件开发成本和进度的估计常常很不准确。

2、用户对“已完成的”软件系统不满意的现象经常发生。

3、软件产品的质量往往靠不住。

4、软件常常是不可维护的5、软件通常没有适当的文档资料6、软件成本在计算机系统总成本中所占的比例逐年上升7、软件开发生产率提高的速度,远远跟不上计算机应用迅速普及深入的趋势软件工程:定义一:是为了经济地获得可靠的且能在实际机器上有效地运行的软件,而建立和使用完善的工程原理。

定义二:1.把系统的、规范的、可度量的途径应用于软件开发、运行和维护过程,也就是把工程应用于软件;2.研究1.中提到的途径。

软件工程方法学的三个要素:方法、工具和过程。

目前使用的最广泛的软件工程方法学:传统方法学、面向对象方法学。

软件的生命周期:软件生命周期有软件定义、软件开发和运行维护3个时期组成;定义时期分为:问题定义、可行性研究和需求分析阶段;开发时期分为:总体设计、详细设计、编码和单元测试、综合测试;维护时期的任务:是软件持久的满足用户的需求;瀑布模型:最广泛的过程模型;瀑布模型的特点:1、阶段间具有顺序性和依耐性;2、推迟实现的观点;3、质量保证的观点;Rational统一过程(RUP)四个阶段的工作目标:初始阶段:建立业务模型,定义最终产品视图,并且确定项目的范围;精化阶段:设计并确定系统的体系结构,制定项目计划,确定资源需求;构建阶段:开发出所有构件和应用程序,把他们集成为客户需要的产品,并且详尽地测试所有功能;移交阶段:把开发出的产品提交给用户使用;第二章可行性研究的目的是确定问题是否值得去解决;可行性研究的方面:技术可行性、经济可行性、操作可行性;系统流程图描述物理模型;P39(要求会做)数据流图描述逻辑模型;P40(要求会做)数据流图(DFD)描绘信息流和数据从移动到输出的过程中所经受的变换;数据字典有以下4类元素的定义组成:数据流、数据流分量(数据元素)、数据存储、处理;由数据元素组成的数据的方式三种基本类型:顺序、选择、重复;“=”是等价于(或者定义为),“+”是和(用来连接分量),“[ ]”是或(从其中选一),“{ }”是重复,“()”是可选;第三章:需求分析任务:功能需求是指定系统必须提供的服务,通过该分析划出该系统必须完成的所有功能。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

#期末考试专项复习#一、矩阵与数据框#1.生成特定的矩阵与数据框#矩阵#方法一a=array(1:10,dim=c(2,5))rownames(a)=1:2colnames(a)=c("one","two","three","four","five")adimnames(a)=list(1:2,c("one","two","three","four","five"))nrow=nrow(a)ncol=ncol(a)dim(a)#方法二a=matrix(1:10,nrow=2,byrow=F)rownames(a)=1:2colnames(a)=c("one","two","three","four","five")a=matrix(1:10,nrow=2,byrow=F,dimnames=list(1:2,c("one","two","three","four","five")))#数据框的生成df=data.frame(Name=c("Alice","Becka","James","Jeffrey","John"),Sex=c("F","F","M","M","M"),Age=c(13,13,12,13,12),Height=c(56.5,65.3,57.3,62.5,59.0),Weight=c(84.0,98.0,83.0,84.0,99.5));dfLst=list(Name=c("Alice","Becka","James","Jeffrey","John"), Sex=c("F","F","M","M","M"),Age=c(13,13,12,13,12),Height=c(56.5,65.3,57.3,62.5,59.0),Weight=c(84.0,98.0,83.0,84.0,99.5))LstLst[["Name"]]Lst["Name"]Lst[1]Lst[[1]]Lst$Namedf=as.data.frame(Lst)dfx=array(1:6,dim=c(2,3))as.data.frame(x)#数据框的引用df[1:2,3:5]df[["Height"]]df$Weightnames(df)#此属性一定非空rownames(df)=c("one","two","three","four","five") dfattach(df)r=Height/Weightrdf$r=rnames(df)detach()r=Height/Weight#2.矩阵的运算a=diag(1:3)a[2][1]=1a#1转置运算t(a)#2行列式det(a)#3向量积x=1:5y=2*1:5x%*%yt(x)%*%ycrossprod(x,y)#4向量的外积x%*%t(y)tcrossprod(x,y)outer(x,y)x%o%y#矩阵的乘法a=array(1:9,dim=c(3,3)) b=array(9:1,dim=c(3,3)) x=1:3a*ba%*%bx%*%a%*%xcrossprod(a,b)#t(a)%*%b tcrossprod(a,b)#a%*%t(b) #矩阵的逆solve(a)b=1:3solve(a,b)#ax=b的解#矩阵的特征值与特征向量sm=eigen(a)sme=diag(1:3)svde=svd(e)svdeattach(svde)u%*%diag(d)%*%t(v)#与矩阵运算有关的函数#取维数a=diag(1:4)nrow(a)ncol(a)#矩阵的合并x1=rbind(c(1,2),c(3,4))x2=x1+10x3=cbind(x1,x2)x3x4=rbind(x1,x2)x4cbind(1,x1)#矩阵的拉直a=matrix(1:6,ncol=2,dimnames=list(c("one","two","three"),c("first","second")),byrow=T)as.vector(a)#apply函数apply(a,1,mean)apply(a,2,sum)tapply(1:5,factor(c("f","f","m","m","m")),mean) #第二题#产生随机数x=rnorm(100,0,1)x#画随机数的直方图hist(x,freq=F)#核密度曲线density(x)lines(density(x),col="blue")#添加正态分布分布函数y=seq(-4,3,0.2)lines(y,dnorm(y,mean(x),sd(x)),col="red")#画随机数的经验分布函数z=rnorm(50,0,1)plot(ecdf(z),do.p=F,verticals=T)d=seq(-3,2,0.2)lines(d,pnorm(d,mean(z),sd(z)),col="red")y=rpois(100,2)plot(ecdf(y),col="red",verticals=T,do.p=F)x=0:8lines(x,ppois(x,mean(y)),col="blue")w=c(75,64,47.4,66.9,62.2,62.2,58.7,63.5,66.6,64.0,57.0,69.0 ,56.9,50.0,72.0)hist(w,freq=F)lines(density(w),col="blue")x=44:76lines(x,dnorm(x,mean(w),sd(w)),col="red")plot(ecdf(w),do.p=F,verticals=T)lines(x,pnorm(x,mean(w),sd(w)),col="red")#编写函数求随机数的各种描述统计量data_outline=function(x){n=length(x)m=mean(x)v=var(x)s=sd(x)me=median(x)cv=100*s/mcss=sum((x-m)^2)uss=sum(x^2)R=max(x)-min(x)#样本极差R1=quantile(x,3/4)-quantile(x,1/4)#四分位差sm=s/sqrt(n)#样本标准误g1=n/(n-1)/(n-2)*sum((x-m)^3)/s^3g2=n*(n+1)/(n-1)/(n-2)/(n-3)*sum((x-m)^4)/s^4-3*(n-1)^2/(n-2)/(n-3)data.frame(N=n,Mean=m,Var=v,std_dev=s,Median=me,std_mean=sm,CV=cv,CSS=css,USS=uss, R=R,R1=R1,Skewness=g1,Kurtosis=g2,s=1) }x=rnorm(100)data_outline(x)#第三题#r,p,q,drnorm(100,0,1)pnorm(1:5,0,1)dnorm(-3:3,0,1)qnorm(seq(0,1,0.25),0,1) rbeta(100,2,2)rbinom(100,100,0.5) pbinom(1:100,100,0.5) dbinom(1:5,100,0.5) qbinom(seq(0,1,0.1),100,0.5) rchisq(100,1)qchisq(seq(0,1,0.2),10) pchisq(1:10,10)dchisq(1:10,10)rexp(100,0.5)rpois(100,2)ppois(1:1000,2)dpois(1:100,2)runif(100,0,1)qunif(c(0,0.2,0.8),0,1)punif(seq(0,1,0.2),0,1)dunif(seq(0,1,0.01),0,1)rt(100,2)qt(0.8,2)pt(-3:3,2)dt(-3:3,2)rf(100,1,2)qf(0.8,1,2)#四置信区间#1#(1)sigma已知interval_estimate1=function(x,side=0,sigma=1,alpha=0.05){ xb=mean(x);n=length(x)if(side<0){tmp=sigma/sqrt(n)*qnorm(1-alpha)a=-Inf;b=xb+tmp}else if(side>0){tmp=sigma/sqrt(n)*qnorm(1-alpha)a=xb-tmp;b=Inf}else{tmp=sigma/sqrt(n)*qnorm(1-alpha/2)a=xb-tmp;b=xb+tmp}data.frame(mean=xb,a=a,b=b)}x=rnorm(100,0,4)interval_estimate1(x,sigma=4,side=0)interval_estimate1(x,sigma=4,side=-1)interval_estimate1(x,sigma=4,side=1)#(2)sigma未知interval_estimate2=function(x,side=0,alpha=0.05){ xb=mean(x);n=length(x)if(side<0){tmp=sd(x)/sqrt(n)*qt(1-alpha,n-1)a=-Inf;b=xb+tmp}else if(side>0){tmp=sd(x)/sqrt(n)*qt(1-alpha,n-1)a=xb-tmp;b=Inf}else{tmp=sd(x)/sqrt(n)*qt(1-alpha/2,n-1)a=xb-tmp;b=xb+tmp}data.frame(mean=xb,a=a,b=b)}x=rnorm(100,0,1)interval_estimate2(x,side=-1)interval_estimate2(x,side=0)interval_estimate2(x,side=1)t.test(x,side=-1)t.test(x,side=0)t.test(x,side=1)#两个总体sigma1=sigma2但未知interval_estimate3=function(x,y,alpha=0.05){xb=mean(x);yb=mean(y)n1=length(x);n2=length(y)sw=((n1-1)*var(x)+(n2-1)*var(y))/(n1+n1-2)tmp=sqrt((1/n1+1/n2)*sw)*qt(1-alpha/2,n1+n2-2) a=xb-yb-tmp;b=xb-yb+tmpdata.frame(mean=xb-yb,a=a,b=b)}x=rnorm(100,0,1)y=rnorm(100,1,1)interval_estimate3(x,y)-0.03643479 - 0.98699097#第五题假设检验#(1)sigam已知,双侧,检验mu=mu0 mean.test1=function(x,mu=0,sigma=1){ xb=mean(x);n=length(x)z=(xb-mu)/sigma*sqrt(n)p=pnorm(z)if(p<=1/2)P=2*pelseP=2*(1-p)data.frame(mean=xb,Z=z,p_value=P)}x=rnorm(100,0,2)mean.test1(x,mu=0,sigma=2)#(2)sigma未知,双侧,检验mu=mu0 mean.test2=function(x,mu=0){xb=mean(x);n=length(x)z=(xb-mu)/sd(x)*sqrt(n)p=pt(z,n-1)if(p<=1/2)elseP=2*(1-p)data.frame(mean=xb,Z=z,p_value=P)}x=rnorm(100)mean.test2(x,mu=0)t.test(x,mu=0,alt="two.side")#两个总体sigma1=sigma2但未知,检验mu1=mu2 mean.test3=function(x,y,mu=0){xb=mean(x);yb=mean(y)n1=length(x);n2=length(y)sw=((n1-1)*var(x)+(n2-1)*var(y))/(n1+n2-2)t=(xb-yb-mu)/sqrt(sw*(1/n1+1/n2))p=pt(t,n1+n2-1)if(p<=1/2)P=2*pelseP=2*(1-p)data.frame(mean=xb-yb,T=t,p_value=P)}x=rnorm(100,0,1)y=rnorm(100,2,1)mean.test3(x,y,mu=-2)t.test(x,y,var.equal=T,mu=-2)x=rnorm(100,0,1)y=rnorm(100,0,2)mean.test3(x,y)t.test(x,y,var.equal=T)#第六题调用R函数#k-s检验两组数是否同分布x=rnorm(100,0,1)y=rt(100,5)z=rnorm(100,0,1)ks.test(x,y),alt="l"ks.test(x,z)#检验一组数是否服从已知分布ks.test(x,"pnorm",0,2)ks.test(x,"pt",1)#符号检验两组数是否有差异x=rbinom(100,100,0.5)binom.test(sum(x>=50),100)y=rbinom(100,100,0.4)binom.test(sum(x<y),length(x)),alt="g"#wilcoxon符号秩和检验(精确或大样本近似)#wilcox.test(x,y,alt,mu,paired=F,exact=NULL,correct=T,conf.int=F, conf.level=0.95)r=runif(100,136,145)wilcox.test(r,mu=140,alt="l",exact=F,conf.int=T,correct=F)x=rnorm(100)y=rnorm(100)wilcox.test(x,y,paired=T,alt="g")wilcox.test(x-y,alt="g")binom.test(sum(x>y),length(x),alt="g")#第七题#相关性检验x=1:6y=6:1z=2:7cor.test(x,y,alt="g",method="spearman")cor.test(x,z,alt="g",method="spearman")#无节点x=c(2,3,1,4,5,8,6)y=1:7cor.test(x,y,alt="g",method="spearman",correct=T)n=length(x)r=rank(x)rR=rank(y)Rs=sum((r-R)^2)rho=1-6*s/n/(n^2-1)rho#有节点x=c(2,3,4,4,5,8,6)y=1:7cor.test(x,y,alt="g",method="spearman",correct=T)exact=F, n=length(x)r=rank(x)rR=rank(y)Rsxy=sum((r*R))sx=sum(r^2)sy=sum(y^2)t=n*((n+1)/2)^2rho=(sxy-t)/sqrt(sx-t)/sqrt(sy-t)rho#第八题回归x=c(seq(0.1,0.18,0.01),0.20,0.21,0.23)y=c(42,43.5,45,45.5,45,47.5,49,53,50,55,55,60)#散点图plot(x,y)#做回归lm.sol=lm(y~x)lm.sol=lm(y~1+x)#汇总统计量summary(lm.sol)#画回归线abline(lm.sol)#求回归系数的区间估计beta.int=function(lm.sol,alpha=0.05){A=summary(lm.sol)$coefficientsdf=lm.sol$df.residualleft=A[,1]-A[,2]*qt(1-alpha/2,df)right=A[,1]+A[,2]*qt(1-alpha/2,df)rowname=dimnames(A)[[1]]#列表的第一个元素colname=c("estimate","left","right")matrix(c(A[,1],left,right),ncol=3,dimnames=list(rowname,colname)) }beta.int(lm.sol)#对新的自变量求因变量的预测值及预测区间new=data.frame(x=c(0.16,0.19,1.20))lm.predict=predict(lm.sol,new)lm.predictlm.predict=predict(lm.sol,new,interval="confidence",level=0.95) lm.predict=predict(lm.sol,new,interval="prediction",level=0.95) #残差图resid=lm.sol$residualsplot(resid)y.res=resid(lm.sol)y.fit=predict(lm.sol)plot(y.res~y.fit)plot(y.res~x)plot(lm.sol,1)plot(lm.sol,2)plot(lm.sol,3)plot(lm.sol,4)。

相关文档
最新文档