统计学(第四版)期末复习资料

合集下载

《统计学原理》(第四版)期末复习要求及练习试题(附答案)

《统计学原理》(第四版)期末复习要求及练习试题(附答案)

《统计学原理》(第四版)期末复习要求2010年12月第一部分课程考核的有关事项说明(一)考核对象本课程的考核对象是专科财经类各专业的学生。

(二)考核方式本课程采用形成性考核和期末闭卷考试相结合的方式。

学习过程中的形成性考核包括课堂成绩、安排的平时作业。

形成性考核成绩占学期总成绩的60%。

期末考试成绩占学期总成绩的40%。

课程总成绩按百分制记分,60分为合格。

(三)命题依据本课程的命题依据是复旦大学《统计学原理》第四版(李洁明、祁新娥著)课程教学大纲和本考核说明。

(四)考试要求本课程是一门专业基础课,要求学生在学完本课程后,能够掌握本课程的基本知识,并具有应用所学知识分析和解决实际问题的能力。

据此,本课程的考试注重基本知识考查和应用能力考查两个方面,在各章的考核要求中,有关基本概念、基本理论、统计的基本公式、计算方法及数量应用分析能力的年月日()上午,:00- :本课程期末考试可以携带计算工具。

第二部分课程考核绪论一、考核知识点(一)统计的研究对象(二)统计的研究方法(三)统计的几个基本概念二、考核要求- 1 -(一)统计的研究对象了解:社会经济统计研究对象的含义。

理解:社会经济现象数量方面的具体含义及社会经济统计所研究的数量方面的特点。

(二)统计的研究方法理解:统计的研究方法(三)统计的几个基本概念了解:统计指标体系及其分类。

理解:统计总体、总体单位的含义及相互关系;标志与指标的含义、品质标志和数量标志的含义及二者的区别;变异和变量的的含义及两种变量的区分;统计指标与统计指标体系的含义、分类;统计指标与标志的联系与区别;数量指标与质量指标的概念、作用及相互关系。

流量与存量概念;掌握:统计指标的特点及总体、单位、标志、指标之间的关系。

第二章统计调查与整理一、统计调查考核知识点(一)统计调查意义和种类(二)统计调查方案(三)统计调查方法二、考核要求(一)统计调查的一般概念了解:统计调查的含义、基本要求。

统计学基础知识期末复习资料

统计学基础知识期末复习资料

统计学基础知识期末复习资料统计学是一门研究收集、整理、分析和解释数据的学科。

它是一个广泛的学科领域,应用于各个行业和领域。

在期末考试前夕,复习统计学的基础知识是非常重要的。

本文将为你提供统计学基础知识的复习资料,帮助你更好地准备期末考试。

1. 描述性统计描述性统计是统计学的基础,它涉及到对数据进行整理、总结和分析。

描述性统计包括以下几个方面:- 中心趋势的测量:包括平均数、中位数和众数。

平均数是一组数据的算术平均值,中位数是一组数据的中间值,众数是一组数据中出现次数最多的值。

- 变异性的测量:包括范围、方差和标准差。

范围是一组数据的最大值和最小值之间的差距,方差是数据偏离平均值的平方和的平均值,标准差是方差的平方根。

- 分布形状的测量:包括偏度和峰度。

偏度描述了数据的分布形状的对称性,偏度为0表示数据分布是对称的,偏度大于0表示数据分布是正偏的,偏度小于0表示数据分布是负偏的。

峰度描述了数据分布的尖峰程度,峰度大于0表示数据分布是尖峰的,峰度小于0表示数据分布是平坦的。

2. 概率基础概率是描述事件发生可能性的数值。

在统计学中,概率是非常重要的,因为它用于计算和预测事件的发生概率。

以下是概率的基本概念:- 随机试验和样本空间:随机试验是指在相同条件下可以重复进行的实验,样本空间是随机试验所有可能结果的集合。

- 事件和事件的概率:事件是样本空间的子集,事件的概率是事件发生的可能性。

- 条件概率和独立事件:条件概率是指在已知某一事件发生的前提下,另一事件发生的概率。

两个事件是独立的,当且仅当一个事件的发生不受另一事件发生与否的影响。

- 概率分布:概率分布是指随机变量所有可能取值与其对应的概率之间的关系。

常见的概率分布包括离散概率分布和连续概率分布。

3. 参数估计和假设检验参数估计和假设检验是统计学中常用的方法,用于从样本中推断总体的特征或进行统计推断。

以下是参数估计和假设检验的基本概念:- 参数估计:参数估计是根据样本数据推断总体参数的数值。

统计学期末考试题型统计学第四版

统计学期末考试题型统计学第四版

1. 一本书排版后一校时出现错误处数X 服从正态分布N(200,400),求:(1) 出现错误处数不超过230的概率。

(2) 出现错误处数在190~210之间的概率 卷面解答过程:解:已知X~N (200,202),则(1) P (X ≤230)=Φ(230−20020)=Φ(1.5)=0.9332(2) P (190<X <210)=Φ(210−20020)-Φ(190−20020)=0.382MINITAB 操作步骤:(1) 图形→概率分布图→查看概率→输入均值、标准差→阴影区域→左尾→X 值230 (2) 图形→概率分布图→查看概率→输入均值、标准差→阴影区域→双尾→X 值190或2102. 顾客到银行办理业务时往往需要等待一段时间,而等待时间的长短与许多因素有关,比如,银行业务员办理业务的速度,顾客等待排队的方式等。

为此,某银行准备采取两种排队方式进行试验,第一种排队方式是:所有顾客都进入一个等待队列;第二种排队方式是:顾客在三个业务窗口处列队等待。

为比较哪种排队方式使顾客等待的时间更短,要求:(1) 构建第一种排队方式等待时间标准差的95%的置信区间 (2) 构建第二种排队方式等待时间标准差的95%的知心区间 (3) 根据(1)和(2)的结果,你认为哪种排队方式更好? 卷面解答过程: 解:已知n=10(1) 根据抽样结果计算得x =7.150s=0.477又∵α=0.05,由单方差得总体标准差σ的95%的置信区间为(6.809, 7.491);(2) 根据抽样结果计算得x =7.150s=1.822又∵α=0.05,由单方差得总体标准差σ的95%的置信区间为(5.847, 8.453)。

(3) 根据上面两道题目的答案可知,第一种排队方式所需等待的时间较为稳定,更为可取。

MINITAB 操作步骤:(1) 输入数据→统计→基本统计量→单样本t →选择数据→选项:95%MINITAB 显示: 单样本 T: C1平均值变量 N 平均值 标准差 标准误 95% 置信区间C1 10 7.150 0.477 0.151 (6.809, 7.491)(2)同上3.调查了338名50岁以上的人,其中205名吸烟者中有43个患慢性气管炎,在134名不吸烟者中有13人患慢性气管炎。

统计学第四版--习题集与答案[1](1)

统计学第四版--习题集与答案[1](1)

答案附在后面有一些(在题目上若要打印先把答案去掉)每单兀后面都有答案第一章导论【重点】了解统计的科学涵义,明确统计学的学科性质及基本研究方法,掌握统计数据的特点及其不同类型,牢固掌握统计学的基本概念。

【难点】准确掌把数据不同类型,牢固掌握统计学的基本概念并结合实例分析。

思考题1.1什么是描述统计学、推断统计学?怎样理解描述统计学和推断统计学在探索事物数量规律性中的地位和作用?1.2统计学发展史上有哪几个主要学派?1.3“统计学” 一词有哪几种含义?1.4什么是统计学?怎样理解统计学与统计数据的关系?1.5统计数据可分为哪几种类型?不同类型的数据各有什么特点?1.6举例说明总体、样本、参数、统计量、变量这几个概念。

练习题一、单项选择题1、 指出下面的数据哪一个属于分类数据()A 、年龄B 、工资C 、汽车产量D 、购买商品的支付方式(现金、信用卡、支票)2、 指出下面的数据哪一个属于顺序数据( )A 、年龄B 、工资C 、汽车产量D 、员工对企业某项制度改革措施的态度 (赞成、中立、反对)3、某研究部门准备在全市200万个家庭中抽取2000个家庭,据此推断该城市 所有职工家庭的年人均收入,这项研究的统计量是()A 、2000个家庭C 、2000个家庭的人均收入 4、了解居民的消费支出情况,则(A 、居民的消费支出情况是总体 C 、居民的消费支岀情况是总体单位 5、 统计学研究的基本特点是()A 、 从数量上认识总体单位的特征和规律B 、 从数量上认识总体的特征和规律C 、 从性质上认识总体单位的特征和规律D 、 从性质上认识总体的特征和规律 6、 一家研究机构从IT 从业者中随机抽取B 、200万个家庭D 、200万个家庭的人均收入)B 、所有居民是总体 D 、所有居民是总体单位500人作为样本进行调查,其中60%的人回答他们的月收入在5000元以上,50%的回答他们的消费支付方A、分类变量B、顺序变量C、数值型变量D、离散变量7、要反映我国工业企业的整体业绩水平,总体单位是()A、我国每一家工业企业B、我国所有工业企业C、我国工业企业总数D、我国工业企业的利润总额8、一项调查表明,在所抽取的1000个消费者中,他们每月在网上购物的平均消费是200元,他们选择在网上购物的主要原因是“价格便宜”。

统计学(第四版)贾俊平复习资料名词解释概念课后思考题答案

统计学(第四版)贾俊平复习资料名词解释概念课后思考题答案

统计学(第四版)贾俊平复习资料名词解释概念课后思考题答案l.获得数据的概率抽样方法有哪些?(1)简单随机抽样简单随机抽样又称纯随机抽样,是指在特定总体的所有单位中直接抽取n个组成样本。

它最直观地体现了抽样的基本原理,是最基本的概率抽样。

<2)系统抽样系统抽样也称等距抽样或机械抽样,是按一定的间隔距离抽取样本的方法。

(3)分层抽样分层抽样也叫分类抽样,就是先将总体的所有单位依照一种或几种特征分为若干个子总体,每一个子总体即为一类,然后从每一类中按简单随机抽样或系统随机抽样的办法抽取一个子样本,称为分类样本,它们的集合即为总体样本。

(4)整群抽样整群抽样又称聚类抽样或集体抽样,是将总体按照某种标准划分为一些群体,每一个群体为一个抽样单位,再用随机的方法从这些群体中抽取若干群体,并将所抽出群体中的所有个体集合为总体的样本。

(5)多阶段抽样多阶段抽样又称多级抽样或分段抽样,就是把从总体中抽取样本的过程分成两个或多个阶段进行的抽样方法。

2.茎叶图与直方图相比有什么优点?它们的应用场合是什么?茎叶图与直方图相比,茎叶图既能给出数据的分布状况,又能给出每一个原始数值,即保留了原始数据的信息。

而直方图虽然能很好地显示数据的分布,但不能保留原始的数值。

在应用方面,直方图通常适用于大批量数据,茎叶图通常适用于小批量数据。

3鉴别图标优劣的准则1精心设计,有助于洞察问题的实质。

2使复杂的观点得到简明、确切、高效的阐述。

3能在最短的时间内以最少的笔墨给读者提供最大量的信息。

4是多维的。

5表述数据的真实情况。

4.一组数据的分布特征可以从哪几个方面进行测量?答:数据分布的特征可以从三个方面进行测度和描述:一是分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度;二是分布的离散程度,反映各数据远离其中心值的趋势;三是分布的形状,反映数据分布的偏态和峰态。

这三个方面分别反映了数据分布特征的不同侧面。

5. 标准分数有哪些用途?标准分数给出了一组数据中各数值的相对位置。

统计学期末复习要点

统计学期末复习要点

统计学期末复习要点一、复习重点1、理解描述统计学与推断统计学2、熟悉定量数据与定性数据的图表描述,常用图表3、熟练掌握加权算术平均数、标准差、标准差系数的计算方法理解样本均值、样本比例的抽样分布及中心极限定理4、理解点估计的三个评价标准,区间估计的置信水平的概念5、熟练掌握总体均值与总体比例的区间估计方法6、理解影响样本容量大小因素(置信水平、总体方差、允许误差),是怎样影响的?7、理解假设检验的原理、步骤及两类错误8、熟练掌握总体均值、总体比例的假设检验9、理解方差分析的概念、原理及基本步骤14、熟悉选择拟合时间序列趋势模型的分析方法、理解一元线性、抛物线、指数曲线趋势模型15、理解加权综合指数与加权平均指数的概念及计算16、理解拉氏指数和帕氏指数概念及计算17、理解指数体系的概念及作用,熟练掌握总量指标的两因素分析方法18、理解CPI指数及其经济意义,CPI指数与购买力指数的关系二、思考题1、解释洛伦茨曲线及其用途。

2、怎么理解均值在统计学中的地位?3、简述众数、中位数和均值的特点和应用场合。

4、简述综合指数的基本编制原理。

5、写出大样本条件下总体均值左侧检验的基本步骤。

6、写出小样本条件下总体方差未知时正态总体均值左侧检验的基本步骤。

7、简述样本容量与置信水平、总体方差、允许误差的关系。

8、在假设检验中第Ⅰ类错误和第Ⅱ类错误分别指什么,并说明它们发生的概率大小之间的关系。

9、分别列出小样本情形下一个总体(总体方差未知)均值的左侧、右侧及双侧检验的假设形式和拒绝域?10、简述方差分析的基本假定11、解释方差分析中总误差平方和、水平项误差平方和、误差项平方和三者含义及其关系?12、在对实际的时间序列拟合其长期趋势方程,通常可采用哪些分析方法?13、为什么平均发展速度用几何平均法计算?计算平均发展速度应注意哪些问题14、简述移动平均法的基本原理和特点。

15、简述相关分析与回归分析的区别16、在简单回归模型Yi某i中,对的假定有哪些?17、解释拉氏指数和帕氏指数。

人大《统计学》第四版复习

人大《统计学》第四版复习

人大《统计学》第四版P783.1为评价家电电行业售后服务的质量,随机抽取了由100个家庭构成的一个样本。

服务质量的等级分别表示为:A. 好;B.较好;C.一般;D.较差;E.差.调查结果如下:B EC C AD C B A ED A C B C DE C E EA DBC C A ED C BB ACDE A B D D CC B C ED B C C B CD A C B C DE C E BB EC C AD C B A EB ACDE A B D D CA DBC C A ED C BC B C ED B C C B C要求:⑴指出上面的数据属于什么类型.⑵制作一张频数分布表.⑶绘制一张条形图,反映评价等级的分布.⑷绘制评价等级的帕累托图.答:⑴属于顺序数据.⑶条形图(略).⑷帕累托图(略).3.2某行业管理局所属40个企业2002年的产品销售收入数据如下(单位:万元):152 124 129 116 100 103 92 95 127 104105 119 114 115 87 103 118 142 135 125117 108 105 110 107 137 120 136 117 10897 88 123 115 119 138 112 146 113 126要求:⑴根据上面的数据进行适当的分组,编制频数分布,并计算出累计频数和累计频率。

⑵按规定,销售收入在125万元以上的为先进企业,115万元—125万元为良好企业,105万元—115万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。

解: ⑴频数分布表如下:40个企业按产品销售收入分组表3.3某百货公司连续40天的商品销售额如下:单位:万元要求:根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。

解:频数分布表如下:直方图(略)。

4.2 随机抽取25个网络用户,得到他们的年龄数据如下:要求:(1)计算众数、中位数.(2)根据定义公式计算四分位数. (3)计算平均数和标准差.(4)计算偏态系数和峰态系数. (5)对网民年龄的分布特征进行综合分析. 解: (1)众数19、23 中位数23(2)下四分位数19 上四分位数26.5 (3)平均数nx x ∑==24 标准差S= ()12--∑n x x =6.6521(4)(5)根据以上计算结果可知,网民年龄的分布特征正偏分布,年龄主要集中在19岁左右. P110 4.5 甲乙两个企业生产三种产品的单位成本和总成本资料如下:比较哪个企业的总平均成本高,并分析其原因。

第四版统计学考试复习要点

第四版统计学考试复习要点

第四版统计学考试复习要点(总4页) -本页仅作为预览文档封面,使用时请删除本页-1.统计数据类型及其特点:①分类数据,只能归于某一类别的非数字型数据,对事物进行分类的结果,数据表现为类别,用文字来表述②顺序数据,只能归于某一有序类别的非数字型数据,对事物类别顺序的测度,数据表现为类别,用文字来表述③数值型数据,按数字尺度测量的观察值,结果表现为具体的数值,对事物的精确测度。

2.概率抽样:按一定的概率以随机原则抽取样本,每个单位被抽中的概率是已知的,或是可以计算出来的,当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率;非概率抽样:抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。

3.茎叶图类似横置的直方图,与直方图相比,茎叶图能够给出数据的分布状态,又能给出每一个原始数值,即保留了原始数据的信息。

在应用方面,直方图通常适用于大批量数据,茎叶图通常适用于小批量数据。

4.众数,不受极端值影响,具有不惟一性。

数据分布偏斜程度较大且有明显峰值时应用。

中位数,不受极端值影响。

数据分布偏斜程度较大时应用。

平均数,易受极端值影响,数学性质优良。

数据对称分布或接近对称分布时应用P955.当n趋向于正无穷大,X^2的极限分布就是正太分布;随着自由度n的增加,t分布的密度函数越来越接近于标准正太分布的密度函数。

一般n≥30时,t分布与标准正太分布就非常接近;如果随机变量X服从t(n)分布,则X^2服从F(1,n)的F分布。

6.由100个样本构造的总体参数的100个置信区间中,有95%的区间包含了总体参数的真值,则95%的这个值被称为置信水平,即95%置信区间。

7.参数估计和假设检验是统计推断的两个组成部分,它们都是利用样本对总体进行某种推断。

然而推断的角度不同。

参数估计讨论的是利用样本统计量估计总体参数的方法,总体参数μ在估计前是未知的。

而在假设检验中,则是先对μ的值提供一个假设,然后利用样本信息去检验这个假设是否成立。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第一章统计和统计数据名词解释1.统计学:收集处理分析解释数据并从数据中得出结论的科学。

2.描述统计:研究数据收集处理汇总图表描述概括与分析等统计方法。

3.推断统计:研究如何利用样本数据来推断总体特征的统计方法。

4.分类数据:只能归于某一类别的非数字型数据。

5.顺序数据:只能归于某一有序类别的非数字型数据。

6.数值型数据:按数字尺度测量的观察值。

7.总体:包含所研究的全部个体(数据)的集合。

8.样本:从总体中抽取的一部分元素的集合。

9.参数:用来描述总体特征的概括性数字度量。

10.变量:说明现象某种特征的概念。

11.分类变量:说明事物类别的一个名称。

12.顺序变量:说明事物有序类别的一个名称。

13.数值型变量:说明事物数字特征的一个名称。

14.概率抽样:随机抽样,遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。

15.非概率抽样:不随机,根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。

16.简单随机抽样:从包括总体的N个单位的抽样框中随机,一个个抽取n个单位作为样本,每单位等概论。

17.分层抽样:将抽样单位按某种特征或某种规则划分为不同的层,然后从不同层中独立、随机地抽取样本。

18.整群抽样:总体中若干单位合并为组,群,抽样时直接抽取群,然后对中选群中的所有单位全部实施调查。

19.系统抽样:总体中所有单位按顺序排列,在规定范围内随机抽取一单位作为初始单位,然后按事先规则确定其它样本单位。

20. 抽样误差:由于抽样的随机性引起的样本结果与总体真值之的误差简答题。

1.概率抽样与非概率抽样比较:性质不同,非概不依据随机原则选样本,样本统计量分布不确切,无法使用样本的结果对总体相应参数进行推断。

操作简便,时效快,成本低,专业要求不很高。

概率抽样依据随机原则抽选样本,理论分布存在,对总体有关参数可进行估计,计算估计误差,得到总体参数的置信区间。

提出精度要求。

2.数据收集方法的选择:抽样框中有关信息,目标总体特征,调查问题的内容,有形辅助物的使用,实施调查的资源,管理与控制,质量要求3.误差的控制:抽样误差是抽样随机性带来的,不可避免可以计算,改大样本量。

选择合适改进的抽样框,设计好的调查问卷,调查过程的质量控制。

第二章用图表展示数据。

名词解释1.频数:落在某一特定类别或组中的数据个数。

2.频数分布:各个类别及其相应的频数形成的分布。

3.比例:一个样本(或总体)中各个部分的数据占全部数据比值。

4.比率:一个样本(或总体)中各不同类别数据之间的比值。

5.组距:是一个组的上限与下限的差6.组距分组:是将全部变量依次划分为若干个区间,将这一区间的变量值作为一组。

7.组中值=下限值+上限值/2 上下限的中间值8.直方图:用矩形的宽度和高度(即面积)来表示频数分布的图形。

9.茎叶图:由茎和叶两部分组成的、反应原始数据分布的图形。

10.箱线图:由一组数据的最大值、最小值、中位数和两个四分位数5个特征值绘制而成的、反应原始数据分布图形。

简答题。

1.数据透视表作用:可以对数据表重要信息按使用者的习惯或分析要求进行汇总和作图,形成一个符合需要的交叉表2.数据分布表的制作步骤:确定组数,确定组距,根据分组整理成频数分布表,上组限不在内不重不漏3.直方图与条形图的差别:首先条形图是用条形的长度表示各类别频数的多少,宽度是固定的;直方图用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,高宽均有意义。

其次由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列。

最后条形图主要用于展示分类数据,直方图主要用于展示数值型数据。

4.茎叶图与直方图的区别:茎叶图既能给出数据的分布情况,又能保留原始数据的信息。

直方图通常适用于批量数据,茎叶图小批量数据。

饼图与环形图差别:环形图中空洞,样本或总体中每一部分用环中的一段表示。

饼图只能显示一个样本或总体各部分所占的比例,环形图可以同时绘制多个,有利比较研究。

5.好图形具备特征:显示数据,读者注意集中图形内容,避免歪曲,强调数据之间比较,服务明确目的,对图形统计描述与文字说明。

6.图形优劣准则:好图应当使复杂的观点简明、确切、高效阐述,最短时间内以最少的笔墨给读者提大信息,多维,表述数据真实情况。

7.制作统计表设计注意:合理安排表结构,包括表号总标题单位,上下两横线粗,中间细,必要注释、来源。

第三章用统计量描述数据。

名词解释1.众数:一组数据中出现频数最多的数值2.中位数:一组数据排序后处于中间位置上的数值。

3.四分位数:一组数据排序后处在25%和75%位置上的数值。

4.平均数:又称均值,是全部数据的算术平均值5.四分位差:75%位置上的四分位数与25%位置上的四分位数之差。

顺序数据。

6.极差:也称全距,一组数据的最大值与最小值之差。

7.方差:各数据与其平均数离差平方的平均数。

8.标准差:方差的平方根。

9.标准分数:也称标准化值或 z 分数,某个数据与其平均数的离差除以标准差后的值。

10.离散系数:一组数据的标准差与其相应的平均数之比。

11.偏态:对数据分布对称性的测度。

测度偏态的统计量偏态系数。

12.偏态系数:对数据分布不对称性的度量值。

13.峰态:对数据分布平峰或尖峰程度的测度,测度峰态的统计量则是峰态系数。

14.峰态系数:对数据分布峰态的度量值。

简答题。

1.数据分布的特征三方面:数据分布的集中趋势,离散程度,形状众数的特点:不受极端值影响,分布角度上看是具有明显集中趋势点的数值,众数可能不存在也可能有多个。

2.众数、中位数和平均数的关系:从分布角度看,众数M0是最高峰值,中位数Me是数据中间位置上值,平均数是全部数据的算术平均。

左偏X<Me<Mo。

3.众数、中位数和平均数的特点与应用场合:众数是一组数据的峰值,不受极端值影响,缺点是不唯一,在数据量较多时才有意义,数据量少时不宜,主要作分类数据的集中趋势测度值。

中位数是一组数据中间位置上的代表值,不受极端影响,数据分布偏斜程度较大时,中位数好,主要适合作顺序数据的集中趋势测度值。

平均数是对数值型数据计算的,利用了全部数据信息,应用广泛,数据呈对称或接近对称分布时3个代表值接近相等,此时选择平均数作为集中趋势代表值,其主要缺点是易受数据极端值的影响。

对于偏态分布的数据,平均数的代表性较差。

偏态程度较大数据用中位数或众数比平均好。

4.异众比率的应用场合:主要用于衡量众数对一组数据的代表程度,大,代表性差。

主要适合分类数据的离散程度。

顺序数据和数值型也可。

5.标准分数的性质:平均数为0,标准差为16.经验法则:一组数据对称分布时,约有68%的数据在平均数1个标准差范围内。

95% 99%7.切比雪夫不等式:不对称 75% 2个标准差 89% 3个 94 4个 1-1/k28.离散程度的测量值应用场合:分类数据用异众,顺序数据四分位,数值数据方差标准差,不同样本数据离散系数。

9.偏态系数的用途:0对称,>1 <-1高偏 0.5-1 -1—0.5中偏,接近0,偏度低,正值右偏。

第四章名词解释1.概率:对事件发生的可能性大小的度量值。

2.参数:对总体特征的某个概括性度量。

3.统计量:对样本特征的某个概括性度量,是样本的函数。

4.抽样分布:样本统计量的概率分布,是由样本统计量的所有可能取值形成相对频数分布。

简答题。

1.正态分布曲线的性质:(1)f(x)>=0整个概率密度曲线都在x轴上方(2)曲线相对x=μ对称,在x=μ处最大值f(μ)=1/σ(3)曲线陡缓程度由σ决定,越大,越缓;(4)x趋于无穷时,曲线以x轴为渐近线。

第五章参数估计名词解释1.参数估计:是用样本统计量去估计总体的参数。

2.估计量:用于估计总体参数的统计量的名称。

3.估计值:估计参数时计算出来的统计量的具体值。

4.点估计:用样本估计量的取值直接作为总体参数θ的估计值5.区间估计:在点估计的基础上,给出总体参数估计的一个估计区间,该区间通常由样本统计量加减估计误差组成.6.置信区间:由样本统计量构造出的总体参数在一定置信水平下的估计区间。

7.置信水平:也称为置信度或置信系数,在重复构造的总体参数的多个置信区间中包含总体参数真值的次数所占的比例。

第六章假设检验。

名词解释1.假设检验:先对总体参数提出某种假设,然后利用样本信息判断假设是否成立的过程。

2.原假设:也称零假设,是研究者想收集证据予以反对的假设,3.备择假设:也称研究假设,是研究者想收集证据予以支持的假设,简答题。

1.假设检验的步骤:1提出原假设H0和备择假设H12确定适当的检验统计量3确定显著性水平α和临界值及拒绝域4根据样本数据计算检验统计量的值P5将检验统计量值与临界值比较,作出拒绝或接受原假设的决策。

2.假设检验和参数估计有什么相同点和不同点?参数估计和假设检验是统学推断的两个组成部分,都是利用样本对总体进行某种推断,然而推断的角度不同。

参数估计讨论的是样本统计量估计总体参数的方法,总体参数μ在估计前是未知的。

而在参数假设检验中,则是先对μ的值提出一个假设,然后利用样本信息去检验这个假设是否成立。

第七章分类变量的推断。

名词解释1.χ2 拟合优度检验:利用χ2 停机梁来判断某个分类变量个类别的观察频数与某一理论频数或期望频数是否一直的检验方法。

2.列联表:有两个或两个以上分类变量交叉分类的频数分布表。

3.χ2 独立性检验:利用χ2 统计量来判断两个分类变量是否独立的检验方法。

3.φ系数:测度两个分类变量之间相关程度的统计量,主要用于2X2列联表。

4.Cramer’s V 系数:测度两个分类变量之间相关程度的统计量,可用于rXc的列联表。

5.列联系数:测度两个分类变量之间相关程度的统计量,主要用于大于2X2列联表。

简答题。

1.一致性检验和独立性检验的区别:首先,两种检验抽取样本的方法或对观察值进行测定的方法有所不同,如果在各类别中分别进行,属于拟合优度检验,如果事先未分类,抽取样本后根据研究内容分类形成列联表就是独立性检验。

其次,两者检验假设的内容有差异,似~通常假设各类别总体比例等于某个期望概率,而独立性检验中,原假设则假设两个变量之间相互独立。

最后,计算期望频数时,在拟合优度检验中利用原假设中的期望概率,用观察频数乘以期望概率,直接得到期望频数,如果独立性检验,则假设两个变量的分类是独立的,因而两个水平的联合概率是两个单独的概率的乘积。

2.简述φcV相关系数各自的特点:φ2X2列联表,0-1范围,0完全相关|φ|=1完全相关,绝对值越大,相关程度越高, φ无上限;c大于2X2列联表,相互独立时 c=0,不可能大于1,最大值依赖于列联表的行数列数,且随着R、C的增大而增大。

相关文档
最新文档