《统计学》课后答案(第二版_贾俊平版)
统计学课后答案(贾俊平版)人大出版之欧阳历创编

第三章节:数据的图表展示 (1)第四章节:数据的概括性度量 (15)第六章节:统计量及其抽样分布 (26)第七章节:参数估计 (28)第八章节:假设检验 (38)第九章节:列联分析 (41)第十章节:方差分析 (43)3.1 为评价家电行业售后服务的质量,随机抽取了由100个家庭构成的一个样本。
服务质量的等级分别表示为:A.好;B.较好;C一般;D.较差;E.差。
调查结果如下:B EC C AD C B A ED A C B C DE C E EA DBC C A ED C BB ACDE A B D D CC B C ED B C C B CD A C B C DE C E BB EC C AD C B A EB AC E E A BD D CA DBC C A ED C BC B C ED B C C B C要求:(1)指出上面的数据属于什么类型。
顺序数据(2)用Excel 制作一张频数分布表。
用数据分析——直方图制作:(3)绘制一张条形图,反映评价等级的分布。
用数据分析——直方图制作:(4)绘制评价等级的帕累托图。
逆序排序后,制作累计频数分布表:接收 频数 频率(%) 累计频率(%) C 32 32 32 B 21 21 53 D 17 17 70 E 16 16 86 A 14 14 1003.2 某行业管理局所属40个企业2002年的产品销售收入数据如下:152124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 108 9788123115119138112146113126要求:(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率。
1、确定组数:()lg 40lg() 1.60206111 6.32lg(2)lg 20.30103n K =+=+=+=,取k=6接收频率E16D 17 C 32 B 21 A142、确定组距:组距=( 最大值 - 最小值)÷组数=(152-87)÷6=10.83,取103、分组频数表(2)按规定,销售收入在125万元以上为先进企业,115~125万元为良好企业,105~115 万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。
统计学课后答案(贾俊平版)人大出版之欧阳理创编

第三章节:数据的图表展示 (1)第四章节:数据的概括性度量 (15)第六章节:统计量及其抽样分布 (26)第七章节:参数估计 (28)第八章节:假设检验 (38)第九章节:列联分析 (41)第十章节:方差分析 (43)3.1 为评价家电行业售后服务的质量,随机抽取了由100个家庭构成的一个样本。
服务质量的等级分别表示为:A.好;B.较好;C一般;D.较差;E.差。
调查结果如下:B EC C AD C B AE D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C E E A B D D C A D B C C A E D C B CBCEDBCCBC要求:(1)指出上面的数据属于什么类型。
顺序数据(2)用Excel 制作一张频数分布表。
用数据分析——直方图制作:(3)绘制一张条形图,反映评价等级的分布。
用数据分析——直方图制作: (4)绘制评价等级的帕累托图。
逆序排序后,制作累计频数分布表:接收 频数 频率(%) 累计频率(%) C 32 32 32 B 21 21 53 D 17 17 70 E 16 16 86 A 14 14 1003.2 某行业管理局所属40个企业2002年的产品销售收入数据如下:接收 频率E 16 D 17 C 32 B 21 A14152 124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 108 97 88 123 115 119 138 112 146 113 126要求:(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率。
统计学课后题答案(袁卫庞皓曾五一贾俊平)

第1章绪论5.简要说明抽样误差和非抽样误差。
答:统计调查误差可分为非抽样误差和抽样误差。
非抽样误差是由于调查过程中各环节工作失误造成的,从理论上看,这类误差是可以避免的。
抽样误差是利用样本推断总体时所产生的误差,它是不可避免的,但可以控制的。
6.一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。
因此,他们开始检查供货商的集装箱,有问题的将其退回。
最近的一个集装箱装的是2 440加仑的油漆罐。
这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。
装满的油漆罐应为4.536 kg。
要求:(1)描述总体;(2)描述研究变量;(3)描述样本;(4)描述推断。
答:(1)总体:最近的一个集装箱内的全部油漆;(2)研究变量:装满的油漆罐的质量;(3)样本:最近的一个集装箱内的50罐油漆;(4)推断:50罐油漆的质量应为4.536×50=226.8 kg。
7.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。
这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。
假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。
要求:(1)描述总体;(2)描述研究变量;(3)描述样本;(4)描述推断。
答:(1)总体:市场上的“可口可乐”与“百事可乐”(2)研究变量:更好口味的品牌名称;(3)样本:1000名消费者品尝的两个品牌(4)推断:两个品牌中哪个口味更好。
第2章统计数据的描述思考题4. 一组数据的分布特征可以从哪几个方面进行测度?答:数据分布特征一般可从集中趋势、离散程度、偏态和峰度几方面来测度。
常用的指标有均值、中位数、众数、极差、方差、标准差、离散系数、偏态系数和峰度系数。
5. 怎样理解均值在统计中的地位?答:均值是对所有数据平均后计算的一般水平的代表值,数据信息提取得最充分,具有良好的数学性质,是数据误差相互抵消后的客观事物必然性数量特征的一种反映,在统计推断中显示出优良特性,由此均值在统计中起到非常重要的基础地位。
贾俊平统计学第一章课后思考题答案

1.什么是统计学?答:统计学是关于数据的科学,它所提供的是一套有关数据收集、处理、分析、解释并从数据中得出结论的方法,统计所研究的是来自各领域的数据。
数据收集即取得统计数据;数据处理是将数据用图表等形式展示出来;数据分析则是选择适当的统计方法研究数据,并从数据中提取有用信息进而得出结论。
2.解释描述统计和推断统计。
答:数据分析所用的方法可分为描述统计方法和推断统计方法。
(1)描述统计研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法。
(2)推断统计是研究如何利用样本数据来推断总体特征的统计方法。
比如,对产品的质量进行检验,往往是破坏性的,不可能对每个产品进行测量。
这就需要抽取部分个体即样本进行测量,然后根据获得的样本数据对所研究的总体特征进行推断,这就是推断统计要解决的问题。
3.统计数据可分为哪几种类型?不同类型的数据各有什么特点?答:统计数据是对现象进行测量的结果,可以从不同角度对统计数据进行分类:(1)按照所采用的计量尺度不同,可以将统计数据分为分类数据、顺序数据和数值型数据。
①在分类数据中,各类别之间是平等的并列关系,无法区分优劣或大小,各类别之间的顺序是可以改变的;②顺序数据也表现为类别,但这些类别之间是有顺序的;③数值型数据具有分类数据和顺序数据的特点,并且还可以进行加、减、乘、除运算。
(2)按照统计数据的收集方法,可以将其分为观测数据和实验数据。
①观测数据是通过调查或观测而收集到的数据,这类数据是在没有对事物进行人为控制的条件下得到的,有关社会经济现象的统计数据几乎都是观测数据;②实验数据是在实验中通过控制实验对象收集到的数据,自然科学领域的大多数数据都是实验数据。
(3)按照被描述的现象与时间的关系,可以将统计数据分为截面数据和时间序列数据。
①截面数据是在相同或近似相同的时间点上收集的数据,这类数据通常是在不同的空间上获得的,用于描述现象在某一时刻的变化情况;②时间序列数据是在不同时间上收集到的数据,这类数据是按时间顺序收集到的,用于描述现象随时间变化的情况。
统计学(第二版袁卫_庞皓_曾五一_贾俊平)课后习题答案

第2章统计数据的描述2.1 (1)属于顺序数据。
(2)频数分布表如下:服务质量等级评价的频数分布服务质量等级家庭数(频率)频率%A 14 14B 21 21C 32 32D 18 18E 15 15合计100 100 (3)条形图(略)2.2 (1)频数分布表如下:(2)某管理局下属40个企分组表按销售收入分组(万元)企业数(个)频率(%)先进企业良好企业一般企业落后企业11119927.527.522.522.5合计40 100.0 2.3 频数分布表如下:某百货公司日商品销售额分组表按销售额分组(万元)频数(天)频率(%)25~30 30~35 35~40 40~45 45~5046159610.015.037.522.515.0合计40 100.0 直方图(略)。
2.4 (1)排序略。
(2)频数分布表如下:100只灯泡使用寿命非频数分布按使用寿命分组(小时)灯泡个数(只)频率(%)650~660 2 2660~670 5 5670~680 6 6680~690 14 14690~700 26 26700~710 18 18710~720 13 13720~730 10 10730~740 3 3740~750 3 3合计100 100 直方图(略)。
2.5 (1)属于数值型数据。
(2)分组结果如下:分组天数(天)-25~-20 6-20~-15 8-15~-10 10-10~-5 13-5~0 120~5 45~10 7合计60(3)直方图(略)。
2.6 (1)直方图(略)。
(2)自学考试人员年龄的分布为右偏。
2.7 (1(2)A 班考试成绩的分布比较集中,且平均分数较高;B 班考试成绩的分布比A 班分散,且平均成绩较A 班低。
2.82.9 (1)x =274.1(万元);Me=272.5 ;Q L =260.25;Q U =291.25。
(2)17.21=s (万元)。
2.10 (1)甲企业平均成本=19.41(元),乙企业平均成本=18.29(元);原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。
统计学课后答案第二版贾俊平版附录答案第6章 9章方差分析

7.1(1)散点图(略),产量与生产费用之间正的线性相关关系。
第6章方差分析F =4.6574 c F 0.01 =8.0215(或 P-value =0.0409 >a =0.01),不能拒绝原彳假设。
X B —Xc = 30-42.6 =12.6 A LSD =5.85 ,F =1.478 C F 0.05 =3.554131(或 P-value = 0.245946 a 。
=0.05),不能拒绝原假设。
相关与回归分析(2) r =0.920232 。
(3)检验统计量t =14.4222 >怙2 =2.2281,拒绝原假设,相关系数显著。
6.1 6.2 = 15.8234 A F 0.01= 4.579(或P-value =0.00001 Va =0.01),拒绝原假设。
6.3 = 10.0984 A F 0.01= 5.4170(或 P-value =0.000685 <a =0.01),拒绝原假设。
6.4 = 11.7557 A F 0.05= 3.6823(或 P - value =0.000849 € a =0.05),拒绝原假设。
6.5= 17.0684 AF 0.05 = 3.8853(或 P- value =0.0003 € a =0.05),拒绝原假设。
X A -X B XA -X C=44.4 - 30 = 14.4》LSD = 5.85, =44.4 - 42.6 = 1.8 V LSD = 5.85 , 拒绝原假设;不能拒绝原假设;6.6 拒绝原假设。
7.7(1)散点图(略),二者之间为负的线性相关关系。
7.5(1)散点图(略)。
(2) r =0.9489。
(3) 0=0.1181 +0.00358X 。
回归系数f? =0.00358表示运送距离每增加1公里,运送时间平均增加 0.00358天。
7.6(1)散点图(略)。
二者之间为高度的正线性相关关系。
统计学贾俊平第三章课后答案
一、思考题3.1数据的预处理包括数据审核,数据筛选,数据排序,数据透视表。
3.2分类数据整理:频数分布表(频数,比例,百分比,比率)图示方法:条形图,对比条形图,帕累托图,饼图。
顺序数据的整理:频数分布表(累计频数,累计频率)图示方法:环形图。
3.3数值型数据的分组方法是组距分组,步骤:1.确定组数:组数的确定应以能够显示数据的分布特征和规律为目的。
在实际分组时,组数一般为5≤K ≤152.确定组距:组距(Class Width)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即组距=( 最大值 - 最小值)÷ 组数3.统计出各组的频数并整理成频数分布表3.4直方图和条形图区别:1.条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的2.直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,其高度与宽度均有意义3.直方图的各矩形通常是连续排列,条形图则是分开排列4.条形图主要用于展示分类数据,直方图则主要用于展示数值型数据3.5绘制线图应该注意的问题:一般情况下,纵轴数据下端应从“0”开始,以便于比较。
数据与“0”之间的间距过大时,可以采取折断的符号将纵轴折断3.6饼图和环形图的不同:饼图只能显示一个总体各部分所占的比例,环形图则可以同时绘制多个样本或总体的数据系列,每一个样本或总体的数据系列为一个环。
3.7茎叶图与直方图相比的优点与各自的应用场合:直方图可观察一组数据的分布状况,但没有给出具体的数值;茎叶图既能给出数据的分布状况,又能给出每一个原始数值,保留了原始数据的信息。
直方图适用于大批量数据,茎叶图适用于小批量数据3.8鉴别图表优劣的准则有:3.9制作统计表时应注意的问题:二、练习题3.1为评价家电行业售后服务的质量,随机抽取了由100个家庭构成的一个样本。
服务质量的等级分别为:A.好;B.较好;C.一般;D.较差;E.差。
统计学习题答案-贾俊平
第四章统计数据的概括性度量4. 1 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下: 2 4 7 10 10 10 12 12 14 15要求:(1) 计算汽车销售量的众数、中位数和平均数。
(2) 根据定义公式计算四分位数。
(3) 计算销售量的标准差。
(4) 说明汽车销售量分布的特征。
解:汽车销售数量StatisticsNValid 10Missing0 Mean9.60Median10.00Mode10Std. Deviation4.169 Percentiles25 6.255010.007512.504. 2随机抽取25个网络用户,得到他们的年龄数据如下:单位:周岁19 15 29 25 24 23 21 38 22 18 30 20 19 19 16 23 27 22 34 24 41 20 31 17 23要求;(1) 计算众数、中位数:排序形成单变量分值的频数分布和累计频数分布:LI2.557.5 10汽车销售数量12.5 15Mean =9.6Std. Dev. =4.169N =10Histogram32网络用尸的年龄FrequencyPercent Cumulative FrequencyCumulative PercentValid15 14.0 14.016 1 4.0 2 8.0 17 1 4.0 3 12.0 18 1 4.0 4 16.0 19 3 12.0 7 28.0 20 2 8.0 9 36.0 21 1 4.0 10 40.0 22 2 8.0 12 48.0 233 12.0 15 60.0 24 2 8.0 17 68.0 25 1 4.0 18 72.0 27 1 4.0 19 76.0 29 1 4.0 20 80.0 30 1 4.0 21 84.0 31 1 4.0 22 88.0 34 1 4.0 23 92.0 38 1 4.0 24 96.0 41 1 4.0 25100.0Total25100.0从频数看出,众数 Mo 有两个:19、23;从累计频数看,中位数 Me=23。
统计学课后答案贾俊平版人大出版
第三章节:数据的图表展示…………………………………………………1 第四章节:数据的概括性度量………………………………………………15 第六章节:统计量及其抽样分布……………………………………………26 第七章节:参数估计…………………………………………………………28 第八章节:假设检验…………………………………………………………38 第九章节:列联分析…………………………………………………………41 第十章节:方差分析…………………………………………………………43 3.1 为评价家电行业售后服务的质量,随机抽取了由100个家庭构成的一个样本。
服务质量的等级分别表示为:A .好;B .较好;C 一般;D .较差;E.差。
调查结果如下: B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C E E A B D D C A D B C C A E D C B C B C E D B C C B C 要求:(1)指出上面的数据属于什么类型。
顺序数据(2)用Excel 制作一张频数分布表。
用数据分析——直方图制作:(3)绘制一张条形图,反映评价等级的分布。
用数据分析——直方图制作: (4)绘制评价等级的帕累托图。
逆序排序后,制作累计频数分布表:接收 频数 频率(%) 累计频率(%) C 32 32 32 B 21 21 53 D 17 17 70 E 16 16 86 A 14 14 1003.2 某行业管理局所属40个企业2002年的产品销售收入数据如下: 152 124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 108 97 88 123 115 119 138 112 146 113 126 要求:接收 频率E 16 D 17C 32B 21 A 14(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率。
统计学课后答案 (贾俊平版)人大出版之欧阳科创编
第三章节:数据的图表展示 (1)第四章节:数据的概括性度量 (15)第六章节:统计量及其抽样分布 (26)第七章节:参数估计 (28)第八章节:假设检验 (38)第九章节:列联分析 (41)第十章节:方差分析 (43)3.1 为评价家电行业售后服务的质量,随机抽取了由100个家庭构成的一个样本。
服务质量的等级分别表示为:A.好;B.较好;C一般;D.较差;E.差。
调查结果如下:B EC C AD C B A ED A C B C DE C E EA DBC C A ED C BB ACDE A B D D CC B C ED B C C B CD A C B C DE C E BB EC C AD C B A EB AC E E A BD D CA DBC C A ED C BC B C ED B C C B C要求:(1)指出上面的数据属于什么类型。
顺序数据(2)用Excel制作一张频数分布表。
用数据分析——直方图制作:(3)绘制一张条形图,反映评价等级的分布。
用数据分析——直方图制作:(4)绘制评价等级的帕累托图。
逆序排序后,制作累计频数分布表:接收 频数 频率(%) 累计频率(%) C 32 32 32 B 21 21 53 D 17 17 70 E 16 16 86 A14141003.2 某行业管理局所属40个企业的产品销售收入数据如下:152 124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 108 9788123115119138112146113126要求:(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率。
1、确定组数:()lg 40lg() 1.60206111 6.32lg(2)lg 20.30103n K =+=+=+=,取k=62、确定组距:组距=( 最大值 最小值)÷ 组数=(15287)÷6=10.83,取103、分组频数表接收频率E 16 D 17 C 32 B 21 A14(2)按规定,销售收入在125万元以上为先进企业,115~125万元为良好企业,105~115 万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第1章统计与统计数据一、学习指导统计学是处理和分析数据的方法和技术,它几乎被应用到所有的学科检验领域。
本章首先介绍统计学的含义和应用领域,然后介绍统计数据的类型及其来源,最后介绍统计中常用的一些基本概念。
本章各节的主要内容和学习要点如下表所示。
二、主要术语1. 统计学:收集、处理、分析、解释数据并从数据中得出结论的科学。
2. 描述统计:研究数据收集、处理和描述的统计学分支。
3. 推断统计:研究如何利用样本数据来推断总体特征的统计学分支。
4. 分类数据:只能归于某一类别的非数字型数据。
5. 顺序数据:只能归于某一有序类别的非数字型数据。
6. 数值型数据:按数字尺度测量的观察值。
7. 观测数据:通过调查或观测而收集到的数据。
8. 实验数据:在实验中控制实验对象而收集到的数据。
9. 截面数据:在相同或近似相同的时间点上收集的数据。
10. 时间序列数据:在不同时间上收集到的数据。
11. 抽样调查:从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的数据收集方法。
12. 普查:为特定目的而专门组织的全面调查。
13. 总体:包含所研究的全部个体(数据)的集合。
14. 样本:从总体中抽取的一部分元素的集合。
15. 样本容量:也称样本量,是构成样本的元素数目。
16. 参数:用来描述总体特征的概括性数字度量。
17. 统计量:用来描述样本特征的概括性数字度量。
18. 变量:说明现象某种特征的概念。
19. 分类变量:说明事物类别的一个名称。
20. 顺序变量:说明事物有序类别的一个名称。
21. 数值型变量:说明事物数字特征的一个名称。
22. 离散型变量:只能取可数值的变量。
23. 连续型变量:可以在一个或多个区间中取任何值的变量。
第2章数据的图表展示一、学习指导数据的图表展示是应用统计的基本技能。
本章首先介绍数据的预处理方法,然后介绍不同类型数据的整理与图示方法,最后介绍图表的合理使用问题。
本章各节的主要内容和学习二、主要术语24. 频数:落在某一特定类别(或组)中的数据个数。
25. 频数分布:数据在各类别(或组)中的分配。
26. 比例:一个样本(或总体)中各个部分的数据与全部数据之比。
27. 比率:样本(或总体)中各不同类别数值之间的比值。
28. 累积频数:将各有序类别或组的频数逐级累加起来得到的频数。
29. 数据分组:根据统计研究的需要,将原始数据按照某种标准划分成不同的组别。
30. 组距分组:将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组。
31. 组距:一个组的上限与下限的差。
32. 组中值:每一组的下限和上限之间的中点值,即组中值=(下限值+上限值)/2。
33. 直方图:用矩形的宽度和高度(即面积)来表示频数分布的图形。
34. 茎叶图:由“茎”和“叶”两部分组成的、反应原始数据分布的图形。
35. 箱线图:由一组数据的最大值、最小值、中位数和两个四分位数5个特征值绘制而成的、反应原始数据分布的图形。
第3章数据的概括性度量一、学习指导数据分布的特征可以从三个方面进行描述:一是分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度;二是分布的离散程度,反映各数据远离其中心值的趋势;三是分布的形状,反映数据分布偏斜程度和峰度。
本章将从数据的不同类型出发,分别介绍集中趋势测度值的计算方法、特点及其应用场合。
本章各节的主要内容和学习要点如下表所示。
二、主要术语和公式(一)主要术语M表示。
1. 众数:一组数据中出现频数最多的变量值,用oM表示。
2. 中位数:一组数据排序后处于中间位置上的变量值,用e3. 四分位数:一组数据排序后处于25%和75%位置上的值。
4. 平均数:一组数据相加后除以数据的个数而得到的结果。
G表示。
5. 几何平均数:n个变量值乘积的n次方根,用m6. 异众比率:非众数组的频数占总频数的比率。
7. 四分位差:也称为内距或四分间距,上四分位数与下四分位数之差。
8. 极差:也称全距,一组数据的最大值与最小值之差。
9. 平均差:也称平均绝对离差,各变量值与其平均数离差绝对值的平均数。
10. 方差:各变量值与其平均数离差平方的平均数。
11. 标准差:方差的平方根。
12. 标准分数:变量值与其平均数的离差除以标准差后的值。
13. 离散系数:也称为变异系数,一组数据的标准差与其相应的平均数之比。
14. 偏态:数据分布的不对称性。
15. 偏态系数:对数据分布不对称性的度量值。
16. 峰态:数据分布的平峰或尖峰程度。
17. 峰态系数:对数据分布峰态的度量值。
(二)主要公式第4章抽样与参数估计一、学习指导参数估计是推断统计的重要内容之一,它是在抽样及抽样分布的基础上,根据样本统计量来推断我们所关心的总体参数。
本章首先介绍抽样分布的有关知识,然后讨论参数估计的一般问题,最后介绍一个总体参数估计的基本方法和参数估计中样本容量的确定问题。
本章各节的主要内容和学习要点如下表所示。
二、主要术语和公式(一)主要术语36. 简单随机抽样:也称纯随机抽样,它是从含有N个元素的总体中,抽取n个元素作为样本,使得总体中的每一个元素都有相同的机会(概率)被抽中。
37. 简单随机样本:从含有N个元素的总体中,抽取n个元素作为样本,使得总体中每一个样本量为n的样本都有相同的机会(概率)被抽中。
38. 重复抽样:从总体中抽取一个元素后,把这个元素放回到总体中再抽取第二个元素,直至抽取n个元素为止。
39. 不重复抽样:一个元素被抽中后不再放回总体,而是从所剩元素中抽取第二个元素,直到抽取n个元素为止。
40. 分层抽样:也称分类抽样,它是在抽样之前先将总体的元素划分为若干层(类),然后从各个层中抽取一定数量的元素组成一个样本。
41. 系统抽样:也称等距抽样或机械抽样,它是先将总体中的各元素按某种顺序排列,并按某种规则确定一个随机起点;然后,每隔一定的间隔抽取一个元素,直至抽取n个元素形成一个样本。
42. 整群抽样:先将总体划分成若干群,然后以群作为抽样单位从中抽取部分群,随后再对抽中的各个群中所包含的所有元素进行观察。
43. 抽样分布:在重复选取样本量为n的样本时,由样本统计量的所有可能取值形成的相对频数分布。
44. 样本均值的抽样分布:在重复选取样本量为n的样本时,由样本均值的所有可能取值形成的相对频数分布。
45. 样本比例抽样分布:在重复选取样本量为n的样本时,由样本比例的所有可能取值形成的相对频数分布。
46. 标准误差:也称为标准误,它是样本统计量的抽样分布的标准差。
47. 估计标准误差:若计算标准误时所涉及的总体参数未知,可用样本统计量代替计算的标准误。
48. 估计量:用来估计总体参数的统计量的名称,用符号θˆ表示。
49. 估计值:用来估计总体参数时计算出来的估计量的具体数值。
50. 点估计:用样本统计量θˆ的某个取值直接作为总体参数θ的估计值。
51. 区间估计:在点估计的基础上,给出总体参数估计的一个范围。
52. 置信区间:由样本统计量所构造的总体参数的估计区间。
53. 置信水平:也称为置信系数,它是将构造置信区间的步骤重复多次后,置信区间中包含总体参数真值的次数所占的比率。
(二)主要公式第5章假设检验一、学习指导假设检验是推断统计的另一项重要内容,它是利用样本信息判断假设是否成立的一种统计方法。
本章首先介绍有关假设检验的一些基本问题,然后介绍一个总体参数的检验方法。
本章各节的主要内容和学习要点如下表所。
二、主要术语和公式(一)主要术语18. 假设:对总体参数的具体数值所做的陈述。
19. 假设检验:先对总体参数提出某种假设,然后利用样本信息判断假设是否成立的过程。
20. 备择假设:也称研究假设,是研究者想收集证据予以支持的假设,用1H 或a H 表示。
21. 原假设:也称零假设,是研究者想收集证据予以反对的假设,用0H 表示。
22. 单侧检验:也称单尾检验,是指备择假设具有特定的方向性,并含有符号“>”或“<”的假设检验。
23. 双侧检验:也称双尾检验,是指备择假设没有特定的方向性,并含有符号“≠”的假设检验。
24. 第Ⅰ类错误:当原假设为正确时拒绝原假设,犯第Ⅰ类错误的概率记为α。
25. 第Ⅱ类错误:当原假设为错误时没有拒绝原假设,犯第Ⅱ类错误的概率通常记为β。
26. 显著性水平:假设检验中发生第Ⅰ类错误的概率,记为α。
27. 检验统计量:根据样本观测结果计算得到的,并据以对原假设和备择假设做出决策的某个样本统计量。
28. 拒绝域:能够拒绝原假设的检验统计量的所有可能取值的集合。
29. 临界值:根据给定的显著性水平确定的拒绝域的边界值。
30. P 值:也称观察到的显著性水平,如果原假设0H 是正确的,那么所得的样本结果出现实际观测结果那么极端的概率。
(二)主要公式第6章方差分析一、学习指导本章主要介绍检验多个总体均值是否相等的一种统计方法,即方差分析。
它是通过对各观察数据误差来源的分析来判断多个总体均值是否相等。
本章首先介绍方差分析中的一些基本问题,包括方差分析中的一些术语、方差分析的基本思想和基本假设,然后介绍单因素方差分析方法,最后介绍方差分析中的多重比较。
本章各节的主要内容和学习要点如下表所示。
二、主要术语和公式(一)主要术语31. 方差分析( ANOVA):检验多个总体均值是否相等的统计方法。
32. 因素:也称因子,是方差分析中所要检验的对象。
33. 水平:也称处理,是因素的不同表现。
34. 组内误差:来自水平内部的数据误差。
35. 组间误差:来自不同水平之间的数据误差。
36. 总平方和:反映全部数据误差大小的平方和,记为SST。
37. 组内平方和:反映组内误差大小的平方和,记为SSE。
38. 组间平方和:反映组间误差大小的平方和,记为SSA。
39. 单因素方差分析:只涉及一个分类型自变量的方差分析。
40. 组内方差:组内平方和除以相应的自由度。
41. 组间方差:组间平方和除以相应的自由度。
(二)主要公式第7章相关与回归分析一、学习指导相关与回归是研究变量之间关系的统计方法,该方法广泛应用于自然科学和社会科学的各个领域。
本章首先介绍相关分析方法,然后介绍一元线性回归和多元线性回归分析方法。
本章各节的主要内容和学习要点如下表所示。
二、主要术语和公式(一)主要术语42. 相关关系:变量之间存在的不确定的数量关系。
43. 相关系数:也称Pearson 相关系数,是根据样本数据计算的度量两个变量之间线性关系强度的统计量。
44. 因变量:被预测或被解释的变量,用y 表示。
45. 自变量:用来预测或用来解释因变量的一个或多个变量,用x 表示。
46. 回归模型:描述因变量y 如何依赖于自变量x 和误差项ε的方程。
47. 回归方程:描述因变量y 的期望值如何依赖于自变量x 的方程。