应用统计学期末复习
应用统计期末试题及答案

应用统计期末试题及答案一、选择题1.以下哪个不属于统计学的基本特征?A.数据的整理B.数据的分析C.数据的收集D.数据的存储答案:D2.统计学最基本的分支是:A.计量经济学B.经济数学C.运筹学D.数理统计学答案:D3.以下哪个不是统计推断的主要内容?A.假设检验B.抽样调查C.回归分析D.方差分析答案:C4.在进行推断统计时,样本大小的影响是:A.样本越大,结果越可靠B.样本越小,结果越可靠C.样本大小对结果没有影响D.样本大小不确定是否影响结果答案:A5.在统计学实证研究中,显著性水平通常设定为:A.0.01B.0.05C.0.10D.根据具体研究而定答案:B二、填空题1. 样本标准差的计算公式为______。
答案:s=√(Σ(Xi-X)²/(n-1))2. 定量数据常用的测度是______。
答案:均值3. 相对频数是指某一现象发生的______。
答案:次数与总次数的比值4. 抽样的目的是为了_________。
答案:对总体进行估计和推断5. 当P值小于显著性水平时,我们应该_________。
答案:拒绝原假设三、计算题某电商平台想要评估新推出的促销活动对销售额的影响,随机抽取了100个订单,并记录了促销前后的销售额。
其中,促销前的均值为120元,标准差为30元;促销后的均值为150元,标准差为40元。
已知总体分布近似满足正态分布。
1.请判断这次促销活动是否真正对销售额有显著的影响?答:首先,我们可以进行两个样本均值的差异检验。
设定原假设H0为促销前后销售额均值无显著差异,备择假设H1为促销后销售额均值较促销前有显著提高。
计算检验统计量:t = (x1 - x2) / √(s1²/n1 + s2²/n2)= (150 - 120) / √((30²/100 + 40²/100))查表或使用统计软件可得t值,自由度为(n1 + n2 - 2) = 198。
应用统计学期末复习重点

应用统计学期末复习重点(按题型整理)一、填空题(10分)1.统计学的三种含义:统计工作;统计数据或统计信息;统计学2.统计学的研究对象是群体现象3.根据统计方法的构成不同,可将统计学分为描述统计学和推断统计学,根据统计方法研究和应用的侧重不同,可将统计学分为理论统计学和应用统计学.4.统计研究的基本方法:大量观察法,实验设计法,统计描述法和统计推断法5.标志是说明总体单位特征的,而指标是说明总体特征的,6.标志按其性质不同分为数量标志和品质标志两种。
按其变异情况可以分为不变标志和可变标志,可变标志称为变量。
7.统计总体具有三个基本特征,即同质性、大量性和变异性.8.统计指标按其作用可分为总量指标、相对指标、平均指标,按所反映总体的内容不同,可以分为数量指标和质量指标.9.总量指标指在一定时间、地点条件下说明现象总体的规模和水平的指标,其表现形式为绝对数。
10.总量指标按其反映时间状况不同,可以分为时点指标和时期指标,按指标数值采用的计量单位不同可以分为实物指标,价值指标,劳动量指标。
总量指标按其说明总体内容不同,可分为总体标志总量和总体单位总量11.平均指标说明分配数列中各变量值分布的集中趋势,变异指标说明各变量值分布的离中趋势12.计量尺度的类型有定类尺度,定序尺度,定距尺度,定比尺度,根据四种计量尺度计量结果,可将统计数据分为三种类型:名义级数据,顺序级数据,刻度级数据。
13.对名义级数据通常是计算众数,对顺序级数据,通常可以计算众数、中位数;对刻度级数据,同样可以计算众数和中位数,还可以计算平均数.14.全面调查方式有统计报表制度,普查;非全面调查有重点调查、典型调查、抽样调查。
15.常用的抽样调查组织形式有简单随机抽样,类型随机抽样,机械随机抽样,整群随机抽样,阶段随机抽样.16.统计分组的关键在于正确选择分组标志和合理划分各组界限17.按分组标志的多少,统计分组可以分为简单分组和复合分组;按分组标志性质不同,统计分组可以分为品质分组和数量分组;按分组作用和任务不同,有类型分组、结构分组和分析分组。
应用统计学期末复习试卷8套含答案大学期末复习资料

E.样本指标是样本变量的函数
9.销售额与流通费用率,在一定条件下,存在相关关系,这种相关关系属于()。
A.正相关B.单相关
C.负相关D.复相关
E.完全相关
10.职工平均工资上调8%,职工人数减少了10%,则()。
A.平均工资指数为108%B.职工人数指数为90%
6.任何两个总体比较其平均数的代表性时,都可以采用标准差指标。
7.所谓序时平均数就是将同一总体的不同时期的平均数按时间顺序排列起来。
8.全面调查包括普查和统计报表。
9.某地区某年人均工资7500元,这是个相对指标。
10.若逐期增长量每年相等,则其各年的环比发展速度是年年下降的。
四.计算题(20%,每小题10分)
E.平均增长速度
7.某企业产品总成本报告期为183150元,比基期增长10%,单位成本综合指数为104%,则(ABC)。
A.总成本指数为110%
B.产量增长了%
C.基期总成本为166 500元
D.单位成本上升使总成本增加了7 044元
E.产量增产使总成本增加了9 606元
8.简单随机抽取调查单位时其方法有(ABE)。
2.某地区粮食生产资料如表5-21所示。
表5-21某地区粮食生产资料
耕地每公顷生产量分组(千克)
耕地面积(万公顷)
5 250以下
5 250~6 000
6 000~6 375
6 375~6 750
6 750~7 050
7 050~7 500
3.将某地区40个工业企业按产值多少分组而编制的变量数列中,变量值是(D)。
A.产值B.工厂数
C.各组的产值数D.各组的工厂数
应用统计学公式复习

应用统计学公式复习统计学是一门研究收集、分析、解释和组织数据的学科。
它在多个领域中都有广泛的应用,包括科学研究、经济学、金融学、医学、社会学等。
要掌握应用统计学公式,需要对一些重要的统计学概念和相关公式进行复习。
一、基本统计学概念:1.总体:指所研究的全部个体或物件的集合。
2.样本:从总体中抽取的一部分个体或物件的集合。
3.参数:用于描述总体的数值概括。
4.统计量:用于描述样本的数值概括。
5.样本容量:指样本的大小,一般用n表示。
6.形状参数:用于描述总体形状的参数,如均值、方差等。
二、描述统计学公式:1.平均数:总体平均数:μ=(ΣX)/N样本平均数:x̄=(ΣX)/n2.中位数:中位数是将数据从小到大排列后,位于中间位置的数值。
3.众数:众数是指数据中出现次数最多的数值。
4.极差:极差是指数据中最大值与最小值之间的差值。
5.方差:总体方差:σ²=[(Σ(X-μ)²)/N]样本方差:s²=[(Σ(X-x̄)²)/(n-1)]6.标准差:总体标准差:σ=√(σ²)样本标准差:s=√(s²)7.百分位数:百分位数是指将数据按大小排序后,一些百分比所在位置对应的数值。
8.四分位数:四分位数是指将数据按大小排序后,将其分为四等分所得到的三个数值。
第一四分位数,又称为下四分位数,它将所有数据分为四等分后,得到的数据中的第一个中位数;第二四分位数,即中位数;第三四分位数,又称为上四分位数,它将所有数据分为四等分后,得到的数据中的第三个中位数。
三、概率统计学公式:1.离散型随机变量期望值:E(X)=ΣX*P(X)2.离散型随机变量方差:Var(X) = Σ[(X - E(X))² * P(X)]3.连续型随机变量期望值:E(X) = ∫[x * f(x)]dx4.连续型随机变量方差:Var(X) = ∫[(x - E(X))² * f(x)]dx5.二项分布概率:P(X=k)=C(n,k)*p^k*(1-p)^(n-k)其中,n为试验次数,k为成功次数,p为每次试验成功的概率。
统计学复习题解答

《应用统计学》期末复习解答一、单选题1.统计总体的同质性是指( A )A.总体各单位具有某一共同的品质标志或数量标志B.总体各单位具有某一共同的品质标志属性或数量标志值C.总体各单位具有若干互不相同的品质标志或数量标志D.总体各单位具有若干互不相同的品质标志属性或数量标志值2.按某一标志分组的结果,表现出( A )A.组内同质性和组间差异性B.组内差异性和组间差异性C.组内同质性和组间同质性D.组内差异性和组间同质性3.设某地区有800家独立核算的工业企业,要研究这些企业的产品生产情况,总体是( D )A.全部工业企业B.800家工业企业C.每一件产品D.800家工业企业的全部工业产品4.统计调查的基本任务是取得原始统计资料,所谓原始统计资料是(C)A.统计部门掌握的资料B.对历史统计资料进行整理后取得的资料C.直接向调查单位进行登记取得的资料D.统计年鉴或统计公报上发布的资料5.已知两个同类企业的职工平均工资的标准差分别为10元和6元,而平均工资分别为3000元、3500元,则两个企业的工资离散程度为( A )A.甲大于乙B.乙大于甲C.两者相等D.无法判断6.一个连续性生产的工厂,为检验产品的质量,在一天中每隔1小时取5分钟的产品做检验,这种抽样方法属于( C )A.简单随机抽样B.整群抽样C.系统抽样D.分层抽样7.进行统计分组的关键是(B)A.划分各组组限B.正确选择分组标志C.确定各组组距D.计算各组组中值8.对一批进口商品的质量进行假设检验,在显著性水平为0.01时,原假设被拒绝;如果使用0.05的显著性水平,则原假设( A)A.一定会被拒绝B.可能会被拒绝C.一定会被接受D.必须重新假设检验 9.下列分组中按品质标志分组的是(B )A.人口按年龄分组B.产品按质量优劣分组C.企业按固定资产原值分组D.乡镇按工业产值分组 10.当一组数据属于右偏分布时,则(B ) A.平均数、中位数与众数是合而为一的 B.众数在左边,平均数在右边C.众数的数值较小,平均数的数值较大D.众数在右边,平均数在左边11.下列关于相关系数的陈述中哪一个是错误的( A ) A.数值越大说明两个变量之间的关系就越强B.仅仅是两个变量之间线性关系的一个度量,不能用于描述非线性关系C.只是两个变量之间线性关系的一个度量,不一定意味两个变量之间存在因果关系D.绝对值不会大于112.如果报告期商品价格计划降低5%,销售额计划增加10%,则销售量应增加( D ) A.15% B.5% C.5.25% D.15.79% 13.某橡胶厂生产汽车轮胎,根据历史资料统计结果,平均里程为25000公里,标准差为1900公里。
应用统计学总复习

Sk <0
峰度系数(coefficient of kurtosis) Ku: 某一数据分布与正态分布相比的尖峰程度或平坦程度
1 m4 N
xi x
i 1
N
4
Ku
4
m4
3
Ku = 0
Ku > 0 Ku < 0
正态分布
尖峰 扁平
第四章
相关分析与回归分析初步
( xi x )( yi y )
1n 3. 均值 (Mean): x xi n i 1
比较:均值、中位数、众数
mean 利用数据全部信息 具有唯一性 比较稳定 容易受极端值影响 median 利用中间位置数据信息 具有唯一性 比较稳定 对极端值不敏感 mode 是一组数据分布的峰值 不具有唯一性 最不稳定 不受极端值影响
间是否存在线性关系
H 0 : 1 2 k 0
当 Significance F < 0.05时, F检验通过。
(2) t –检验
Xj 在解释 Y 时是否是一个有用的变量?
H 0 : j 0, H1 : j 0
当P-value < 0.05时, t检验通过
例题: 某商业银行25家分行2002年的主要业务数据
分行 编号 不良贷款 (亿元) 各项贷款余额 (亿元) 本年累计应收贷款 (亿元) 贷款项目个数 (个) 本年固定资产投资额 (亿元)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
0.9 1.1 4.8 3.2 7.8 2.7 1.6 12.5 1.0 2.6 0.3 4.0 0.8 3.5 10.2 3.0 0.2 0.4 1.0 6.8 11.6 1.6 1.2 7.2 3.2
统计学期末复习分析

统计学期末复习分析第⼀章1.应⽤统计设计是应⽤统计调查潜的的准备⼯作。
(对)2.应⽤统计应该遵守的原则有(ABCD )A 真实性B准确性C时效性D经济性E实践性3.调查对象——符合调查⽬的的、若⼲具有相同性质的调查单位组成的集合。
4.调查单位——统计调查登记的项⽬和标志资料的承担者5.填报单位——负责向调查机关报送调查资料的单位。
6.调查单位与填报单位可以是同⼀单位,也可以是不同单位。
(对)7.应⽤统计调查的要求(ABCD) A 准确性B及时性C 系统性D 全⾯性E条件性8.⾮抽样调查包括(ABCD)A普查B重点调查C 典型调查 D 固定样本调查 E 分类调查9.典型调查和重点调查是属于抽样调查(错)10.典型调查和重点调查的结果可以⽤于推断总体(错)11.调查时间包括两层意思,⼀是调查⼯作进⾏的时间,⼆是调查的事件所发⽣的时间。
12.总体——统计对象的全体13.总体单位——组成总体的个体14.样本——在总体中被抽取的部分总体单位15.样本单位——组成样本的个体16.样本框——可以选择作为样本的总体单位列出的名册或排序编号。
17.样本容量——样本所包含的样本单位数。
18.抽样⽐——样本单位数与总体单位数之⽐19.样本框可能与总体⼀致,也可能与总体不⼀致。
(对)20抽样调查和⾮抽样调查都是在总体中抽取⼀部分来进⾏调查。
(错)21.⾮随机抽样调查选择调查样本调查者带有(A ).A较强的主观性B 较强的客观性 C 较强的灵活性D⾃由性22.⾮抽样调查适⽤于(A)A 探索性研究B前沿性研究 C 事后研究 D 事前研究23.⾮随机抽样调查(C)A、可以确定抽样误差 B 可以⽤数理⽅法估计误差 C ⽆法确定抽样误差D 能定量地推断总体24.任意抽样是(B)A随机抽样B⾮随机抽样 C 典型抽样D 全⾯抽样25.判断抽样是(C)A随机抽样B典型抽样C⾮随机抽样D 全⾯抽样26.配额抽样与分层抽样()A 相同B 都是随机抽样C 是不同的抽样D 是不同的类型27.随机抽样调查的结果()A可以⽤于推断总体 B 不可⽤于推断总体 C 可随意确定样本D 不可随意确定样本28.随机抽样对总体中每个单位被抽取的概率(A)A相等B不相等 C 较⼤ D 较⼩29.纯随机抽样与任意抽样(B )A相同B不同C 整体抽样D 部分抽样30.分层抽样层与层之间的差异(A) A ⼤B⼩ C 不定 D 平均31.分层抽样层的内部差异(B ) A ⼤B⼩ C 不定 D 平均32.整群抽样,群与群之间的差异(B) A ⼤B⼩ C 不定 D 平均33.整群抽样,群的内部差异(A) A ⼤B⼩ C 不定 D 平均34.多阶段抽样就是分层抽样(错)35.登记性误差和系统性误差是(A )A可以避免的B 不可避免的C ⼈为的 D 是故意的36.随机性误差是(B)A可以避免的B 不可避免的C⼈为的 D 是故意的37.随机性误差(A)A可以控制B 不可控制C 可以忽略 D 不可忽略38.重复抽样调查某班的平均成绩,要求误差不超过±5分,已知总体标准差为4,,问要调查对数个样本单位才能满⾜要求?第⼆章统计整理1.什么是统计整理?2.对⼆⼿资料进⾏再加⼯不是统计整理。
统计学各章节期末复习知识点

统计学各章节期末复习知识点统计学是一门研究数据收集、分析和解释的学科。
作为一门广泛应用于各个领域的学科,统计学的知识点非常丰富。
以下是统计学各章节的期末复习知识点汇总:1.数据收集与描述-数据类型:定量数据和定性数据-数据收集方式:问卷调查、观察、实验-描述统计:中心趋势(均值、中位数、众数)、离散程度(范围、方差、标准差)、数据分布(直方图、条形图、饼图)2.概率论基础-随机试验与样本空间-事件与事件概率-古典概型、几何概型和统计概型-条件概率与独立性-伯努利试验与二项分布3.随机变量及其分布-随机变量与分布函数-离散型随机变量与其分布律-连续型随机变量与其概率密度函数-均匀分布、正态分布、指数分布等常见分布4.多个随机变量的分布-边缘分布与条件分布-两个离散型随机变量的联合分布律-两个连续型随机变量的联合概率密度函数-相互独立的随机变量的分布5.随机变量的数字特征-数学期望与其性质-方差与标准差-协方差与相关系数-矩、协方差矩阵与相关系数矩阵6.大数定律与中心极限定理-辛钦大数定律-中心极限定理-切比雪夫不等式与伯努利不等式7.统计推断基础-参数估计:点估计、区间估计-置信区间与置信水平-假设检验:原假设与备择假设、显著性水平、拒绝域-类型Ⅰ错误和类型Ⅱ错误-样本容量与统计检验的效应大小8.单样本与双样本推断-单个总体均值的推断:正态总体与非正态总体-单个总体比例的推断-两个总体均值的推断:独立样本与配对样本-两个总体比例的推断9.方差分析与回归分析-单因素方差分析-两因素方差分析-简单线性回归分析:最小二乘法-多元线性回归分析:拟合优度、剩余平方和、变量选择10.非参数统计方法-指标:秩和检验、秩和相关检验、符号检验- 分布:符号检验、秩和检验、秩和相关检验、Kolmogorov-Smirnov检验这些是统计学各个章节的期末复习知识点的一个概述。
每个章节都拥有更加详细和复杂的内容,需要学生在复习中深入理解并进行练习。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
应用统计学期末复习第一章总论1.统计学是一门关于客观现象数据的搜集、整理、归纳、分析的方法论学科,其目的是探索数据的内在数量规律性,以达到对客观事物的科学认识。
2.统计的研究对象是具有某种相同属性的群体现象,并探索群体现象数量表现的内在规律性。
3.特点:总体性、数量性、规律性。
4.分类:按统计方法的构成分为描述统计学和推断统计学,按统计方法研究和应用的侧重分为理论统计学和应用统计学。
5.统计总体是指根据一定的目的要求所确定的研究事物的全体。
总体单位是构成统计总体的个别事物。
6.统计标志:总体各单位所具有的属性或特征。
标志表现:总体单位各标志的具体体现。
标志的分类:按性质分为品质标志和数量标志,按变异情况分为不变标志和可变标志。
7.变量:可变的数量标志。
变量值:变量的具体表现。
分类:按变量值是否具有连续性分为连续变量和离散变量,按性质分为确定性变量和随机变量。
8.统计指标:反映统计总体数量特征的概念和数值。
统计指标六要素:指标名称、计量单位、计量方法、时间状态、空间范围、指标具体壹数值。
统计指标特征:数量性、综合性、具体性。
9.统计指标与标志的区别:统计指标说明的是总体数量特征,而标志是说明总体单位特征的名称;指标都可用数值表示,而标志有不能用数值表示的品质标志和能用数值表示的数量标志。
10.统计指标分类(第21页):按反映总体的内容分为数量指标和质量指标,按作用分为总量指标、相对指标和平均指标。
11.总量指标分类:按反映的内容分为总体单位总量和总体标志总量,按反映的时间状况分为时期指标和时点指标,按指标数值采用的计量单位分为实物指标、价值指标和劳动量指标。
12.相对指标(相对数)的表现形式分为无名数(系数、倍数、百分数)和复名数(人口密度)。
13.相对指标的种类:(第23页)计划完成程度指标(%)=已完成数×100%全期计划数结构相对指标(%)=总体部分数值×100%总体全部数值比例相对指标=甲地区(单位或企业)某类指标数值乙地区(单位或企业)同类指标数量比例相对指标=总体中某一部分数值总体中另一部分数值动态相对指标动态相对数(%)=报告期水平×100%基期水平强度相对指标=某一总量指标另一有联系而性质不同的总量指标贰第二章统计数据的搜集1.数据的计量方法:定类尺度、定序尺度、定距尺度、定比尺度。
2.数据的分类:按计量层次分为名义级数据、顺序级数据和刻度级数据;按收集方法分为观测数据和实验数据;按时间状况分为截面数据和时序数据。
3.统计数据的来源:直接来源(原始数据)、间接来源(二手数据)。
4.统计调查是根据统计研究预定的目的、要求和任务,运用科学的调查方法,有组织、有计划地向客观实际搜集资料的过程。
5.统计调查方案应包括:确定调查目的、确定调查对象和调查单位。
调查对象是指调查研究总体或调查范围。
调查单位是构成调查对象的每一个具体单位。
报告单位(填报单位)指负责回答或提交调查资料的单位。
6.统计调查方式统计报表普查:一次性或周期性、需要规定统一的标准调查时间、数据比较准确、适用范围较窄。
重点调查:在调查对象的全部单位中,只选择少数重点单位进行非全面调查。
典型调查:初步分析全部研究对象,选择一个或几个具有代表性的单位进行详细深入的调查。
抽样调查特点:客观性、经济性、时效性、适用性、准确性。
7.抽样调查组织形式:叁简单随机抽样类型随机抽样(分层抽样)机械随机抽样(等距抽样、系统抽样):它是将总体单位按某一标志排队,计算出抽样间隔,并在第一个抽样间隔内随机确定一个抽样起点,再按固定的顺序和间隔来抽取样本单位。
整群随机抽样:它是先将总体中各个个体, 按照某一标志分为若干群,然后以群为单位,按随机原则从中抽取一部分群体,抽中群体的所有个体构成样本。
阶段随机抽样(分级抽样):如两阶段抽样是先将总体划分为R组,从R组中随机抽取r组,再从r组中分别随机抽取mi(i=1,2,⋯,r)个个体,构成样本。
8.统计误差:调查性误差有技术性误差、登记性误差、责任性误差;代表性误差是指抽样调查而言,因抽样方式不当或存在随机性误差。
肆第三章统计数据的整理1.统计数据整理的程序:审核和订正原始资料;分组和汇总;编制各种统计图表;积累和保管统计数据。
2.统计分组的种类:按分组标志的多少分为简单分组和复合分组;按分组标志的性质不同分为品质分组和数量分组;按分组的作用和任务不同分为类型分组、结构分组和分析分组。
3.单项式变量数列:每个组只有一个变量值的变量数列;组距式变量数列:将变量的取值范围划分为若干个区间,以一个变动区间为一个组的变量数列。
4.数据分组步骤:排序,求全距(极差=最大值-最小值)确定变量的数据形式确定组数(四舍五入)确定各组组距根据分组整理成频数分布表5.累计频数(频率)分布图分为向上累计和向下累计。
6.统计表的结构:从表的形式上看有总标题、横行标题、纵栏标题和指标数值;从表的内容上看有主词栏和宾词栏。
7.注意:分组时一般为左闭右开。
伍第四章统计数据特征的描述1.平均指标:计算均值包括算术平均数、调和平均数、几何平均数;位置均值包括中位数(Me)、众数(Mo)。
2.分位数是指按顺序排列的一组数据被划分为若干相等的部分的分割点的数值。
3.离中趋势的描述:极差(R),方差(σ2),标准差(σ)。
4.是非标志在总体标志间以是非两种形式出现,非此即彼。
总体中具有某种属性的单位数占全部单位数的比率称为成数(p)。
p+q=1 5.相对离中趋势:相对变异指标包括极差系数和标准差系数。
极差系数:V R=Rx̅×100%;标准差系数:Vσ=σx̅×100%。
6.偏态系数SK=3(算术平均数−中位数)标准差=3(x̅−Me)σ或SK=算术平均数−众数标准差=x̅−Moσ偏斜的方向:当x̅>Me时,偏态系数为正值,是一种右偏的分布;当x̅<Me时,偏态系数为负值,是一种左偏的分布。
7.峰度系数(K)用来度量次数分布曲线的扁平程度。
K=m4σ4(m4、σ4),m4表示变量X的四阶中心矩。
(第95页)陆第五章参数估计1.全及总体:根据一定的研究目的和要求所确定的研究对象的全体,简称总体,总体所包含的单位数称为总体容量,用N表示。
抽样总体:从全及总体中按随机原则抽取一部分单位所构成的集合体称为抽样总体,简称子样或样本,抽样总体所包含的单位数称为样本容量,用n表示。
一般情况下,当n≫30时,称为大样本;当n<30时,称为小样本;n/N称为抽样比例。
2.总体指标(全及指标):根据总体计算的综合指标。
总体指标:总体均值X̅、总体成数、总体方差σ2和总体标准差σ。
样本指标(抽样指标):根据抽样总体计算的综合指标。
样本指标:样本均值X̅、样本成数、样本方差S2和样本标准差s。
3.重复抽样每次抽取时总体单位数相同,不重复抽样每次抽取时总体单位数不相同。
4.设X1,X2,⋯,X n是总体X的样本,g(X1,X2,⋯,X n)是一个连续函数,若此函数中不含任何未知参数,则称函数g(X1,X2,⋯,X n)为一个统计量。
样本均值、样本方差和样本成数是最为常用的几个统计量。
统计量的概率分布称为抽样分布。
5.大数定律(第107页),中心极限定理(第108页)。
6.参数估计的方法:点估计、区间估计。
7.根据样本X1,X2,⋯,X n构造一个统计量Τ(X1,X2,⋯,X n)作为参数θ的估计,Τ称为θ的估计量。
8.评级估计量的标准:无偏性即点估计量的抽样分布的期望值等于柒总体参数;有效性即一个无偏估计量与任意一个无偏估计量相比,其方差最小;一致性即估计量与总体参数的绝对离差小于某一任意小的正数ε的极限概率等于1。
9.区间估计用两个估计量构成区间去估计总体参数。
设X1,X2,⋯,X n是来自总体X的一个简单随机样本,θ是总体参数,由样本确定的估计量为Τ1=Τ1(X1,X2,⋯,X n)和Τ2=Τ2(X1,X2,⋯,X n),对于给定的α(0<α<1),如果有P(Τ1≤θ≤Τ2)=1-a,则称(Τ1、Τ2)为θ的置信区间。
其中,Τ1称为置信区间的下限值,Τ2称为置信区间的上限值,1-α称为置信度或置信水平。
10.设X~N(μ,σ2),当σ已知时,求μ的置信区间。
一般地,若给定α(0<α<1),μ的置信区间为:P{X̅-Zα/2√n ≤μ≤X̅+Zα/2√n}=1-α11.设X~N(μ,σ2),当σ2未知时,求μ的置信区间。
P{X̅-tα/2(n-1)√n ≤μ≤tα/2(n-1)√n}=1-a12.非正态总体或总体分布未知时,求μ的置信区间。
根据中心极限定理,当n充分大时(一般认为n大于或等于30),若给定α(0<α<1),μ的置信区间同第十条。
总体方差未知,只要样本容量n≥30,可以用样本方差代替统计量Z中总体方差,这时μ的置信区间为:P{X̅-Zα/2√n ≤μ≤X̅+Zα/2√n}=1-α13.样本中某种特征的单位数占样本全部单位数的比例称为样本成数,记为p。
根据中心极限定理,在大样本条件下,样本成数的抽样分捌玖布可用正态分布来近似表示,通常用样本成数p 来代替置信上下限中的总体成数P ,这时总体成数P 的置信区间为:P{p-Z α/2√p(1−p)n ≤P ≤p +Zα/2√p(1−p)n }=1-α14. 总体方差的区间估计:给定α(0<α<1),总体方差σ2的100(1-α)%的置信区间为 P{(n−1)S 2χα22(n−1)≤σ2≤(n−1)S 2χ1−α22(n−1)}=1-α15. 测定平均数的样本单位数目:当X~N(μ,σ2),σ2已知时,或非正态总体、总体分布未知时的大样本情形,n=Z α/22σ2∆x ̅2壹拾 第六章 参数假设检验1. 原假设是要进行检验的假设,又称“零假设”;备择假设是与原假设对立的假设,也称“替换假设”。
关于一个总体参数μ的假设检验有三种基本形式:双侧检验: H 0:μ=μ0 H 1:μ≠μ0左侧检验: H 0:μ≥μ0 H 1:μ<μ0右侧检验: H 0:μ≤μ0 H 1:μ>μ02. 假设检验的基本思想是基于小概率原理,即小概率事件在一次试验或观察中不会发生。
3. 单个总体均值的假设检验设总体X~N(μ,σ2),σ2已知,μ的假设检验:双侧检验建立假设:H 0:μ=μ0 H 1:μ≠μ0;计算检验统计量的数值:Z=̅0σ√n⁄;给定显著性水平α,查正态分布表,确定临界值Z α2⁄,从而确定拒绝域为(-∞,−Z α2⁄)和[Z α2⁄,+∞),接受域为(-Z α2⁄,+Z α2⁄);统计决策:若|Z |≥Z α2⁄,拒绝H 0,否则接受H 0。