第三章分析结果的统计检验

合集下载

第三章 统计调查的方法

第三章 统计调查的方法

料的统计报表。

专业统计报表是国务院各业务主管部门根据本部门的专业特点和业
务管理需要,为搜集相应统计资料而制定,经国家统计局审批在本部门
内施行的统计报表,它实际上是基本统计报表的必要补充.以便全面掌
握国民经济各方面的统计数字资料。

2021/2/22
8
• (二)统计报农按报送周期长短不同,分为定期报表和年报两部分。
• 利用典型调查研究新事物、新情况和新问 题。
• 与其它调查搜集数据资料着眼于普遍所不 同的是,典型调查着眼于“深入”。
• 在一定条件下,可用典型调查资料推算总 体数值。
2021/2/22
22
(五)典型调查的局限性
• 1典型调查缺乏对作为典型单位的代表程度进行检测的手 段,因而在选择典型时容易受到主观因素的十扰,有较大 的随意性。
• (四)同类普查的内容在各次普查中应尽量注意保持一致,这样便于各次普查 内容前后衔接.也可以保证资料的完整性,对于历史资料的搜集、整理,分 析十分有利.增强历次普查资料的可比性。
• (五)重要的国情、国力普查应该按一定周期进行,以便于研究调查对象的发 展趋势,进行动态对比分。
• (六)每次普查一定耍经过事先试点的过程,以保证在工作全团铺开前发现实 施方案和计划的缺陷。及时更正、补救。
• 3、典型调查是一种定性分析的研究方法,这表现在典型的 选取,调查结论的形成等方面。
• 4、典型调查适合干同质性较强的对象,典型调查的运用只 是研究几个典型,就可获得对现象总体的概括性认识。
• 5规模小,费用低。
2021/2/22
21
(四)典型调查的作用
• 补充全面调查的不足。
• 在—定条件下,验证全面调查数字的真实 性。

第三章描述性统计分析

第三章描述性统计分析

描述性统计分析指标

统计量可分为两类


一类表示数据的中心位置,例如均值、中位数、众 数等 一类表示数据的离散程度,例如方差、标准差、极 差等用来衡量个体偏离中心的程度。
描述单变量分布的三种方式

用数字呈现一个变量的分布 用表格呈现一个变量的分布 用图形呈现一个变量的分布
Frequencies

在交叉列联表中,除了频数外还引进了各种百分 比。例如表中第一行中的33.3%, 33.3%, 33.3 %分别是高级工程师3人中各学历人数所占的比例 ,称为行百分比(Row percentage),一行的百 分比总和为100%;表中第一列的25.0%,25.0% ,50.0%分别是本科学历4人中各职称人数所占的 比例,称为列百分比(Column percentage), 一列的列百分比总和为100%,表中的6.3%,6.3 %,12.5%等分别是总人数16人中各交叉组中人 数所占的百分比,称为总百分比(Total percentage),所有格子中的总百分比之和也为 100%。
例子

假设我们有以下的三组观测值:

观测A:11,12,13,16,16,17,18,21 观测B:14,15,15,15,16,16,16,17 观测C:11,11,11,12,19,20,20,20

这三组观测值的均值都是15.5,那么这三组数 据是否相似呢?
离散趋势
离散趋势的描述
本科 职称 高 级工 程师 Count % within 职 称 % within 文 化 程 度 % of Total Count % within 职 称 % within 文 化 程 度 % of Total Count % within 职 称 % within 文 化 程 度 % of Total Count % within 职 称 % within 文 化 程 度 % of Total Count % within 职 称 % within 文 化 程 度 % of Total 1 33.3% 25.0% 6.3% 1 25.0% 25.0% 6.3% 2 33.3% 50.0% 12.5% 0 .0% .0% .0% 4 25.0% 100.0% 25.0%

多元统计分析第三章假设检验与方差分析

多元统计分析第三章假设检验与方差分析

多元统计分析第三章假设检验与⽅差分析第3章多元正态总体的假设检验与⽅差分析从本章开始,我们开始转⼊多元统计⽅法和统计模型的学习。

统计学分析处理的对象是带有随机性的数据。

按照随机排列、重复、局部控制、正交等原则设计⼀个试验,通过试验结果形成样本信息(通常以数据的形式),再根据样本进⾏统计推断,是⾃然科学和⼯程技术领域常⽤的⼀种研究⽅法。

由于试验指标常为多个数量指标,故常设试验结果所形成的总体为多元正态总体,这是本章理论⽅法研究的出发点。

所谓统计推断就是根据从总体中观测到的部分数据对总体中我们感兴趣的未知部分作出推测,这种推测必然伴有某种程度的不确定性,需要⽤概率来表明其可靠程度。

统计推断的任务是“观察现象,提取信息,建⽴模型,作出推断”。

统计推断有参数估计和假设检验两⼤类问题,其统计推断⽬的不同。

参数估计问题回答诸如“未知参数θ的值有多⼤?”之类的问题,⽽假设检验回答诸如“未知参数θ的值是0θ吗?”之类的问题。

本章主要讨论多元正态总体的假设检验⽅法及其实际应⽤,我们将对⼀元正态总体情形作⼀简单回顾,然后将介绍单个总体均值的推断,两个总体均值的⽐较推断,多个总体均值的⽐较检验和协⽅差阵的推断等。

3.1⼀元正态总体情形的回顾⼀、假设检验在假设检验问题中通常有两个统计假设(简称假设),⼀个作为原假设(或称零假设),另⼀个作为备择假设(或称对⽴假设),分别记为0H 和1H 。

1、显著性检验为便于表述,假定考虑假设检验问题:设1X ,2X ,…,n X 来⾃总体),(2σµN 的样本,我们要检验假设100:,:µµµµ≠=H H (3.1)原假设0H 与备择假设1H 应相互排斥,两者有且只有⼀个正确。

备择假设的意思是,⼀旦否定原假设0H ,我们就选择已准备的假设1H 。

当2σ已知时,⽤统计量nX z σµ-=在原假设0H 成⽴下,统计量z 服从正态分布z )1,0(~N ,通过查表,查得)1,0(N 的上分位点2αz 。

应用统计学(第三章 数据的描述性分析)

应用统计学(第三章 数据的描述性分析)

累积频率 Cumulative P
0.02 0.09 0.28 0.63
0.84 0.95 1.00
a.自然值进行分组,最大值17,最小值11 b.数据主要集中在14,向两侧分布逐渐减少
(3)计量数据
100例健康男子血清总胆固醇(mol/L)测定结果
4.77 3.37 6.14 3.95 3.56 4.23 4.31 4.71 5.69 4.12 4.56 4.37 5.39 6.30 5.21 7.22 5.54 3.93 5.21 6.51 5.18 5.77 4.79 5.12 5.20 5.10 4.70 4.74 3.50 4.69 4.38 4.89 6.25 5.32 4.50 4.63 3.61 4.44 4.43 4.25 4.03 5.85 4.09 3.35 4.08 4.49 5.30 4.97 3.18 3.97 5.16 5.10 5.85 4.79 5.34 4.24 4.32 4.77 6.36 6.38 4.88 5.55 3.04 4.55 3.35 4.87 4.17 5.85 5.16 5.09 4.52 4.38 4.31 4.58 5.72 6.55 4.76 4.61 4.17 4.03 4.47 3.40 3.91 2.70 4.60 4.09 5.96 5.48 4.40 4.55 5.38 3.89 4.60 4.47 3.64 4.34 5.18 6.14 3.24 4.90
15
21
0.21
0.84
16
11
0.11
0.95
17
5
0.05
1.00
表 2-2 100只梅花鸡每月产蛋数次数分布表
每月产蛋数
11 12 13 14 15 16 17

第三章 定性数据的 检验

第三章  定性数据的  检验
p1=所有顾客中喜欢品牌甲的比例 p2=所有顾客中喜欢品牌乙的比例 p3=所有顾客中喜欢品牌丙的比例 则我们所要检验的假设为: H0: p1= p2= p3=1/3 H1: 至少一个比例超过1/3
3
? ? 假 如设果三H0类成的立观,察我次们数希分望别在为样本n1中, n喜2和欢n每3 一,品i?1 牌ni 的? n顾。
从而
c
?
?
2
?
(k
? 1)
对例3.1来说,k ? 3 ,当? ? 0.05 时,??2(k ?1)? ?02.05(2)? 5.991
? 2 ? (61 ? 50)2 ? (53 ? 50)2 ? (36 ? 50)2 ? 6.52
50
50
50
? 由于? 2 ? 6.52 ? 5.991,因此拒绝零假设。
由假设检验的一般原理知, c的值可由给定的显
著性水平 ? 确定,即c满足 P(? 2 ? c) ? ?
关于统计量 ? 2的分布,英国统计学家 Karl Pearson
给出下面的定理:
设总体中的每一个个体属于且只属 A1, A2 , , Ak
,k个类之一。总体中属于 k个类的比例为 p1, p 2 , , pk
即认为顾客对这三种品牌矿泉水的喜好确实存 在差异。
利用统计分析软件SPSS13.0可以大大简 化计算过程,下面用统计软件对例3.1进行分析。
?1.按要求录入数据; ?2.选择 Data ? weightCase 对数据进行加权; ?3.选择 Analyze ? Non ? parametricTest ? Chi ? square 进行非参数检验
3.1 多项分布与? 2 分布
?收集分类数据的目的是分析在每个类中 数据的分布。例如,我们为了估计消费 者中喜欢三种牙膏中每一种的比例,则 统计购买者三种牙膏的顾客购买每一种 的人数。在这里仅仅是根据牙膏的种类 来分类,我们称之为一维分类或一向分 类。下面通过例子来介绍一向分类数据 的分析。

第三章--统计案例-3.2-独立性检验的基本思想及其初步应用

第三章--统计案例-3.2-独立性检验的基本思想及其初步应用

解:由列联表中的数据,得 K2 的观测值为 1 633×30×1 355-224×242 k= ≈68.033>10.828. 254×1 379×54×1 579 因此,在犯错误的概率不超过 0.001 的前提下,认为每 一晚都打鼾与患心脏病有关.
为了调查某生产线上,某质量监督员甲对产
品质量好坏有无影响,现统计数据如下:质量监督员在现 场时,990件产品中合格品为 982 件,次品数为 8 件,甲不 在现场时,510件产品中合格品为493件,次品数为17件, 试分别用列联表、等高条形图、假设检验的方法对数据进
的方法来判断色盲与性别是否有关?你所得的结论在什么
范围内有效? 解:根据题目所给的数据作出如下的列联表: 色盲 不色盲 合计
男 女 合计
38 6 44
442 514 956
480 520 1 000
根据列联表作出相应的等高条形图,如图所示:
38 从等高条形图来看在男人中患色盲的比例480比在女人
38 6 6 中患色盲的比例520要大,其差值为480-520 ≈0.068,差
位统一,图形准确,但它不能给我们两个分类变量有关或
无关的精确的判断,若要作出精确的判断,可以进行独立 性检验的有关计算.
本题应首先作出调查数据的列联表,再根据列联表画
出等高条形图,并进行分析,ห้องสมุดไป่ตู้后利用独立性检验作出判 断.
在调查 480 名男士中有 38 名患有色盲, 520名女士中有6名患有色盲,分别利用图形和独立性检验


③如果 k≥k0 ,就推断“X与Y有关系”,这种推断
犯错误的概率不超过α;否则,就认为在犯错误的概 率不超过α的前提下不能推断“X与Y有关系”,或者 在样本数据中没有发现足够证据支持结论“X与Y有 关系”.

09、第三章第一节质量统计分析(一)

第三章建设工程质量的统计分析和试验检测方法第一节质量统计分析一、工程质量统计及抽样检验的基本原理和方法㈠总体、样本及统计推断工作过程:总体(母体);个体; 有限总体;无限总体;样本(子样);样品;样本容量㈡质量数据的特征值⒈描述数据集中趋势的特征值样本数据特征值是由样本数据计算的描述样本质量数据波动规律的指标。

算术平均数(均值) 是消除了个体之间个别偶然的差异。

是数据的分布中心,对数据的代表性好总体算术平均数μ样本算术平均数 x样本中位数按数值大小有序排列样本数n为奇数,数列居中的一位数样本数n为偶数,取居中两个数的平均值⒉描述数据离散趋势的特征值极差计算简单、使用方便,但粗略,数值仅受两个极端值的影响,损失的质量信息多,不能反映中间数据的分布和波动规律,仅适用于小样本标准偏差标准差值小说明分布集中程度高,离散程度小,均值对总体(样本)的代表性好;总体标准差样本样本容量较大(n≥1(标准差或均方差) 标准差的平方是方差,有鲜明的数理统计特征,能确切说明数据分布的离散程度和波动规律,是最常用的反映数据程度的特征值标准差50)时,分母n-1简化为n变异系数(离散系数) 表示数据的相对离散波动程度。

变异系数小。

说明分布集中程度高,离散程度小,均值对总体(样本)的代表性好。

适用于均值有较大差异的总体之问离散程度的比较标准差除以算术平均数得到的相对数【例】下列质量数据特征值中,用来描述数据集中趋势的是()。

A.极差B.标准偏差C.均值D.变异系数【答案】C【例】下列质量数据特征值中,用来描述数据离散趋势的是()。

A.极差B.中位数C.算术平均数D.极值【答案】A㈢质量数据的分布特征⒈质量数据的特性质量数据具有个体数值的波动性和总体(样本)分布的规律性。

⒉质量数据波动的原因正常波动偶然性原因引起影响因素的微小变化具有随机发生的特点,是不可避免、难以测量和控制的,或者是在经济上不值得消除,它们大量存在但对质量影响很小,属于允许偏差、允许位移范畴异常波动系统性原因引起影响质量的人机料法环等因素发生了较大变化,如工人未遵守操作规程、机械设备发生故障或过度磨损、原材料质量规格有显著差异等情况发生时,没有及时排除⒊质量数据分布的规律性2。

第三章 差异分析与统计检验ytt


例:智商平均数
独立样本 Ho:μ1=μ2;H1:μ1≠μ2 独立样本t检验 还可以用皮尔逊相关
两总体均值的比较
Ho:μ1=μ2;H1:μ1≠μ2
配对样本 Ho:μD=0;H1:μD≠0 D=M1-M2 配对样本t检验
二、单向分组的多组比较——单因素完全随机设计的方差分析 实验包含一个因
素,有≥2的水平
用重复测量方差分析做
例:2×2设计
A1B1 A1B2 A2B1 A2B2
平方和分解 SST=SSS+SSA+SSAS+SSB+SSBS+SSAB+SSABS

一个研究即包含被试内变量,又包含被试间变量,就属于混合设计。
同时它包含了两种设计分别遇到的问题,即个体差异和序列效应问题。
用随机分配,或匹配。和各种抵消平衡技术解决。 用重复测量方差分析做 例: 被试内因素A、被试间因素B SST=SSA+SSE(A)+SSB+SSE(B)+SSAB
H0=β1=β2=...βb
dfT=dfA+dfB+dfE
4 如对无关变量感兴趣可将其设计成
区组
单因素重复测量设计的方差分析
每个被试都要接受全部的水平处理
前提:
实验处理间相互污染影响不大(初期练习效应) 平衡顺序误差、时间误差带来的影响
减少了被试,也减少了被试差异
单因素重复测量设计,可以看作一种特殊的随 机区组设计(每个被试看作一个区组)
方差分析模型 观测值y=平均数μ+随机误差E H0=μ1=μ2=...=μα 多重比较 若H0假设被拒绝,就要分 析是那些水平的差异显著 1.以某一水平为标准进行比 平方和分解 SS总T=SS组内A+SS组间E dfT=dfA+dfE

多元统计分析:第三章 多元正态总体参数的假设检验(补充)

18
第三章 多元正态总体参数的假设检验
所涉及的最大似然估计量—单个总体
ˆ X时 (4) 当 0 (0 0巳知)时, 取 似然函数达最大值:
L( X , 0 ) 2
np 2
0
n 2
n 1 etr - 0 A 2
19
第三章 多元正态总体参数的假设检验
15
第三章 多元正态总体参数的假设检验
所涉及的最大似然估计量—单个总体
单个p维正态总体Np(μ,Σ),设X(i)(i=1,…,n)为来自p 维总体的随机样本.样本的似然函数为
L( , ) 2
np 2
1 ˆ A时, 似然函数达最大值 : ˆ X , (1)当 n n np A 2 A np L( X , ) 2 2 exp - n n 2
9
第三章 多元正态总体参数的假设检验
§3.6正态性检验--p维数据的正态性检验
D2(1)≤ D2(2) ≤…≤ D2(n) 统计量 D2 的经验分布函数取为
.
其中H(D2(t) |p)表示χ2 (p)的分布函数在D2(t)的值. 设χ2 分布的pt分位数为χt2 ,显然χt2满足: H(χt 2 |p)= pt. 即χ2 分布的pt 分位数χt2 =H-1(pt |p). 由经验分布得到样本的pt 分位数D2(t)=Fn-1(pt ). 若H(x|p)≌Fn(x),应有D2(t) ≌ χt2 ,绘制点(D2(t) , χt2 )的散 布图,当X为正态总体时,这些点应散布在一条直线上. 10
(1) (1) ( 2) ( 2)
np 2
A1 A2 n
(t )
np 2 2
e
X )( X

第三章 误差和分析数据的处理汇总

本章目录§3-1 误差及其产生的原因§3-2 测定值的准确度与精密度§3-3 随机误差的正态分布§3-4 有限测量数据的统计处理§3-5 有效数字及其运算规则§3-6 提高分析结果可靠性的方法§3-1 误差及其产生的原因分析结果与真实值之间的差值称为误差。

分析结果大于真实值,误差为正;分析结果小于真实值,误差为负。

根据误差的性质与产生的原因,可将误差分为系统误差和偶然误差两类。

一、系统误差系统误差也叫可测误差,它是定量分析误差的主要来源,对测定结果的准确度有较大影响。

产生原因: 由于分析过程中某些确定的、经常的因素造成的,对分析结果的影响比较固定。

特点: 是具有¡°重现性¡±、¡°单一性¡±和¡°可测性¡±。

即在同一条件下,重复测定时,它会重复出现;使测定结果系统偏高或系统偏低,其数值大小也有一定的规律;如果能找出产生误差的原因,并设法测出其大小,那么系统误差可以通过校正的方法予以减小或消除。

系统误差产生的主要原因(一)方法误差这种误差是由于分析方法本身所造成的。

例如:在重量分析中,沉淀的溶解损失或吸附某些杂质而产生的误差;在滴定分析中,反应进行不完全,干扰离子的影响,滴定终点和等当点的不符合,以及其他副反应的发生等,都会系统地影响测定结果。

(二)仪器误差主要是仪器本身不够准确或未经校准所引起的。

如天平、法码和量器刻度不够准确等,在使用过程中就会使测定结果产生误差。

(三)试剂误差由于试剂不纯或蒸馏水中含有微量杂质所引起。

(四)操作误差主要是指在正常操作情况下,由于分析工作者掌握操作规程与正确控制条件稍有出入而引起的。

例如,使用了缺乏代表性的试样;试样分解不完全或反应的某些条件控制不当等。

与上述情况不同的是,有些误差是由于分析者的主观因素造成的,称之为¡°个人误差¡±例如,在读取滴定剂的体积时,有的人读数偏高,有的人读数偏低;在判断滴定终点颜色时,有的人对某种颜色的变化辨别不够敏锐,偏深或偏浅等所造成的误差。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

• ①计算F值 • ②与临界值
F
S
2 1
S
2 2
比较
F , f1, f2
方差
(S1>S2)
F≥ F, f1, f2 精密度有显著性差异
F < F, f1, f2
精密度无显著性差异
注:并不是不存在偶然误差,
而是二者偶然误差一致,不
存在较大差别。
⑵t 检验——准确度显著性检验
• ①样本均值 x与标准值比较
4 d 检验法
• 若一总体服从正态分布,x- μ大于±3 σ 的测量
值出现的概率很小,其误差往往不是随机误差
所致,应舍去。当然,其条件是在校正了系统误
差之后。又总体的标准偏差σ与总体平均偏差δ
两者的关系是δ≈0.8 σ,用样本平均偏差 代替δ,
则 ≈ 3 σ。4 d
4d
d
• 这样, 便可将可疑值与
[课堂练习]
• 滴定终点不在指示剂变色范围内,是属于下列 哪种情况?( A )
A.系统误差、方法误差、恒定误差 B.系统误差、试剂误差、比例误差 C.系统误差、试剂误差、恒定误差 D.随机误差
滴定时,操作者无意从锥形瓶中溅失少许试液, 属下列哪种误差?( )D
A.操作误差 B.方法误差 C.偶然误差 D.过失误差
• ⑶与临界值Gα,n比较 G≥Gα,n→舍弃;G< Gα,n→保留
显著性检验
• 显著性(差别)检验:以统计处理的方 法检验分析结果之间是否存在明显的系 统误差及偶然误差。
• ⑴F检验:检验精密度(偶然误差)有否 显著性差别
• ⑵t 检验:检验准确度(系统误差)有否 显著性差别
⑴F检验——精密度显著性检验
第三章 分析结果• 有限量实验数据的统计处理顺序
▪ 可疑数据的取舍检验


显著性检验
F检验
↓ t 检验
可疑数据的取舍检验
• 可疑数据:也称异常值或逸出值(outlier), 指一组平行测定所得的数据中,过高或 过低的测量值。
• ⑴ 4 d 检验法
• ⑵ Q检验法(舍弃商法) • (3)G检验法(Grubbs检验法)
[课堂练习](续)
• 下列关于偶然误差的叙述正确的是( B )。
A.小误差出现的概率小 B.正负误差出现的概率大致相等 C.大误差出现的概率大 D.大小误差出现的概率大致相等
下列关于准确度与精密度之间的关系叙述错误的是( B )。
A.准确度高一定要求精密度好 B.精密度好准确度一定高 C.精密度差准确度不大可能高 D.精密度好是保证准确度高的前提条件
x1 x2 t
SR
n1n2 n1 n2
t≥tα,n 存在显著性差异(二者不属于同一总体,1≠2) t < tα,n 不存在显著性差异(二者属于同一总体,1= 2)
②两个样本均值比较
x
t
n
S
x1 x2 t
SR
n1n2 n1 n2
xx1x2
S/
nSR /
n1n2 n1 n2
合并标 SR准 偏差 差平 /总方 自和 由度
__
x
之差是否大于
• 4 d作为可疑值取舍的根据。
4 d检验法
x
4d
d
应用 4 d 法时,可先把可疑值除外,求出余
下测量值的 x 和 d ,若可疑值与 x 之差
的绝对值大于 4 d ,可疑值舍弃,否则保
留。
G检验法
• ⑴和标计准算偏包差括S可疑值xq在内的平均值 x
• ⑵计算G值
G xq x S
• 目的:检查分析方法或操作过程是否存在
较大的系统误差。
x
t
n
S
t≥tα,n 存在显著性差异(存在显著系统误差)
t < tα,n 不存在显著性差异
注:二者并不可能完全一致,只是差别由偶然误差引起,不属
于系统误差
⑵t 检验——准确度显著性检验
• ②两个样本均值比较
• 目的:检查同一样品,由不同分析方法或不同分析人员 测定;或两个样品含同一成分,由相同分析方法测定, 所得分析结果是否存在较大系统误差 。
2
2
x1x1 x2x2
(n11)(n21)
SR
S1 2S2 2 n1 n2
(n11)S1 2(n21)S2 2 n1n22
⑶双侧检验与单侧检验
• 双侧检验:检验两个分析结果间是否存在显著 性差异;
• 单侧检验:检验某分析结果是否明显高(或低) 于某值。
▪ t检验→双侧检验 ▪ F检验→单侧检验
相关文档
最新文档