管理统计学第3章--非参数假设检验

合集下载

非参数假设检验.pptx

非参数假设检验.pptx
取 1。.据9 此,我们可以用参数 的泊1松.9分布来
计算每分钟内通过收费站的汽车为0辆、1辆、2辆、3 辆、4辆或更多的概率。
第12页/共43页
e 各概率乘以观测总数n=100,便得到理论频数 ,具体结果见下表: i ei
计算 2统计量的值:
2 (14.96 10)2 (28.42 26)2 (27.0 35)2
H0 :汽车通过收费站的辆数服从泊松分布; H1 :不服从泊松分布。
观测值分为5组,且有 u0 10,u1 26,u2 35,u4 5
第11页/共43页
回忆泊松分布
P{X x} e x , x 0,1, 2,
x!
其中 为泊松分布的期望值,是未知的,需要用样
本观测值来估计。由于100分钟内观测到190辆汽车, 所以平均每分钟观测到190/100=1.9辆汽车,故
第9页/共43页
计算 2统计量的值:
2 6 (ui ei )2
i1
ei
(27 25)2 (18 25)2 (15 25)2 (24 25)2
25
25
25
25
(36 25)2 (30 25)2 12
25
25
在本例的情况下, 统2 计量的自由度为m-1=6-1=5。
第8页/共43页
解:本例中的观测值以月为组,共分为m=6组,
每 月的销售台数即为观测的频v数i ,观测的总次
数为n=150。现欲检验是否服从(离散的)均匀 分布,即每月的销售量是否为
ei
nPi
150 6
25(台),
Pi
1 6
,i
1,
,6
为此,设
H0 :洗衣机销售量服从均匀分布;
H1 :并不服从均匀分布;

数理统计13 非参数假设检验

数理统计13 非参数假设检验
X1,X2,…,Xn 为来自总体X的样本,则 X n F L n N (0,1) ( n ) Sn
均值的渐近分布为N ( F,
F
2
).
定理3 设(X1,X2,…,Xm) 与(Y1,Y2,…,Yn) 是来
自X~N(1,12)与Y~N(2,22)的两独立样本,
则当n趋于无穷, m趋于无穷时有
得到拒绝域{Dn1 ,n2 Dn , }。 Fn1 ( x)和Gn2 ( x)是两个总体对应的经验分布函数
柯尔莫哥洛夫检验 当连续分布时,效率较
高,不能用于离散情形
-检验能用于离散情形,连续情形精度较差
2
(三)独立性检验 分析
需要检验H0 :两个总体X和Y是否独立 将这两个总体的取值范围分成m个和k个 互不相交的区间A1 , A2 , . . . ,Am 和B1 ,B2 ,... ,Bk 。 设从总体中抽取一个容量为n的样本 (X1,Y1), (X2,Y2), …,(Xn,Yn),
, , 未知但 = = .
2 1 2 2 2 3 2 1 2 2 2 3
试提出三正态总体均值1 2 =3的 假设检验.
2. 某厂使用两种不同的工艺生产同一类型的产 品。现对产品进行分析比较,抽取第一种工艺 生产的样品120件,测得均值为1.25 (kg),标准 差为0.52(kg);抽取第二种工艺生产的样品60 件,测得均值为1.32(kg),标准差为0.45 (kg)。 设产品的质量都服从正态分布,试判断在检验 水平0.05下,能否认为两种生产工艺的方差相 等?如果能认为两种工艺质量的方差相等,再 进一步判断能否认为使用第二种工艺生产的产 品的平均质量较使用第一种生产的为大?
记nij表示样本值中其横坐标落入Ai,纵坐 标落入Bj中的个数(i=1,2,…,m;j=1,2,…k).

《管理统计学》-实验教学大纲

《管理统计学》-实验教学大纲

《管理统计学》课程实验教学大纲一、课程基本信息课程代码:16225004课程名称:管理统计学英文名称: Statistics for Management实验总学时:24适用专业:信管专业课程类别:学科基础课先修课程:线性代数,微积分,概率论与数理统计二、实验教学的总体目的和要求1、对学生的要求:了解统计学、数据分析技术对世界、企业的作用及全球化过程中我国快速发展的伟大成就;让学生掌握课程中的基本原理和理论方法;能将实验过程、求解方法及在实验过程中的收获和发现的问题正确地表达出来,并以实验报告的形式总结出来。

2、对教师的要求:授课教师实验前在课堂上简单讲解实验流程,实验中解答学生的疑问。

3、对实验条件的要求:SPSS,Office软件以及网络开发环境。

实验教学内容实验项目一实验名称:界面介绍和基础操作介绍实验内容:1.了解SPSS软件界面:菜单栏;工具栏;数据窗口;数据视图与变量视图切换.2.SPSS数据结构1)变量名是变量存取的唯一标志。

起名规则:不多于8个字符组成;不区分大小写;允许汉字作为变量名;默认变量名为VARn,如:var00001。

2)变量的类型(type)和显示宽度(width)3)变量名标签(Variable label) :对变量名的一些解释说明,增强分析结果的可视性。

可以省略。

4)变量名标签(Variable label) :对变量名的一些解释说明,增强分析结果的可视性。

可以省略。

5)变量列格式(Column Format):对齐方式(Text Alignment):左对齐(Left):字符型默认,右对齐(Right):数值型默认居中对齐(Center);列宽度:默认值为变量的总长度。

6)缺失值(Missing Values):对缺失值的一般处理包括事先指定和其他处理方法。

3.变量度量(Measurement):scale: 定距数据,一般为数值型数据。

如:收入、人数。

ordinal:有固有顺序的顺序水准的数值型或字符型数据。

假设检验的思想和原理

假设检验的思想和原理

假设检验的思想和原理摘要 统计推断研究的一类基本问题是本章所讨论的统计假设检验问题。

在数理统计中,通常称对有关总体分布所提出的某种推断为统计假设;称根据所获得的样本,采用合理的方法来判断这个假设是否成立为统计假设检验。

统计假设检验的基本任务是根据来自总体的样本所提供的信息,对未知总体分布的某些概率特征(如总体数学期望,总体方差,总体分布,两个总体相互独立等)的统计假设作出合理的判断。

为行文简便,以下将统计检验假设简写成假设检验。

假设检验与参数估计一样,在数理统计的理论研究与实际应用中都占有极其重要的地位。

关键词:原理讨论 参数检验 检验水平一般地,在统计假设检验问题中,其出发点是对总体作一个假设,称之为原假设或零假设(null hypothesis ),记为0H ;而与之对立的假设称为备择假设(alternative hypothesis),记为1H 。

原假设和备择假设称为统计假设。

而用来判断统计假设真伪的规则为检验法。

必须强调指出,原假设0H 通常是不轻易否定的一个被检验的假设,只有在样本提供足够不利于它的证据时才能拒绝它;如果样本提供的信息没有充分的理由否定原假设0H ,则不能拒绝它。

假设检验问题按照总体的状况通常分为参数假设检验与非参数假设检验两类:若总体的分布函数或者总体在离散情形的概率质量函数或在连续情形的概率密度函数的数学表达式为已知,只是分布中的参数有些是未知的,这时统计假设是针对未知参数而提出并需要检验的,这样的问题称为参数假设检验问题。

如备择假设为“50:1≠μH ”,它表示当备择设1H 成立时,μ可能大于50,也可能小于50,通常称这种备择假设为双侧被择假设(two-sided alter- native hypothesis ),与之相应的检验为双侧检验(two-sided test )。

在实际问题中还会出现备择假设为“01:θθ H ”或“01:θθ H ”的情形。

例如,某厂生产的固体燃料推进器的燃烧率服从正态分布),(200σμN ,现采用新方法研究一批推进器,其目的是提高推进器的燃烧率。

非参数统计基本概念

非参数统计基本概念

§ 非参数统计
知识回顾 势函数(检验的势) 无偏检验 经验分布 检验的相对效率
2.4 检验的相对效率
已知好的检验, 势越大越好.
那么用怎样的标准选择检验函数呢?
----可以通过比较势的大小选择较优的检验
然而势不容易计算,则考虑其影响因素:
总体的真值, 显著水平, 样本量 样本量越大,势越大
• 超几何分布:
• p=S/N
=
,这里
数据处理
• 拿到数据时,首先要有一个直观概念。 • 若数据来自一个总体,先通过绘图(直方图、箱线图、 茎叶图、Q-Q图、P-P图 等)了解它的大致分布情况, 如是否对称,是否有很长的尾部,是否有远离数据 主体的点等。 • 若数据来自不同总体,除了上述了解,还需要看各 样本的形状是否类似,通过二维或三维图观察样本 间的联系或相关性。 • P12的图1.1给出了x和y样本的直方图、盒形图及相对 于正态分布的QQ图. • 数据常常需要处理以符合非参数统计推断方法的某 些条件,最常用的是指数变换。
2.2 势函数
即不犯第II类错误的概率,
此时 为检验犯第II类错误的概率
Remark:
势越大越好(如此才是有意义的检验)
低势的检验说明检验在区分零假设和备择假设 方法的价值不大
例2.1:电话交换台单位时间内接到的呼唤次数服从 Poisson分布P( ) ,为单位时间内接到的平均呼唤次 数。考察该交换台在单位时间内的平均呼唤次数是 否超过1。
局部最优势检验LMP
§ 非参数统计
知识回顾 势函数(检验的势) 无偏检验 经验分布 检验的相对效率
2.3 经验分布
Recall 分布函数的两种定义形式
设 X 1 , X 2 ,, X n是取自分布函数为F ( x)的总体中一个简单随机样 本的观测值,若把样本观测值由小到大进行排列,得到 X (1) X ( 2) X ( n),其中 X (1) 是样本观测值 X , X , , X 中最小的 1 2 n 一个, X (i ) 是样本观测值中第 i 个小的,则 n 1 0 当X (1) x F ( x) I ( X n i x) n i 1 k

管理统计学-第4章 假设检验

管理统计学-第4章  假设检验

• 在本例中,
_
x 32 35
3.184
s / n 5.96 / 40
⑤作出统计决策
• 根据样本信息计算出统计量z的具体值,Z 将它与临界值 相比较,就可以作出接受 原假设或拒绝原假设的统计决策。
• 在本例中,由于z=3.184>1.96,落在拒绝 域内,所以拒绝原假设H0。可以得出结论:
在0.05的显著性水平下,抽样结果的平
– p<α,拒绝零假设 – p>α,不应拒绝零假设
举例1
• 某健身俱乐部主管经理估计会员的平均年 龄是35岁,研究人员从2005年入会的新 会员中随机抽取40人,调查得到他们的年 龄数据如下。
33 28 32 26 37 35 27 29 33 30 35 29 39 34 27 37 34 36 31 29 29 26 19 21 36 38 42 39 36 38 27 22 29 34 36 20 39 37 22 39
素有:总体方差已知还是未知,用于进行检验的
样本是大样本还是小样本,等等。
• 在本例中,由于n=40>30是大样本,所以 近似
服从正态分布,以样本标准差代替总体标准差, 所用的统计量是:
_
x
3.184
s/ n
③选取显著性水平,确定接受域和拒绝域
• 显著性水平(Significant Level):事先给定的形 成拒绝域的小概率,用表示。
(3)右单侧检验
两侧,左单侧检验的拒绝域位于统计量分布曲线的左侧,
右单侧检验的拒绝域位于统计量分布曲线的右侧。
④计算检验统计量的值
• 在提出原假设H0和备选假设H1,确定了检验统计 量,给定了显著性水平以后,接下来就要根据

【2019-2020年整理】管理统计学第3章--非参数假设检验

【2019-2020年整理】管理统计学第3章--非参数假设检验
Mann-Whitney秩和检验法(序号和检验法) 3.1.4 两个总体分布的非参数检验小结



实际问题中,经常要检验两种不同的 处理方法效果是否相同。 例如,比较在不同钻机、不同操作人 员、不同地质条件下,钻机效率是否相同 等等。
诸如此类问题是对两个总体的分布是 否相同的检验。本章主要介绍两种简单易 行的方法:“符号检验法”和“秩和检验 法”。
1, xi yi Ai 0, xi yi

于是 A=A1+A2+...+An服从二项分布

即,在H0:F(x)=G(y)的假设下,可以把抽样 过程看成一个近似的贝努利实验,服从B(m,p) 分布。
1. 小样本情况下,正负号个数检验法的处理 (方法一)


如果实际的“xi-yi>0 的个数n+”在(k1,k2)中,就接受H0:p=0.5 (即F(x)=G(y)),否则,拒绝H0,认为p≠0.5,即F(x)≠G(y)。
第3章 非参数假设检验(分布检验)

3.1 两个总体分布的非参数假设检验 3.1.1 检验两个总体的分布是否相同的第一种方法: 符号检验法(正负号个数检验法)

3.1.2 检验两个总体的分布是否相同的第二种方法:
Wilcoxon秩和检验法(序号和检验法)

3.1.3 检验两个总体的分布是否相同的第三种方法:
配对
得 实验组 分 对照组
1
2
3
4
5
6
7
8
9 10 11 12
X1 18 20 26 14 25 25 21 12 14 17 20 19 X2 14 20 23 12 29 18 21 10 16 13 17 25

统计学假设检验概念和方法

统计学假设检验概念和方法

临界值
H0值
计算出旳样本统计量
样本统计量
右侧检验旳P 值
抽样分布
置信水平
拒绝域
1 -
P值
H0值
临界值 计算出旳样本统计量
利用 P 值进行检验
(决策准则)
1. 单侧检验
– 若p-值 ,不拒绝 H0 – 若p-值 < , 拒绝 H0
2. 双侧检验
– 若p-值 /2, 不拒绝 H0 – 若p-值 < /2, 拒绝 H0
零假设总是一种与总体参数有关旳问题,所以 总是用希腊字母表达。有关样本统计量如样本 均值或样本均值之差旳零假设是没有意义旳, 因为样本统计量是已知旳,当然能说出它们等 于几或是否相等
提出原假设和备择假设
什么是备择假设?(alternative hypothesis) 1. 与原假设对立旳假设,也称“研究假设” 2. 研究者想搜集证据予以支持旳假设总是有不
(单尾和双尾)

z 检验
Z X 0 n
总体均值旳检验
(检验统计量)
总体 是否已知 ?

z 检验
Z X 0
Sn

样本容量 n

用样本标 准差S替代
检验
t X 0 Sn
总体均值旳检验
(2 已知或2未知大样本)
1. 假定条件
– 总体服从正态分布 – 若不服从正态分布, 可用正态分布来近似
– 右侧检验时,P-值为曲线上方不小于等于
检验统计量部分旳面积
3. 被称为观察到旳(或实测旳)明显性水平
– H0 能被拒绝旳 旳最小值
双侧检验旳P 值
/ 2 拒绝
1/2 P 值
/ 2 拒绝
1/2 P 值
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

单位:次/分钟
6 78 56 58 47 55 54 45
这两组观察数据即为配对样本。
h
8
例:现有18名学生按身体条件大体相近配成 9对,并用随机分组将他们分为甲、乙两组, 由一位教师采用不同的教法执教一年,一年 后测得她们的平衡术成绩(见下表),问两 种不同教法的效果是否有显著差异?
一年后甲、乙两组平衡术成绩表
由表可知,n+=7, n-=3,于是,m=n++n-=10。将n+和 n-中的较小者记为K,K=3。 (3)统计推断
根据m=10,查符号检验表找临界值,K0.05(10)=1, 而K> K0.05(10),不显著。即,接受原假设,认为:
颜色教学无显著效果。
配对
1 2 3 4 5 6 7 8 9 10 11 12
h
2
3.1 两个总体分布的非参数假设检验
h
3
3.1.1 检验两个总体的分布是否相同的第一 种方法:符号检验法(正负号个数检验法)
配对样本
h
4
配对样本的概念及属性
配对样本:按某些重要特征相近的原 则,可将两样本中的每一个体配成对 子,这两组样本称为配对样本。
配对样本的属性:
1)两样本的观察数量应相同;
3.1.4 两个总体分布的非参数检验小结
h
1
实际问题中,经常要检验两种不同的处 理方法效果是否相同。
例如,比较在不同钻机、不同操作人员、 不同地质条件下,钻机效率是否相同等等。
诸如此类问题是对两个总体的分布是否 相同的检验。本章主要介绍两种简单易行 的方法:“符号检验法”和“秩和检验法”。
第3章 非参数假设检验(分布检验)
3.1 两个总体分布的非参数假设检验
3.1.1 检验两个总体的分布是否相同的第一种方法: 符号检验法(正负号个数检验法)
3.1.2 检验两个总体的分布是否相同的第二种方法: Wilcoxon秩和检验法(序号和检验法)
3.1.3 检验两个总体的分布是否相同的第三种方法: Mann-Whitney秩和检验法(序号和检验法)
配对
1 2 3 4 5 6 7 8 9 10 11 12
得 分
实验组
X1
18
20
26
14
25 25
21 12
14
17
20
19
对照组 X2 14 20 23 12 29 18 21 10 16 13 17 25
h
16
解:(1)建立假设。H0 :颜色教学无显著效果; H1 :颜色教学有显著效果
(2)求差数并记符号,差值计算列于下表。
2)两样本观察顺序不能各自独立地 颠倒。
h
5
配对样本可以是同一研究对象分别给 于两种不同处理的效果比较的观察值; 或,同一研究对象处理前后的效果比 较的观察值。
h
6
配对样本示例
例:某种干电池,在一定温度下存放之 后它的电压有可能升高也可能降低。我 们取10个样品做实验。数据如下:
编号 1 2 3 4 5 6 7 8 9 10 存前电压 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 存后电压 1.9 1.8 1.7 1.6 1.5 1.4 1.3 1.2 1.1 1.0
得 分
实验组
X1
18
20
26
14
25 25
21 12
14
17
20
19
对照组 X2 14 20 23 12 29 18 21 10 16 13 17 25
差数符号 + 0 + + - + 0 + - + + -
h
17
练习∶
某研究测定了噪声刺激前后15只羊的心率,结果 见下表。问噪声对羊的心率有无显著影响? 已知, K0.05(15)=3 , K0.01(15) = 2 。
检 验 的 统 计 量 为 K , K 为 n+ 、 n- 中 的 较 小 者 , 即
K=min{n+,n-}
h
13
(3)统计推断
由m查表得临界值K0.05(m),K0.01(m),作统计推断: 如果K>K0.05(m),即P>0.05,则不能否定HO,
两个试验处理差异Байду номын сангаас显著;
如果K0.01(m)<K≤K0.05(m),即0.01<P≤0.05,则否 定HO,接受H1,两个试验处理差异显著;
yi yi
A=A1+A2+...+An服从二项分布
即,在H0:F(x)=G(y)的假设下,可以把抽样 过程看成一个近似的贝努利实验,服从B(m,p)
分布。
h
10
h
11
1. 小样本情况下,正负号个数检验法的处理 (方法一)
如果实际的“xi-yi>0 的个数n+”在(k1,k2)中,就接受 H0:p=0.5(即F(x)=G(y)),否h 则,拒绝H0,认为p≠0.5,即 12 F(x)≠G(y)。
1. 小样本情况下,正负号个数检验法的处理 (方法二)
(1)建立假设
零假设H0 : F(x)G(y) 备择假设H1 :F(x)G(y)
(2)计算差值d并赋予符号
d=xi-yi
d>0,记为“+”,总个数记为n+
d<0,记为“-”, 总个数记为n-
d=0, 记为“0”, 总个数记为n0
m= n++ n-
配对号 1 2 3 4 5 6 7 8 9 甲 组 8.7 9.3 8.2 9.0 7.6 8.9 8.1 9.5 8.4
乙 组 7.8 8.2 8.4 8.1 7.9 8.0 8.2 8.1 6.8
这两组观察数据即为配对样本。
h
9
令xi>yi的事件为Ai ,其取值为1,0
于是
Ai
10,,xxii
这两组观察数据即为配对样本。
h
7
例:为了探索长跑对学生体质发展的影响, 随机抽取同年龄男生8名,经5个月长跑训 练,观测训练前、后心脏功能是否有所增强, 用晨脉这个指标来反映,训练前、后的晨脉 测试结果如下表,问长跑对晨脉的影响有无 显著意义?
训练前、后晨脉数据表
编号 1 2 3 4 训练前 70 66 56 63 训练后 48 54 52 62
如果K≤K0.01(m),即P≤0.01,则否定HO,接受H1,
两个试验处理差异极显著。
h
14
符号检验统计判断规则
K与临界值的比较
P值
显著性
K> K0.05(m)
K0.01(m)<K≤K0.05(m)
K≤K0.01(m)
P>0.05 0.01<P≤0.05
P≤0.01
不显著 显著
极显著
h
15
例:研究人员将三岁儿童经配对而成的 实验组进行颜色试验教学,对照组不进 行此种教学。后期测验得分如下表。问 颜色教学是否有显著效果?已知K0.05(10)=1。
相关文档
最新文档