从数据到结论(人民大学吴喜之教授)03统计推断S

合集下载

统计学:从数据到结论(人大吴喜之老

统计学:从数据到结论(人大吴喜之老

高三男生身 高
170
160
150
§3.1.1 定量变量的图表示:3.茎叶图
• 在直方图和盒形图中,很难恢复数据 的原貌。而另一种图:茎叶图(stemand-leaf plots)可以恢复数据 • 以地区1高三男生身高为例(图3.3), 茎叶图既展示了分布形状又有原始数 据。它象一片带有茎的叶子。茎为较 大位数的数字,叶为较小位数的数字。
§3.2 如何用少量数字来概括数据?
• 概括统计量经常对应于总体 的无法观测到的某些参数。 • 这时,统计量可作为这些参 数的估计。一些统计量还可 以用来检验样本和假设的总 体是否一致。
§3.2 如何用少量数字来概括数据?
• 注:一些统计量前面有时加 上“样本”二字,以区别于 总体的同名参数。如“样本 均值”和“样本标准差”, 以区别于总体均值和总体标 准差;但在不会混淆时可以 只说“均值”和“标准差”。
40
-3 -2 -1 0 x 1 2 3
80
60
20
40
0
0
-3
20
60
80
-2
-1
0 y
1
2
3
图 3.7 两个尺度不同的数据的直方图,左边的标准差大约只有右边的一半
§3.2.3 数据的标准得分
• 假定两个水平类似的班级(一 班和二班)上同一门课, • 但是由于两个任课老师的评分 标准不同,使得两个班成绩的 均值和标准差都不一样(数据: grade.txt)。
30
40
直方图
20
10
0 150.0 155.0 160.0 165.0 170.0 175.0 180.0 185.0 190.0 195.0 200.0

从问卷调查数据中可以得到什么_吴喜之

从问卷调查数据中可以得到什么_吴喜之

现在考虑分母 是两 个范 畴的 交的 观测 数 , 而分 子 为 一个范畴和分母范畴交的观 测数目 的情况。那 么在理 论 上可 能 出 现 的 14998946 个 比 例 之 中 , 只 有 4236996 ( 281 24% ) 个可 以用 正 态 近 似计 算 置 信 区间 , 有 1314769 ( 81 77% ) 个 分 子 和 分 母 的 范 畴 之 交 为 空 集 , 有 9447181 ( 621 99% ) 不能用正态近似计算置信区间。 这个结果展 示 在下面 的饼图之中。这里出现 大量的空 集是因 为总的 数 据量不够 大 , 使得 许多 搭配 是空 集。在 后面 关于 由问 卷 各个问题所组成的列联表的讨 论中还会 遇到相 对稀疏 数 据的现象。即使总观测值非常 大 , 只要问 卷的问题 多 , 这 种问题还是不可避免的。因此要 有得不 到预期 ( 比 例 ) 结 果的思想准备。 在可用的 4236996 个比例的误差 ? 3% 的置 信度中 只 有 79652 个 ( 11 88% ) 大 于或 等于 95% 。 这和 近一 千五 百 万的总 数比起来简直微不 足道。绝大 部分 ( 有 591 49% 的 比例 ) 的置 信度小 于 50% 。这 4236996 个误 差 ? 3% 的 置 信度由下面的直方图显示。
这里 P 为样本比 例 , n 为样本量 ( 即比例的分母 ) , z A P 2 满足 5 ( zA P2。首先 , 要 利用这 个近似 公式 , 样本量 必 P 2 ) = 1- A 须足够大。一个 近似 地判 断是 否是 大样 本的 方法 是 : 区 间 P? 3 P ( 1- P ) n 图1
一、 问题的提出
抽样调查 在我 国起 步较 晚 , 但 发展 迅速 。在我 们 周 围 , 进行着各种形式的调 查。但是 许多兴 师动众、 耗费 巨 资的大型问卷调查的最后报告却 主要由 许多描 述性的 各 种比例所组成 ; 这些比例用 各种图 表显示 , 给人 以深刻 印 象。这些大量展示的 比例实际上 是更深 入分析 的素材 或 出发点 , 而不 是结 论或 决策。 因为 很难 想象 有多 少决 策 者有耐心从头到尾阅读这种 报告的 全文。即使 是这些 在 报告中占大量篇幅的比例 , 也大多 没有说 明其可 信程度。 比如 , 调查本身可能是在很 大数目 的人群 中进行 ; 但结 论 中为得到某比 例而 用于 分母 范畴 的 人群 却可 能很 小 , 使

吴喜之-统计学基本概念和方法-第五章总体参数的估计分析

吴喜之-统计学基本概念和方法-第五章总体参数的估计分析

例4.对某型号的20辆汽车记录其每5升汽油的行 驶里程(千米),观测数据如下: 29.8 27.6 28.3 27.9 30.1 28.7 29.9 28.0 27.9 28.7
28.4 27.2 29.5 28.5 28.0 30.0 29.1 29.8 29.6 26.9
总体X: 该型号汽车每5升汽油的行驶里程,
例5 设盒内有黑,白两种球,个数之比是9比1,但不知道 哪种球多,有放回取三次,每次取一球,发现第一,三 次取到白球,第二次取到黑球,判断哪种球多?
解 : 设白球比例是 p,到底是0.9还是0.1呢?
如果 p=0.1, P( A) 0.12 0.9 0.009 如果 p=0.9, P( A) 0.92 0.1 0.081

用估计量估计总体参数
• 人们往往先假定某数据来自一个特定的总体族(比如 正态分布族)
• 而要确定是总体族的哪个成员则需要知道总体参数值 (比如总体均值和总体方差)
• 人们于是可以用相应的样本统计量(比如样本均值和 样本方差)来估计相应的总体参数
用估计量估计总体参数
• 一些常见的涉及总体的参数包括总体均值(m)、总 体标准差(s)或方差(s2)和(Bernoulli试验中)成功概 率p等(总体中含有某种特征的个体之比例)。
可用矩估计法估计其均值和标准差
x x1 x2 x20 29.8 27.6 26.9 28.695 (千米)
20
20
s
1 19
20 i1
( xi
x)2
1 19
20
( xi
28.695)2 0.98
(千米)
i1
总体均值,总体标准差的估计分别为 28.695,0.98.

从数据到结论(人民大学吴喜之教授)03统计推断S

从数据到结论(人民大学吴喜之教授)03统计推断S
结从 论数 的据 过得 程到 对 现 实 世 界 的
统 计 推 断
估计
• 总体代表我们所关心的那部分世界。 • 而在利用样本中的信息来对总体进行推断 之前人们往往对代表总体的变量假定了分 布族。(描述数据时不用假定) • 比如假定人们的身高属于正态分布族;在 抽样调查时假定了二项分布族等等(这些假 定可能有风险!)。 • 这些模型基本上是根据“经验”来假定的, 仅仅是对现实世界的一个近似。
一个描述性例子
一个描述性例子 • 实际上,第二个调查隐瞒了置信 度(等价于隐瞒了样本量)。 • 如果第二个调查仅仅调查了50个 人,有35个人反对该观点。根据 后面的公式可以算出,第二个调 查的置信区间的置信度仅有11%。
• 置信度的概念大量重复抽样时的一 个渐近概念。 • 类似于“我们目前得到的置信度为 95% 的 置 信 区 间 ( 比 如 上 面 的 75%±3%)以概率0.95覆盖真正的 比例p”的说法是错误的。 • 实际上应该说“重复类似的抽样所 得到的大量区间中有大约95%的覆 盖真实比例(其值可能永远未知)。
估计
• 在假定了总体分布族之后,进一步 对总体的认识就是要在这个分布族 中选择一个适合于我们问题的成员 • 由于分布族成员是由参数确定的, 如果参数能够估计,对总体的具体 分布就知道得差不多了。
估计量是用来估计的统计量
• 我们知道,统计量是样本的不包含 未知参数的函数。样本均值、样本 标准差都是统计量。 • 由于样本是随机的,统计量也是随 机变量。 • 用于估计总体参数的统计量称为估 计量;样本均值和标准差都是总体 均值和标准差的常用估计量。
假设检验的过程和逻辑
• 根据零假设(不是备选假设!),我们可 以得到该检验统计量的分布; • 然后再看这个统计量的数据实现值 (realization)属不属于小概率事件。也就 是说把数据代入检验统计量,看其值是否 落入零假设下的小概率范畴 • 如果的确是小概率事件,那么我们就有可 能拒绝零假设,否则我们说没有足够证据 拒绝零假设。

统计学简史(吴喜之)

统计学简史(吴喜之)

统计学简史H.O.Lancaster中国人民大学统计学系吴喜之译l.起源,分布统计是初产生于研究对国家,特别是对其经济以及人口的描述。

当时现代数学尚未形成。

因此那时的统计史基本上是经济史的范畴。

现代统计主要起源于研究总体(population),变差(variation)和简化数据(reduction of data)。

第一个经典文献属于John Graunt(1620-1674),其具有技巧的分析指出了把一些庞杂、令人糊涂的数据化简为几个说明问题的表格的价值。

他注意到在非瘟疫时期,一个大城市每年死亡数有统计规律,而且出生儿的性别比为1.08,即每生13个女孩就有14个男孩。

大城市的死亡率比农村地区要高。

在考虑了已知原因的死亡及不知死亡年龄的情况下,Graunt估计出了六岁之前儿童的死亡率,并相当合理地估计出了母亲的死亡率为1.5%。

因此,他从杂乱无章的材料中得出了重要的结论。

他还给出了一个新的生命表。

Edmond Helley(哈雷)(1656-1742)利用了Breslau的记有死亡年龄的数据,改进了Graunt的生命表并引进了死亡率的定义。

瑞士数学家 Leonhard Euler(欧拉)(1707-1783)提出了平稳生命表的概念。

John DeWitt(625-1672)等人最早讨论退休金和人寿保险的方案。

Thomas Robert Malthus(马尔萨斯)(1766-1834),Alfred James lotke(1880-1949),Ronald Aylmer Fisher (费歇)(1890-1962),及 William Feller(费尔勒)(1906-1970)等人用渐趋复杂的数学来研究生命表的理论,这对人类及其它总体的动方学描述具有显著意义。

William Petty(1623-1687)是Graunt同时代的经济学家及朋友。

他认为需要建立中央统计部来利用人口统计学的知识;由行政区利用列出记录年龄,性别,婚姻状况等细节的记录表格来收集数据;要有出生,死亡,婚姻,收入,教育和商业等方面的统计数据。

统计学:从概念到数据分析-吴喜之-CH1 引言

统计学:从概念到数据分析-吴喜之-CH1 引言

统计对象的特点
• 类似于其它科学,统计学也是在现实世界中 收集各种证据,试图找出一些规律或模型来 描述所研究的对象。 不同的是,那些自然科学本身的规律是比较 确定的(如叙述简洁的牛顿定律) 。 但世界上有许多事务是无法用这些确定性的 理论来描述的。
• •
统计对象的特点
• 比如,一个企业家去年增加投资可能利 润也增加,而今年增加投资就可能赔本。 • 再如保险公司希望减少汽车保险中的风 险,这就需要找出具有哪些特征的人群 具有高风险。 • 逻辑推理?ÅÆ分析相关的数据?
一些问题
你想过下面的问题吗?
• 当你买了一台电视时,被告知三年内可以免 费保修。你想过厂家凭什么这样说吗? • 在同一年级中,同样统计学的课程可能由一 些不同教师讲授。考试题目也不一定相同。 那么如何比较不同班级的统计学成绩呢? • 大学排名是一个非常敏感的问题。不同的机 构得出不同的结果;各自都说自己是客观、 公正和有道理的。到底如何理解这些不同的 结果呢?
权力、宗教和意识形态对科学造成严重干扰
• 拥护哥白尼的 “ 天体运行论 ” 的布鲁诺被罗马教廷以 “异端分子和异端分子的老师”的罪名,于1600年2月 17日被烧死在罗马鲜花广场。 加利略由支持日心说于1633 年被罗马天主教廷判决 软禁,他在软禁中度过余生;结果使得地中海地区 的科学传统完全停止了。
• 实际的统计过程也可能有更少或更 多的步骤。这些步骤从时间上和资 源耗费方面并不均等。 • 一个统计学家或一个实际领域的工 作者可能仅参与其中的部分工作。
统计工作者的重要原则
• 统计工作者在为其它领域提供统计结论 时,必须同时提供你的结论可能犯错误的 可能性,而让熟悉该领域的工作者对于实 际问题来做决策。 • 在提供统计结论的同时避而不谈该结论可 能造成的风险是不负责任。 • 统计结论可能犯错误的概率本身不能代替 与实际问题相关的风险。

吴喜之-统计学基本概念和方法-第三章数据的描述

– Dim(A), nrow(A), ncol(A)
读写数据文件
• Read.table函数
– Rt<-read.table(“house.data”,head=T)
• Scan函数
– W<-scan(“wight.data”);
• Write函数
– Write.table,write.csv
数据的图形描述
• > lines( w.density, col="blue"); • > x<- 44:76; • >lines(x, dnorm(x, mean(w), sd(w)), col="red" );
盒型图
• • 简单一些的是盒形图(boxplot,又称箱图、箱线图、盒子图)。 图左边一个是根据地区1高三男生的身高数据所绘的盒形图; 其右边的图代表另一个地区(地区2)的高三学生的身高
– Labs<-Paste(“X”,1:6,sep=“”)
• 复数向量
– X<-seq(-pi,pi,by=pi/10) – y<-sin(x) – Z<-complex(re=x,im=y) – Plot(z)
数字,字符和向量
• 将向量定义成数组
– z<-1:12,Dim(z)<-c(3,4)
• 用array构造数组
– X<-array(1:20,dim=c(4,5))
• 用matrix构造矩阵
– A<-matrix(1:15,nrow=3,ncol=5,byrow=TRUE)
数字,字符和向量
• 数组下标
– A<-1:24,dim(A)<c(2,3,4) – A[1,2:3,2:3]; A[1, ,];

《从数据到结论》

《从数据到结论》(第二版)勘误吴喜之2009年1月8日以前发现的问题z 2页第23行:“拨出”改为“播出” z 17页第8行:把“预订”改成“预定”。

z 18页第9行:把“由于”改成“用于”。

z 18页第11行:把“评判断选择”改成“凭经验判断来选择”。

z 18页第13行:把“为非概率”改成“与概率”。

z 18页第14行:“定额抽样与非概率抽样中的的分层抽样类似”多了一个“的” z 24页第一行:去掉第4个字“是” z 27页第3行:“改行”改为“该行” z 31页图3.8 (a) 和 (b) 横轴说明:“部收入”改成“总收入” z 34页两处英文“pecentile”改为“percentile”z 39页第倒数第5行:把“Boxplot ”改成“boxplot ”。

z 39页第倒数第4行:把“pie ”改成“stem ”。

z57页倒数第3行:把“总体均值均值再除以总体标准差”改成“总体均值再除以均值的总体标准差”。

z 67页第5行:“(7,8)”改为“(7,0.8)”z 73页倒数第16、倒数第14、倒数第12行:把“对于一正态个变量”改成“对于一个正态个变量”z 73页倒数第10、倒数7行:把“对于两个正态变量”改成“对于两个独立正态变量” z 73页倒数第4、5行之间:加入一条“对于两个独立正态变量X 1和X 2:总体标准差为σ1和σ2,样本标准差分别为s 1和s 2。

作为第6条,而后面第6、7条顺延为第7、8条。

z 78页第3行:把“样本标准差”改成“样本方差”z 78页第11行:把“他们的期望都是?”改成“它们的期望都是μ” z 79页第3行:把“因此说”改成“因此,”z 60页倒数第2行:把“而”改成“如果X 的取值范围为整数,则有” z 82页倒数第3行:“α=0.025”改为“α/2=0.025” z 90页倒数第5行的: 上下限k 1和k 2应该满足21min (,,,)2max (,,,1)12k kk P N n k x k P N n k x αα=≤=−≥−改为:上限k 2应该为满足(,,,)2P N n k x α≤的最小的k ;而其下限k 1应该为满足(,,,1)12P N n k x α−≥−的最大的k 。

统计与数学_吴喜之

统计与数学数学是至今为止人类所创造的最丰富的而又最纯粹的逻辑体系,任何称得上“科学”的体系都需要数学来描述其模型。

纯粹数学和其他学科不同,它的基本思维方式是演绎,即从假设的模型或条件来推导出具体的结论。

数学世界为仅有的存在绝对的“是”与“非”的世界;其他学科的模型和我们所生活的现实世界则往往不存在绝对的“对”与“错”。

虽然人们从小就被告知“大灰狼”是“坏蛋”,但是谁又能说狼吃羊是错误的呢?是非完全是人类思维的产物,其标准随时代、环境、族群、历史和宗教等许多因素而异。

在纯粹的自然界中则绝对没有是非对错的。

并不是所有学科都能够如物理学那样用具有物理意义的数学模型来描述。

注意,这里所提的物理意义和物理模型代表物理、化学、天文、地理、生物等科学所研究对象的内在规律,并不仅限于物理学本身。

多数人文社会科学和许多自然科学中的现象并不能用具有物理意义的模型来描述;它们所应用的数学模型是从实际观测数据归纳而来的;模型中的参数即使能够用来解释事物之间的一些关系,也不像物理模型那么确定、精确和具有明确的物理解释。

这里从数据到取得数学模型的过程称为归纳;而归纳是典型的统计学思维方式。

统计学是迄今为止最完善的从数据中通过归纳取得数学模型的科学。

它服务于几乎所有领域,但又不从属于任何具体的学科。

只要有数据的地方,就有统计的用武之地。

所以有人不无道理地建议把“统计”改名为“数据分析”。

要处理数据和得到数学模型,统计学和数学及计算机科学关系最密切;而在实践中又必须与那些和研究对象相关联的学科密切结合。

统计可以按照不同的研究对象来分类,如生物统计、经济金融统计和人文社会统计等;而这些统计应用体系所共有的数学模型的产生和研究则往往被称为数理统计。

而数理统计的分支则不一定按照对象,而往往按照理论和方法来归类,如多元分析,时间序列,贝叶斯统计,非参数统计等等。

统计与物理有很多相似之处。

比如,它们的模型都可以根据数据来产生和验证,它们都是在否定旧模型中发展的。

统计学从数据到结论(人大吴喜之老师)01一些基本概念精品PPT课件

• 有些概率是无法精确推断的。 • 比如你明天感冒的概率 • 有些概率是可以知道的。 • 比如在打桥牌时得到一手黑桃的概
率 为 1/635013559600 , 大 约 为 1.574770×10-12(条件是洗牌均匀, 没有作弊)。实际上得任何特定的 一手牌的概率都是一样的,对吗?
§1.3 变量和数据
• 什么是概率(probability)? • 新闻中最常见的是“降水概率” • 从某种意义说来,概率描述了某件事
情发生的机会。
• 显然,这种概率不可能超过百分之百, 也不可能少于百分之零。
• 概率是在0和1之间(也可能是0或1) 的一个数,描述某事件发生的机会。
§1.2 现实中的随机性和规律性,概率和机会
统计学
─从数据到结论
第一章 一些基本概念
§1.1 统计是什么?
• 统计是人类思维的一个归纳过程 • 站在一个路口,看到每过去20辆
小轿车时,也有100辆自行车通过 • 而且平均每10个轿车载有12个人 • 于是,你认为小汽车和自行车在
这个路口的运载能力为24:100 • 这是一个典型的统计思维过程
是统计。
§1.2 现实中的随机性和规律性,概率和机会
• 从中学起,我们就知道物理 学F=的m许a等多等定律,例如v=v0+at;
• 但是在许多领域,很难用如 此确定的公式或论述来描述 一些现象。
§1.2 现实中的随机性和规律性,概率和机会
• 一些现象既有规律性又有随 机性(randomness)
(qualitative variable,或categorical
variable)。 • 这些定性变量也可以由定量 变量来描述,如男女生的数 目,持有某观点的人数比例 等等。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

区间估计的例子(2)
• (a)我们想要分别得到这两个总体均值和标准 差的点估计(即样本均值和样本标准差)和各 自总体均值的95%置信区间。利用height2.sav, SPSS得到:作为两个总体均值估计量的样本均 值分别为170.56和165.60,而样本标准差分别为 6.97857和7.55659;还得到均值的置信区间分别 是(168.5767, 172.5433)及(163.4524, 167.7476)。 (计算机输出很容易明白,这里不显示。) • (b)求两个均值差m1-m2的点估计和95%置信区间。 根据数据height2.sav,利用软件很容易得到下 面结果
总体比例(Bernoulli试验成功概率)p的 区间估计 (大总体、大样本)
ˆ p z / 2
ˆ ˆ p (1 p ) n
,
ˆ p z / 2
ˆ ˆ p (1 p ) n
例5.3 在一个大都市中对1341人的随机调查结果显示,有934个人 支持限制小轿车的政策。假定该样本为简单随机样本,希望找出 总体中支持限制小轿车的人的比例的点估计及其置信度为95%的 置信区间。 n=1341;x=934 CI1=function(n,x,alpha){p=x/n;za=qnorm(alpha/2,low=F) a=sqrt(p*(1-p)/n);b=za*a;L1=p-b;L2=p+b;list(1-alpha,L1,L2)} CI1(n,x,.05) 得到(0.672, 0.721)
假设检验的过程和逻辑
• 首先要提出一个原假设,比如某正态 总体的均值等于5(m=5)。这种原假 设也称为零假设(null hypothesis), 记为H0 • 与此同时必须提出对立假设,比如总 体均值大于5(m>5)。对立假设又称 为备选假设或备择假设(alternative hypothesis)记为记为H1或Ha
不同样本量和不同置信度的置信区间的长短和覆盖状况
(a) n 50, 1 0.95 (b) n 20, 1 0.95
Байду номын сангаас(c) n 50, 1 0.6
(d) n 20, 1 0.6
区间估计的例子(2)
• 例5.2 (数据:height2.txt, height2.sav, height21.sav, height22.sas7bdat)这是两个地区 大学生的高度数据;这里,我们假定身高服从 正态分布。在height2.sav数据中这两个地区学生 的高度分别用变量x1和x2表示。而在 height21.sav数据中,它们为一个变量height,但 用另一个变量group来标明它们属于哪个地区。
s , x t / 2 n
x t / 2
s n
w=scan("D:/booktj1/data/noodle.txt");hist(w,10)
Histogram of w
14 Frequency 0
435
2
4
6
8
10
12
440
445
450 w
455
460
465
summary(w) Min. 1st Qu. Median Mean 3rd Qu. Max. 439.6 444.6 448.9 449.0 452.6 461.1
SPSS
Descriptives ( 描 述 统 计 量 ) 结 果 变量 w eight 统计量 Mean( 样 本 均数 ) 95% Confidence Interval for Mean ( 总 体 均数 的 95%可 信 区间 ) Low er Bound( 下 限 ) Upper Bound( 上 限 ) Median( 中 位 数) Variance( 方 差 ) Std. Deviation( 标 准 差) Minimum( 最 小 值) Maximum( 最 大 值) Range( 极 差 ) Interquartile Range( 四 分 位数 极 差 ) 统 计 量值 449.0104 447.4124 450.6084 448.9500 30.287 5.50339 439.60 461.10 21.50 8.18 标 准 误差 .79435
假设检验的过程和逻辑
• 根据零假设(不是备选假设!),我们可 以得到该检验统计量的分布; • 然后再看这个统计量的数据实现值 (realization)属不属于小概率事件。也就 是说把数据代入检验统计量,看其值是否 落入零假设下的小概率范畴 • 如果的确是小概率事件,那么我们就有可 能拒绝零假设,否则我们说没有足够证据 拒绝零假设。
区间估计
• 注意置信区间的论述是由区间和置信 度两部分组成。 • 置信区间是对参数给出的一个范围 • 置信度为其可信程度(大样本意义) • 有些新闻媒体报道一些调查结果只给 出百分比和误差(即置信区间),比 如 “收视率为53%±3%”; 不给出置信 度,也不给出被调查的人数 • 这是不负责的表现。
总体标准差已知
, x z / 2 n
x z / 2

n
总体标准差未知
s , x t / 2 n x t / 2 s n
区间估计的例子(1)
例5.1 (数据:noodle.txt, noodle.sav, noodle.sas7bdat)某 厂家生产的挂面包装上写明“净含量450克”。在用天平 称量了商场中的48包挂面之后,得到样本量为48的关于挂 面重量(单位:克)的一个样本(我们假定,挂面重量所 代表的总体分布服从正态分布。 ):
假设检验
• 在假设检验中,一般要设立一个原 假设; • 而设立该假设的动机主要是企图利 用人们掌握的反映现实世界的数据 来找出假设和现实的矛盾,从而否 定这个假设。
假设检验
• 在多数统计教科书中(除了理论探讨之 外),假设检验都是以否定原假设为目标。 • 如否定不了,那就说明证据不足,无法否 定原假设。但这不能说明原假设正确。 • 很多教科书在这个问题上不适当地用“接 受原假设”的说法,犯了明显的低级逻辑 错误。
估计
• 在假定了总体分布族之后,进一步 对总体的认识就是要在这个分布族 中选择一个适合于我们问题的成员 • 由于分布族成员是由参数确定的, 如果参数能够估计,对总体的具体 分布就知道得差不多了。
估计量是用来估计的统计量
• 我们知道,统计量是样本的不包含 未知参数的函数。样本均值、样本 标准差都是统计量。 • 由于样本是随机的,统计量也是随 机变量。 • 用于估计总体参数的统计量称为估 计量;样本均值和标准差都是总体 均值和标准差的常用估计量。
449.5 461.1 457.5 444.7 456.1 454.7 441.5 446.0 454.9 446.2 457.3 446.1 456.7 451.4 452.5 452.4 442.0 452.1 452.8 442.9 449.8 452.4 458.5 442.7 447.9 450.5 448.3 451.4 449.7 446.7 441.7 455.6 442.9 451.3 452.9 457.2 448.5 444.5 443.1 442.3 439.6 446.5 447.2 445.8 449.4 441.6 444.7 441.4
Std. Error Difference 1.45466 1.45466
输出表的头两列是检验(见下面一章的检验)是否方差相等,如果 Sig下面的数目(下一章的p值概念)较大(比如大于0.05)则没有 证据认为这两个数据总体的方差不等,则看表的第一行结果,否则 认为方差不等,则看表的第二行结果。这里Sig(p值)等于0.556, 因此看第一行结果。于是,我们得到两个样本均值的差(4.9600), 另外还给出了两总体均值差的95%置信区间(2.073,7.847)。
区间估计
• 降低置信度可以使置信区间变窄(显 得“精确”),有误导读者之嫌。 • 如果给出被调查的人数,则内行可以 由此推算出置信度,反之亦然。
• 一个有10000个人回答的调查显示,同 意 某 种 观 点 的 人 的 比 例 为 70% ( 有 7000人同意),可以算出总体中同意 该 观 点 的 比 例 的 95% 置 信 区 间 为 (0.691,0.709); • 另一个调查声称有70%的比例反对该 种观点,还说总体中反对该观点的置 信区间也是(0.691,0.709)。
一个描述性例子
一个描述性例子 • 实际上,第二个调查隐瞒了置信 度(等价于隐瞒了样本量)。 • 如果第二个调查仅仅调查了50个 人,有35个人反对该观点。根据 后面的公式可以算出,第二个调 查的置信区间的置信度仅有11%。
• 置信度的概念大量重复抽样时的一 个渐近概念。 • 类似于“我们目前得到的置信度为 95% 的 置 信 区 间 ( 比 如 上 面 的 75%±3%)以概率0.95覆盖真正的 比例p”的说法是错误的。 • 实际上应该说“重复类似的抽样所 得到的大量区间中有大约95%的覆 盖真实比例(其值可能永远未知)。
总体比例(Bernoulli试验成功概率)之差 p1 -p2的区间估计 (大样本、大总体)
ˆ ˆ ( p1 p 2 ) z / 2 ˆ ˆ p1 (1 p1 ) n1 ˆ ˆ p 2 (1 p 2 ) n2
例5.4 在两个地区对于某商品认可与否的调查结果显示,第一个地 区被调查的950人中有423人认可,而在第二个地区的被调查的1102 人中只有215人认可。求这两个总体比例之差p1 -p2的95%置信区间。 得到(0.211,0.289)
F height Equal varianc es assumed Equal varianc es not assumed .332
Sig. .566
t 3.410 3.410
相关文档
最新文档