第2讲计量资料统计描述

相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
*在各层次中进行随机抽样。
*要求层内个体差异越小越好.层间差异 越大越好。
*优点是抽样误差小,不同层可采用不同 抽样方法,各层可独立进行分析。
第2讲计量资料统计描述
11
D、整群抽样
• 整群抽样不是按个体进行抽样,而是抽取由 个体组成的群体的抽样方法。如抽取的是该地 区若干个县的全体居民。整群抽样的主要持点 是以“群”为基本抽样单位。
第2讲计量资料统计描述
17
前讲回顾
统计资料的类型
• 变量、变量值
三种基本类型:
计量资料, 计数资料, 等级资料
*按变量值性质——定量资料和定性资料。
第2讲计量资料统计描述
18
计量资料的统计描述
第2讲计量资料统计描述
19
主要内容
• 频数表与频数图 • 计量资料的常用统计指标
(集中趋势 离散趋势) 正态分布 • 正常值范围估计
• 抛一枚硬币,是否国徽面一定向上?明天的股市 升还是降?某患者痊愈的可能性?这些问题的答 案都不可能绝对。
• 描述随机事件发生的可能性大小的数值,常用P来 表示。
• P的大小在0—1之间,越接近于1,说明发生的可 能性越大,越接近于0,说明发生的可能性越小。
通常一个事件的发生小于5%,就叫小概率事件。
可能会得到更有效的估计量 • 非概率抽样:抽样概率未知/无法计算,按主
观、有目的、为方便进行抽样;
• 不能计算抽样误差,或一般按简单随机抽样 计算误差。配额抽第2讲样计量资、料统滚计描述雪球/识别抽样 8
A 单纯随机抽样
*将调查总体的全部观察单位编号, *用抽签法或随机数字表法进行抽
样。*它是最基本的抽样方法,也是 其他抽样方法的基础。
第2讲计量资料统计描述
9
B 系统抽样
* 按照一定顺序机械地每隔若干个单 位抽取一个单位,又称机械抽样、
等距抽样。
*其抽样间隔=(总体数量/样本 含量),一般是随机找一个单位为起 点,以后按抽样间隔进行抽样。
第2讲计量资料统计描述
10
C 分层抽样
*先将总体中所有观察单位按主要特征(如 年龄、性别、病情轻重等)分为若干层次.
第2讲计量资料统计描述
20
第一节 频数表与频数图
原始计量资料
第2讲计量资料统计描述
21
一.几个基本概率
频数:当汇总大量的原始数据时,把数据按类型分组(组段), 其中每个组的数据个数,称为该组的频数。
频数表(频数分布):表示各组段频数的表格称为频数表或频数 分布。 表4-1计数P44,表4-2等级,表4-3计量 P45,
• 大多数得不到总体数据,参数是未知的 • 估计总体结果是统计学的目的之一
第2讲计量资料统计描述
5
3. 普查 与 抽样
• 普查:全面调查,根据研究目的确定总体, 人口普查,肿瘤普查
• 是社会学/卫生防疫的指标确定的依据 • 注意时效性、变化性 • 传染病报告制度,地震伤亡等都属于普查
第2讲计量资料统计描述
同质个体间的差异。来源于一些未加控制 或无法控制的甚至不明原因的因素。是统 计学存在的基础。
• 从本质上说:统计学就是通过对个体变异
的研究,揭示同质事物的本质特征与规律。
第2讲计量资料统计描述
3
2. 总 体 与 样 本
• 总体---参数(parameter)
根据研究目的确定的研究对象的全体,即性质相同的 所有观察对象的集合;分为有限总体和无限总体。
特点:没有倾向性,多次测量计算平均值 可以减小甚至消除随机测量误差。
第2讲计量资料统计描述
14
B、 抽样误差
由于抽样原因造成的样本指标与 总体指标之间的差别。
特点:有抽样,抽样误差就不 可避免。但抽样误差有规律,统 计上往往可以计算并在一定范围 内控制抽样误差。
第2讲计量资料统计描述
15
4. 频 率 与 概 率
• 频率:在实际工作中,当观察单位的例数足够多 时,可以用频率来代替概率。频率是概率的估计 值。
第2讲计量资料统计描述
16
小结
1. 统计工作的基本步骤是什么? 2. 统计资料分为几类? 特点?
判断:大学教授的年收入,欧洲的国家 数,血红蛋白含量,患者的资料情况。 3. 什么是总体? 什么是样本? 4. 基本的概率抽样方法是什么? 5. 什么是抽样误差? 如何减小? 能否避免?
的统计描述
第2讲计量资料统计描述
1
统计学中的几个基本概念
1、同质与变异 2、总体与样本 3、普查与抽样 4、参数与误差 5、频率与概率(小概率事件)
第2讲计量资料统计描述
2
1. 同 质 与 变 异
• 同质(homogeneity)
指事物某方面的性质、影响条件或背景相同或相 近
• 变异(variation)
• 抽样误差由小到大的依次为:
分层抽样 < 系统抽样 < 单纯随
机抽样 < 整群抽样。
思 考 题:普查和抽样有什么区别和联系?
第2讲计量资料统计描述
12
4. 误 差
误差:统计上泛指测量值与真值之差,样本指标与
总体指标之差。主要有二种:系统误差和随机误差
(随机测量误差,抽样误差)。
(1)系统误差:指数据搜集和测量过程中由于仪器不 准确、标准不规范等人为原因,造成观察结果呈倾向 性的偏大或偏小。
• 样本---统计量(statistics) 总体中的部分;研究对象。
• 总体与样本的关系
统计学解决的问题:正确从样本特征推测总体水平。
• 抽样:从总体中选择样本的过程。 • 样本量(sample size):样本所包含的个体数目。
第2讲计量资料统计描述
4
2. 总 体 与 样 本
• 参数:总体统计学特性的数字,包括总体 均数、总体方差、总体标准差;
6
3. 普查 与 抽样
选择样本的方法:概率抽样和非概率抽样
等概率抽样 非等概率抽样
抽单 样纯
随 机
样系 统 抽
样分 层 抽
样整 群 抽
第2讲计量资料统计描述
7
概率抽样、非概率抽样
• 概率抽样:每个对象被抽中的概率是已知/可 计算的Байду номын сангаас其样本统计量是参数估计和计算误 差的基础;
• 等概率抽样:随机抽样 • 不等概率抽样:多单位被抽取的概率不同,
特点:具有累加性、方向性、可避免性
(2).随机误差:由于一些非人为的偶然因素使得结 果或大或小,是不确定、不可预知的。
特点:无方向性、不能避免。
第2讲计量资料统计描述
13
A、 随机测量误差
在消除了系统误差的前提下,由于非人为 的偶然因素,对于同一样本多次测定结果不 完全一样,结果有时偏大有时偏小,没有倾 向性,这种误差叫随机测量误差。
相关文档
最新文档