医学统计学第1章绪论

合集下载

01医学统计学绪论

01医学统计学绪论

的风险,但一直无法证实。该项研究使用统计学方法确定
了服用叶酸组与对照组的差别不是简单偶然出现的,而是 归因于叶酸的作用。
Medical statistics
问题:

胃溃疡治疗新技术的研究结论为什么会出现错误?
为了证明服用叶酸的作用,应如何进行分组?
如何准确地估计两组出现神经管缺陷的发病率?

案例1:1962年美国医学学会杂志(JAMA)曾发表了一篇 关于胃溃疡治疗新技术的报告,该报告根据动物实验和24
名患者的临床试验结果得出结论,即将冷冻液导入胃中使
胃冷却可以缓解溃疡症状,之后这一研究成果在临床中被 广泛应用。后证实这种方法无效甚至有害。

案例2: 20世纪80年代早期,两项观察性研究结果提示孕 妇在怀孕期间补充维生素可以降低新生儿神经管缺陷(NTD)
Variable and data

定性数据:也称计数资料。变量的观测值是定性的 ,表现为互不相容的类别或属性。血型分为A、B、
O、AB等。

有序数据:也称半定量数据或等级资料。变量的观 测值是定性的,但各类别(属性)之间有程度或顺 序上的差别,如尿糖的化验结果分为-、+、++ 、+++。

统计分析方法的选用与数据类型有密切的关系。根

抽样误差(sampling error): 由于抽样而引起的
样本统计量与总体参数间的差异,在统计学上称为 抽样误差。

概率(probability):描述某事件发生可能性大
小的度量。事件A发生的概率可以写成 P (A),其
取值范围为 0 P(A) 1, P(A) 0 表示该事件不可
能发生, P(A) 1 表示该事件必然发生。

医学统计学复习资料(完整版)

医学统计学复习资料(完整版)

第1章绪论医学统计学是一门“运用统计学的原理和方法,研究医学科研中有关数据的收集、整理和分析的应用科学。

1.个体:又称观察单位,是统计研究的最基本单位,也是构成总体的最基本的观察单位。

2.总体:根据研究目的确定的同质观察单位某项指标测量值(观察值)的集合。

分为有限总体(明确规定了空间、时间、人群范围内有限个观察单位)和无限总体(无时间和空间范围的限制)。

反映总体特征的指标为参数,常用小写希腊字母表示。

3.样本:从总体中随机抽取的一部分有代表性的观察单位组成的整体。

(抽样,随机化原则,样本含量)根据样本资料计算出来的相应指标为统计量,常用大写英文字母表示。

4.抽样研究:从总体中随机抽取样本,根据样本信息推断总体特征的方法。

抽样误差是由随机抽样(样本的偶然性)造成的样本指标与总体指标之间、样本指标与样本指标之间的差异。

其根源在于总体中的个体存在变异性。

只要是抽样研究,就一定存在抽样误差,不能用样本的指标直接下结论。

统计分析主要是针对抽样误差而言。

5.变量(一个个体的任意“特征”);资料(变量值的集合),资料类型:①计量资料/定量资料/数值变量资料:表现为数值大小,一般有度量衡单位,又可分为连续型和离散型两类;②计数资料/定性资料/无序分类变量资料/名义变量资料:表现为互补相容的属性或类别,一般无度量衡单位,可分为二分类和多分类;③等级资料/半定量资料/有序分类变量资料:表现为等级大小或属性程度。

各类资料间可相互转化。

①可选分析方法有:t检验、方差分析、相关回归分析等;②可选分析方法有:χ2检验、z检验等;③可选分析方法有:秩和检验、Ridit分析等。

6.误差:实测值与真实值之差。

可分为随机误差(随机测量误差+抽样误差)与非随机误差(系统误差与非系统误差)。

①随机误差:是一类不恒定、随机变化的误差,由多种尚无法控制的因素引起,它是不可避免的;②系统误差:是实验过程中产生的误差,它的值或恒定不变,或遵循一定的变化规律,其产生原因往往是可知的或可以掌握的,它是可以消除或控制的;③非系统误差:又称过失误差,是指在实验过程中由于研究者偶然失误而造成的误差,可以消除。

医学统计学(PPT课件)绪论

医学统计学(PPT课件)绪论
国内1984年对《中华医学杂志》、《中华内科 杂志》、《中华外科杂志》、《中华妇产科杂志》 、《中华儿科杂志》595篇论文的调查结果,相对数 误用为11.2%,抽样方法误用15.9%,统计图表误用 11.7%。某研究者1996年对4586篇论文统计(中华 医学会系列杂志仅占6.9%),数据分析方法误用达 55.7%。
表1-1 120名正常成年男子红细胞计数值(1012/L)
5.12 5.13 4.58 4.31 4.09 4.41 4.33 4.58 4.24 5.45 4.32 4.84 4.91 5.14 5.25 4.89 4.79 4.90 5.09 4.64 5.14 5.46 4.66 4.20 4.21 3.73 5.17 5.79 5.46 4.49 4.85 5.28 4.78 4.32 4.94 5.21 4.68 5.09 4.68 4.91 5.13 5.26 3.84 4.17 4.56 3.52 6.00 4.05 4.92 4.87 4.28 4.46 5.03 5.69 5.25 4.56 5.53 4.58 4.86 4.97 4.70 4.28 4.37 5.33 4.78 4.75 5.39 5.27 4.89 6.18 4.13 5.22 4.44 4.13 4.43 4.02 5.86 5.12 5.36 3.86 4.68 5.48 5.31 4.53 4.83 4.11 3.29 4.18 4.13 4.06 3.42 4.68 4.52 5.19 3.70 5.51 4.64 4.92 4.93 4.90 3.92 5.04 4.70 4.54 3.95 4.40 4.31 3.77 4.16 4.58 5.35 3.71 5.27 4.52 5.21 4.37 4.80 4.75 3.86 5.69

医学统计学课后习题答案

医学统计学课后习题答案

医学统计学课后习题答案 Revised by Jack on December 14,2020医学统计学第一章 绪论答案名词解释:(1) 同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基础上各观察单位(或个体)之间的差异。

(2) 总体和样本:总体是根据研究目的确定的同质观察单位的全体。

样本是从总体中随机抽取的部分观察单位。

(3) 参数和统计量:根据总体个体值统计算出来的描述总体的特征量,称为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为样本统计量。

(4) 抽样误差:由抽样造成的样本统计量和总体参数的差别称为抽样误差。

(5) 概率:是描述随机事件发生的可能性大小的数值,用p 表示(6) 计量资料:由一群个体的变量值构成的资料称为计量资料。

(7) 计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称为计数资料。

(8) 等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为等级资料。

是非题:1. ×2. ×3. ×4. ×5. √6. √7. ×单选题:1. C2. E3. D4. C5. D6. B第二章 计量资料统计描述及正态分布答案名词解释:1. 平均数 是描述数据分布集中趋势(中心位置)和平均水平的指标2. 标准差 是描述数据分布离散程度(或变量变化的变异程度)的指标3. 标准正态分布 以μ服从均数为0、标准差为1的正态分布,这种正态分布称为标准状态分布。

4. 参考值范围 参考值范围也称正常值范围,医学上常把把绝大多数的某指标范围称为指标的正常值范围。

填空题:1. 计量,计数,等级2. 设计,收集资料,分析资料,整理资料。

3. σμχ-=u (变量变换)标准正态分布、0、1 4. σ± σ96.1± σ58.2± % 95% 99%5. %6.均数、标准差7. 全距、方差、标准差、变异系数8. σμ96.1± σμ58.2±9. 全距 R10. 检验水准、显着性水准、、 ()11. 80% 90% 95% 99% 95%12. 95% 99%13. 集中趋势、离散趋势14. 中位数15. 同质基础,合理分组16. 均数,均数,μ,σ,规律性17. 标准差18. 单位不同,均数相差较大是非题:1. ×2. √3. ×4. ×5. ×6. √7. √8. √9. √ 10. √11. √ 12. √ 13. × 14. √ 15. √ 16. × 17. × 18. × 19. √ 20. √21. √单选题:1. B2. D3. C4. A5. C6. D7. E8. A9. C 10. D11. B 12. C 13. C 14. C 15. A 16. C 17. E 18. C 19. D 20. C21. B 22. B 23. E 24. C 25. A 26. C 27. B 28. D 29. D 30. D31. A 32. E 33. D 34. A 35. D 36. D 37. C 38. E 39. D 40. B41. C 42. B 43. D 44. C 45. B问答题:1.均数﹑几何均数和中位数的适用范围有何异同答:相同点,均表示计量资料集中趋势的指标。

医学统计学课件-绪论

医学统计学课件-绪论
– 偏倚:志愿参加研究者更关心自己的健康: 注意饮食及营养,禁烟酒、坚持体锻。
2019年9月15日
健康工人偏倚
化学物质接触与白血病发生的队列研究; 研究组:接触苯的工人,对照组:普通工人; 结果:两组发生白血病比例相似; 结论:接触苯与白血病发生无关
2019年9月15日
非同期对照偏倚
2019年9月15日
三类资料间关系
例:一组2040岁成年人的血压
<8 低血压
等 8 正常血压
计量资料
级 资 料
12 15
轻度高血压 中度高血压
分类资料
17 重度高血压
以12kPa为界分为正常与异常两组,统计每组例

2019年9月15日
3. 误差 error
误差:实际观察值与客观真实值之差
2019年9月15日
2. 随机变量(random variable)
简称变量(variable) ,统计上习惯用大写 拉丁字母表示 ,如X 、Y 、Z、… 。
编号 性别 体重 疗效 (ID) (X) (kg) (Z)
(Y)
张1
1
66
0
李2
1
78
1
王3
0
57
2




2019年9月15日
(1). 计量资料
研究监护室建立在心梗中作用; 研究组:2019-2000年监护室建立后死
亡率15%,对照组:2019-2019年监护 室建立前死亡率25%; 结果:建立监护室减少心梗死亡率。
2019年9月15日
(2)随机误差random error
排除上述误差后尚存的误差,受多种无法控制 的因素的影响。976年New Science 杂志关于科研舞弊 行为的调查

医学统计学重点概要

医学统计学重点概要

第一章 绪论总体:根据研究目的确定的同质的所有观察单位某种变量值的集合。

总体包括有限总体和无限总体。

样本:从总体中随机抽取的部分观察单位,其实测值的集合。

获取样本仅仅是手段,通过样本信息来推断总体特性才是研究的目的。

资料的类型计量资料、计数资料和等级资料。

误差包括随机误差、系统误差和非系统误差。

抽样误差:由抽样造成的样本统计量和总体参数之间的差异或者是各个样本统计量之间的差异称为抽样误差。

概率:是描述随机事件发生可能性大小的一个度量。

取值范围0≤P ≤1。

小概率事件:表示在一次实验或观察中该事件发生的可能性很小,可以认为很可能不发生。

P ≤0.05或P ≤0.01。

医学统计学的步骤:设计、收集资料、整理资料和分析资料。

统计分析包括:统计描述和统计推断。

统计推断包括:参数估计和假设检验。

第二章计量资料的统计描述频数表和频数分布图的用途:(1)描述频数分布的类型,以便选择相应的统计指标和分析方法。

对称分布:集中位置在中间,左右两侧頻数基本对称。

偏态分布:正、负偏态分布正偏态集中位置偏向值小一侧,负偏态反之。

(2)描述頻数分布的特征;(3)便于发现资料中的可疑值;(4)便于进一步计算统计指标和进行统计分析。

计量资料集中趋势包括算术均数、几何均数和中位数。

算术均数:直接法(样本小):n x x ∑=;頻数表法(样本大)x =nfx ∑ 几何均数:直接法:)lg (lg 1n x G ∑-=;頻数表法)lg (lg )lg (lg 11n x f fx f G ∑∑∑--==(常用于等比资料或对数正态分布资料)中位数:直接法:n 为奇数2/)1(+=n x M ,n 为偶数2/)(12/2/++=n n x x M ;頻数表法:∑-⨯+=)%50(L M M f n f iL M 。

中位数的应用注意事项:可用于各种分布资料,不受极端值的影响,主要用于(1)偏态分布资料(2)端点无确切值的资料(3)分布不明确的资料。

医学统计学第一章ppt课件

医学统计学第一章ppt课件

ppt课件.
16
+ 统计不是万能的:统计只能认识规律而不能“创造” 规律。 对统计结论的解释也要由专业知识解释
如:对出生性别比(103~107:100)的认识和解释
ppt课件.
17
+ 统计分析手段需要有正确的医学理论作指导,不 能将医学问题归结到纯粹的数量问题,否则会归 纳出错误的结论
如:在样本容量较大时,统计上有显著性和临床上 有实际价值有时候是两码事 实例:采用某种降压新药和传统药物治疗高血压 病人,各500 例,新药比传统药物平均多下降 0.5mmHg.
1. 使大家具备新的推理思维,学会从不确定性和概 率的角度去考虑问题
(借你一双慧眼!透过现象看清本质)
2. 学会结合专业问题合理设计试验,通过精细的试验 观察获得可靠、准确的资料
注:统计学的主要作用是体现在“统计研究设计”上
ppt课件.
14
3. 学会正确运用统计方法充分挖掘资料中隐含的信 息,并能恰如其分地作出理性概括,写成具有一 定学术水平的研究报告或科学论文。
ppt课件.
18
1.2 几个基本概念
1.2.1 同质
性质相同的事物称为同质的,否则称为异质 的或间杂的。
观察单位间的同质性是进行研究的前提
不同研究或同一研究中不同观察指标对观察对象的 同质性的要求不同,即同质是相对的。
如研究身高和红细胞数、血红蛋白等指标时,男女是异质的, 而在研究白细胞数指标时又是同质的。
+ 小概率原理是统计推断的一条重要原理
ppt课件.
34
ppt课件.
返回
35
Ronald A. Fisher(费歇尔,1890~1962),英国统计 学家和遗传学家,现代统计学的奠基人

(完整版)医学统计学复习要点

(完整版)医学统计学复习要点

(完整版)医学统计学复习要点第⼀章绪论1、数据/资料的分类:①、计量资料,⼜称定量资料或者数值变量;为观测每个观察单位某项治疗的⼤⼩⽽获得的资料。

②、计数资料,⼜称定性资料或者⽆序分类变量;为将观察单位按照某种属性或者类别分组计数,分组汇总各组观察单位数后⽽得到的资料。

③、等级资料,⼜称半定量资料或者有序分类变量。

为将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后⽽得到的资料。

2、统计学常⽤基本概念:①、统计学(statistics)是关于数据的科学与艺术,包括设计、搜集、整理、分析和表达等步骤,从数据中提炼新的有科学价值的信息。

②、总体(population)指的是根据研究⽬的⽽确定的同质观察单位的全体。

③、医学统计学(medical statistics):⽤统计学的原理和⽅法处理医学资料中的同质性和变异性的科学和艺术,通过⼀定数量的观察、对⽐、分析,揭⽰那些困惑费解的医学问题背后的规律性。

④、样本(sample):指的是从总体中随机抽取的部分观察单位。

⑤、变量(variable):对观察单位某项特征进⾏测量或者观察,这种特征称为变量。

⑥、频率(frequency):指的是样本的实际发⽣率。

⑦、概率(probability):指的是随机事件发⽣的可能性⼤⼩。

⽤⼤写的P表⽰。

3、统计⼯作的基本步骤:①、统计设计:包括对资料的收集、整理和分析全过程的设想与安排;②、收集资料:采取措施取得准确可靠的原始数据;③、整理资料:将原始数据净化、系统化和条理化;④、分析资料:包括统计描述和统计推断两个⽅⾯。

第⼆章计量资料的统计描述1. 频数表的编制⽅法,频数分布的类型及频数表的⽤途①、求极差(range):也称全距,即最⼤值和最⼩值之差,记作R;②、确定组段数和组距,组段数通常取10-15组;③、根据组距写出组段,每个组段的下限为L,上限为U,变量X值得归组统⼀定为L≤X<U,最后⼀组包括下限。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

例:瓶中有50片药,其中3片次品
一次取一片,取得次品的概率: 3/50=0.06 一次取5片, 5片中有2片是次品的概率:
CC C
3 5 50
2
3 47

9 0.023 362
三、概率的运算
1.加法定理
⑴互斥事件的加法定理 若事件A与B互斥,则P(A+B)=P(A)+P(B)。 证明:设试验的全部结果包含n个基本事件,而事件A 包含其中m1个基本事件,事件B包含其中m2个基本事件。 由于A与B互斥,故A+B包含的基本事件数为m1+m2,按 古典定义有P(A+B)=m1/n+m2/n=P(A)+P(B). 若n个事件互斥,则P(A1+A2+┄+An) =P(A1)+ P(A2)+ ┄+P(An) 若n个事件构成互斥完备群,则
(二)按统计学方法的层次划分
1. 基本统计方法
绪论(一章) 统计图表(二章) 定量资料的统计描述(三章) 定性资料的统计描述(四章) 参数估计(五章) 假设检验的基本概念 (六章)
两组样本均值比较的t检验(七章) 多组样本均值比较的方差分析(八章) 定性资料的统计推断 (九章) 非参数检验 (十章) 两变量间直线相关与回归分析(十一章) 实验设计(十二章) 调查设计(十三章) 样本含量的估计 (十八章) 生命统计的常用指标(二十章)
随访时间资料的生存分析(十六章) 判别分析——观察对象的分类分析(十六章) 重复测量定量资料均数间的比较(八章) Meta分析(第十九章)
第二节
统计学中的几个基本概念
观察单位(observed
unit)
根据研究目的所确定的卫生统计学研 究对象中的基本研究单位,可以是一个人 一头动物,一群人(如一个县,一个乡, 一个村,一所学校,一个家庭等);可 以是一个器官,一个细胞,一个采样点等
Hale Waihona Puke 附:事件与概率一、随机事件及其运算
1. 随机事件 必然现象:确定性现象 随机现象:不确定性现象,也称偶然现象 随机试验:对随机现象的观察 特征:⑴在相同条件下可重复进行;⑵各次试 验结果可不同,不能预先判断;⑶预先可明确所
有可能的结果,每次试验各结果必居其一。 随机事件:随机试验观察的结果,可能出现也可能 不可能出现的事件。 必然事件:Ω 不可能事件:Ф



无论是统计设计、资料收集、数据整理、 统计分析,只要某一个环节存在缺陷就有可 能导致整个研究的失败! 卫生统计学在卫生及其相关领域研究中 的地位举足轻重,是卫生工作者从事科学研 究必须掌握的一门基本技能。
第二节
卫生统计学的定义和内容
一、卫生统计学的定义
统计学的根本任务是揭露隐藏在偶 然现象背后的规律性,是认识世界 的重要工具。
3.整理资料
净化原始数据,使其系统化、条理化 统计表与统计图(第二章) 频数与频数分布(第三章第一节) 常用相对数(第四章第一节) 统计软件
4.分析资料
统计分析
统计描述 (二、三、四章) 参数估计 统计推断
(五、十一、十四、 十章、十六)
假设检验
(六、七、八、九、十、 十一、十四、十五、十 六章)
统计描述:统计表与统计图,数值变量的统计 描述,分类变量的统计描述,参考值范围 参数估计:总体均数的估计,总体率的估计, 回归模型参数的估计,总体相关系数的估计 假设检验 :两组数值变量或等级资料平均值 的比较,多组数值变量或等级资料平均值的 比较,分类变量的率或构成比的比较,回归 方程的假设检验,相关系数的假设检验,重 复测量设计资料均数间的比较
中国出生性别比(国际1.02~1.07:1): 82:1.085:1;90:1.118:1; 95:1.166:1;02:1.301:1; 已有两女孩家庭下一孩子性别比: 3.342:1
第 二 节 卫 生 统 计 学 的 定 义 和 内 容
卫生统计学 一门运用统
计学尤其是数理统计学的原
理和方法,研究医学科研及
同质和变异
当一批观察单位的主要条件(对 研究指标有影响的主要因素)相同时 称该批观察单位同质。同质基础上观 察单位间的差异称为变异。变异是由 不可控制的因素产生。
总体与样本
总体( population )根据研究目的所确定 的同质观察单位(某项特征观测值) 的集合。总体分有限总体和无限总体 样本( sample )从总体所对应的全部观察 单位中随机抽取的部分观察单位(某 项特征观测值)的集合。
A
i 1
i
举例:两个开关K1和K2并联后接入电路,设A={电路接通}, A1={K1闭合},A2={K2闭合},则 A= A1+ A2
⑷交事件:若事件C={A与B同时发生},则称C为A、B 两事件的交事件,记作C=AB。n个事件的交事件A记为: A=A1A2„An 例:两个开关K1和K2串联后接入电路,设A={电路接 通}, A1={K1闭合},A2={K2闭合},则 A= A1A2 ⑸互不相容事件:事件A与B不能同时发生,称A与B为 互不相容事件,也称互斥事件,记作AB=Ф。n个事件 互斥,是指它们两两互斥。 互斥完备群:若n个互斥事件的并事件是必然事件, 即 ,则称这n个事件构成 互斥完备群。 A A (1 i j n), 且 A
1.研究设计
包括资料收集、整理和分析全过程总 的设想和安排
实验设计(第十二章) 调查设计(第十三章)
2.收集资料
资料的三个来源: ①统计报表:法定传染病报表、职 业病报表、医院工作报表 ②经常性工作记录:卫生监测记录、 健康检查记录、门诊病历、住院病历 ③专题调查或实验: 实验设计(第十二章) 调查设计(第十三章)
卫生工作中有关科研的统计 设计,数据的收集、整理、
分析的科学。
第 二 节 医 学 统 计 学 的 定 义 和 内 容
二、卫生统计学的主要内容
(一)按卫生统计工作的 基本步骤划分:
统计设计 (statistical design) 搜集资料(co11ection of data) 整理资料(sorting data) 分析资料(analysis of data)
样本中所包含的观察单位的个数称为样 本含量(sample size) 随机抽样是指按随机原则从总体中获 取样本,(等概率抽样)总体中的每个个 体都有同等机会被抽取。
参数和统计量
参数 总体的指标称为参数,是指根据总体个
体值按有关统计公式计算出来的描述总 体特征量的统计指标。 统计量 根据样本数据按有关统计公式计算出 的用来描述样本的统计指标。 由样本信息来推断总体特征的方法 叫做抽样研究。
历史上许多科学家都做过投硬币实验: 次数n 正面朝上的次数nH 德.摩根 2048 1061 蒲丰 4040 2048 K.皮尔逊 12000 6019 K.皮尔逊 24000 12012
频率f 0.5181 0.5064 0.5016 0.5005
⑵概率的古典定义 一个随机试验,有n种 等可能的结果数,其中有利于事件A发生的 结果数为m,则事件A发生的概率等于m/n。
等级。血清反应:― 、±、+
各类别间无程度差别。
各类之间有程度差别,又称等级资料
各类变量之间的转化
定量资料
分类资料
等级资料
分正常、偏低两类
Hb (g/l)
贫血程度:重度、中度、 轻度、正常
二分类资料赋值:0、1 等级资料赋值:0、1、2、3、…… 非等级资料,禁止赋值:0、1、2、3、……
频率和概率
2. 高级统计方法
多因素对某定量指标 的影响分析——多重线 性回归 (十四章) 多因素对某定性指标 的影响分析—— Logistic回归 (十五 章)
糖尿病人的血清总胆固 醇X1、甘油三脂X2、空 腹胰岛素X3、糖化血红 蛋白X4与空腹血糖测量 值Y的关系
研究吸烟、饮酒 与食道癌关系的 病例-对照研究
n i j i=1 i
例:治疗某患者的结果,{痊愈}、{显效}、{微 效}、{无效}4事件构成互斥完备群。 ⑹对立事件: A与B不能同时发生,也不能同时不 发生,即: A+B=Ω且AB=Φ,称事件A与B对立, 记作
A B, 或A B( A为A的对立事件)
例:治疗某患者的结果, {有效}、{无效}2事件 构成对立事件。 对任一事件A,有: AA , A+ A , A A
现代实用卫生统计学
第一章 绪论
卫生统计学的作用和地位
卫生统计学的定义和内容
统计学中的几个基本概念
第一节 卫生统计学的作用和地位
案例:某疾控中心开展了一项研究,以了解当地肺 癌的患病情况,从10万人口中随机抽取2000人进 行调查,调查内容包括流行病学资料和临床实验室 检查资料。其中男性1100人,患肺癌者6人,女性 900人,患肺癌者3人。由此,研究者计算得出,男 性肺癌发病率为0.55%,女性肺癌发病率为0.33%, 并认为男性肺癌的发病率高于女性。 ①该研究者所选择的统计指标正确吗?应选用患病 率 ② “男性肺癌的发病率高于女性”的结论是否可 靠? 存在抽样误差,不能仅根据数据的大小直接下结论。
频率 将随机试验重复n次,n次试验中 随机事件 A 共发生 m 次,则 n/m 表示随 机事件A发生的频率。
频率和概率
概率 是描述随机事件发生的可能性大小,用P表示,
0 p 1
⑴概率的统计定义 当试验次数n趋向于 无穷的大时,频率m/n的极限值即为概率, m 即 。 P lim
n
n
0≤P≤1, 当P=0时称为不可能事件, 当P=1时称为必然事件。
概率推断 是按一定的概率用样本信息 推断总体的特征。即统计推断含有一定 概率。
小概率事件:P<0.05或P<0.01, 小概率事件原理:即小概率事件在一次 抽样中一般认为不会发生。
相关文档
最新文档