8=chap7两分类资料的统计描述与推断-PPT精选文档
合集下载
最新研究生统计学讲义第6讲第7章分类资料统计描述与推断PPT课件

研究生统计学讲义第6讲第7章 分类资料统计描述与推断
二项分布变量的标准差用相对数(率)表示时,称为
率的标准误,总体率的标准误记为σp,样本率的标准 误记为Sp,计算公式为:
p
(1)
n
Sp p(1p)/n (9.8)
二、 Poisson分布 Poisson分布(Poisson distribution)是一种重要的离散 型分布。适用条件:① 两分类的资料;② 所考察的事 件发生率π(一般用大样本率p来估计π)很小,n很大, nπ(或np)为一不大的常数;③ 事件的发生是独立的, 如各病人的患病与否与他人无关。如人群中,对某种 物质中过敏的人数,遗传缺陷、癌症等非传染性疾病 的发病例数;又如大量产品中不合格品出现的次数; 用显微镜观察片子上每一格子内的细菌数;细胞发生 某种变化或细菌死亡的数目等等,都服从或近似服从 Poisson分布。Poisson分布可视为二项分布的特例。 Poisson分布常用于研究单位容积(或面积、时间)内稀 有事件发生数的规律。
神外
291
53
0.75
23.3
18.21
合计
2126
227
—
100.0
10.7
表 7-1的①~③栏,表9-3第①、②列,都是将分类资料的观察结果,按照 分析的要求,分类汇总统计观察单位数(频数),列出的分类资料频数分布 表。表9-2中第②、③两栏及表9-3第②列的数据都是绝对数。绝对数说明 实际发生的绝对水平,是统计分析的基础。但仅使用绝对数,不能进行比 较分析研究
(2) 进行率的对比分析时,应注意资料有可比性。除 了被研究的因素之外,其余可能影响指标的重要因素 应控制在“齐同对比”的条件下。若两组分类资料的 诊断标准或疗效判断标准不一致,则组间缺乏可比性 ;若两组资料内部构成(如病人的性别、年龄、病程 及病情等)缺乏齐同性,则两个总率也不能直接进行 比较。如果需要直接比较总率,为了消除某一混杂因 素(如年龄,职业,病性等)对观察结果的影响,可作 率的标准化处理。
二项分布变量的标准差用相对数(率)表示时,称为
率的标准误,总体率的标准误记为σp,样本率的标准 误记为Sp,计算公式为:
p
(1)
n
Sp p(1p)/n (9.8)
二、 Poisson分布 Poisson分布(Poisson distribution)是一种重要的离散 型分布。适用条件:① 两分类的资料;② 所考察的事 件发生率π(一般用大样本率p来估计π)很小,n很大, nπ(或np)为一不大的常数;③ 事件的发生是独立的, 如各病人的患病与否与他人无关。如人群中,对某种 物质中过敏的人数,遗传缺陷、癌症等非传染性疾病 的发病例数;又如大量产品中不合格品出现的次数; 用显微镜观察片子上每一格子内的细菌数;细胞发生 某种变化或细菌死亡的数目等等,都服从或近似服从 Poisson分布。Poisson分布可视为二项分布的特例。 Poisson分布常用于研究单位容积(或面积、时间)内稀 有事件发生数的规律。
神外
291
53
0.75
23.3
18.21
合计
2126
227
—
100.0
10.7
表 7-1的①~③栏,表9-3第①、②列,都是将分类资料的观察结果,按照 分析的要求,分类汇总统计观察单位数(频数),列出的分类资料频数分布 表。表9-2中第②、③两栏及表9-3第②列的数据都是绝对数。绝对数说明 实际发生的绝对水平,是统计分析的基础。但仅使用绝对数,不能进行比 较分析研究
(2) 进行率的对比分析时,应注意资料有可比性。除 了被研究的因素之外,其余可能影响指标的重要因素 应控制在“齐同对比”的条件下。若两组分类资料的 诊断标准或疗效判断标准不一致,则组间缺乏可比性 ;若两组资料内部构成(如病人的性别、年龄、病程 及病情等)缺乏齐同性,则两个总率也不能直接进行 比较。如果需要直接比较总率,为了消除某一混杂因 素(如年龄,职业,病性等)对观察结果的影响,可作 率的标准化处理。
计数资料的统计描述和推断PPT课件

通过实例演示计数资料假设检验的步骤和方法,包括提出假 设、选择检验方法、确定样本量、收集数据、计算检验统计 量等。
详细描述
介绍假设检验的基本原理和方法,通过具体实例演示如何进 行计数资料的假设检验,包括提出假设、选择检验方法、确 定样本量、收集数据、计算检验统计量等步骤,说明假设检 验在数据分析中的意义和作用。
偏态”。
相对频数
各组的频数与数据总数 的比值,反映各组频数 在数据分布中的相对地
位。
描述性统计指标
01
02
03
04
计数
数据点的数量,即数据的规模 。
百分比
某一数据值占总数据值的比例 ,用于描述数据的相对大小。
比率
两个数据值的相对大小,用于 描述数据的相对位置。
中位数
将数据从小到大排列后,位于 中间位置的数据值,用于描述
报告结果
清晰地报告假设检验的结果,包括使用的统计量、显著 性水平、p值以及结论。
04 方差分析
方差分析的基本思想
方差分析是通过比较不同组别数据的 离散程度和平均水平,来检验各组之 间的差异是否显著的一种统计方法。
方差分析的基本思想是将总变异分解 为组间变异和组内变异,并比较两者 的大小,以判断各组之间是否存在显 著差异。
多元线性回归分析
多元线性回归分析涉及多个自变量和 一个因变量,并假定因变量和自变量 之间存在线性关系。
多元线性回归分析的步骤与一元线性 回归分析类似,但需要更多的计算和 统计方法来处理多个自变量之间的关 系和交互作用。
多元线性回归分析的目的是通过多个 自变量来预测因变量的值,并给出预 测值的范围和精度。
案例二:参数估计实例分析
总结词
通过实例演示如何利用参数估计方法对总体率或总体均数进行估计,比较不同估 计方法的优缺点。
详细描述
介绍假设检验的基本原理和方法,通过具体实例演示如何进 行计数资料的假设检验,包括提出假设、选择检验方法、确 定样本量、收集数据、计算检验统计量等步骤,说明假设检 验在数据分析中的意义和作用。
偏态”。
相对频数
各组的频数与数据总数 的比值,反映各组频数 在数据分布中的相对地
位。
描述性统计指标
01
02
03
04
计数
数据点的数量,即数据的规模 。
百分比
某一数据值占总数据值的比例 ,用于描述数据的相对大小。
比率
两个数据值的相对大小,用于 描述数据的相对位置。
中位数
将数据从小到大排列后,位于 中间位置的数据值,用于描述
报告结果
清晰地报告假设检验的结果,包括使用的统计量、显著 性水平、p值以及结论。
04 方差分析
方差分析的基本思想
方差分析是通过比较不同组别数据的 离散程度和平均水平,来检验各组之 间的差异是否显著的一种统计方法。
方差分析的基本思想是将总变异分解 为组间变异和组内变异,并比较两者 的大小,以判断各组之间是否存在显 著差异。
多元线性回归分析
多元线性回归分析涉及多个自变量和 一个因变量,并假定因变量和自变量 之间存在线性关系。
多元线性回归分析的步骤与一元线性 回归分析类似,但需要更多的计算和 统计方法来处理多个自变量之间的关 系和交互作用。
多元线性回归分析的目的是通过多个 自变量来预测因变量的值,并给出预 测值的范围和精度。
案例二:参数估计实例分析
总结词
通过实例演示如何利用参数估计方法对总体率或总体均数进行估计,比较不同估 计方法的优缺点。
分类资料统计推断-PPT精品文档

=
确定P值,作结论: 查t界值表中,υ= ∞ 时,u 0.05 = 1.96 , u 0.01 = 2.5758 , 因而 0.05 >P>0.01 , 则P<α, 拒绝H0, 接受H1, 可以认为两组发病率不同,用药组发病率低于对照组, 说明该草药有预防流感的作用
三、χ2 检验
χ2检验(Chi-square test)用途极广,这里 仅介绍它在分类变量资料中用于推断两 个或两个以上总体率(或构成比)之间 有无差别或有无关联的分析方法。
式中 n 为样本例数,X 为样本阳性数,样本率 p = X/n ;π0 为总体率; 0.5 为连续性校正数,当 n 较大时可以省去,而︱X— nπ︱≤ 0.5 时不 宜采用校正数。
例2 以往经验脑梗塞患者治疗三周的生活能力改善率为30 % ,某 医院用新疗法治疗38例的三周生活能力改善率为50 % ,能否认为新疗 法的改善率与以往不同? 此为样本率与总体率比较:且n p和 n(1-p) 都大于5,故用u检验。
1、总体率的估计:
总体率的估计有两种方法,一是正态分布法,二是 查表法。
★正态分布法 适用于样本较大,且p和/或1-p都不太小, 如np和n(1-p)都大于5时。计算公式为:
p u s , p u s
p p
★查表法 适用于小样本。利用样本含量2
8 7 . 1 0
甲 氰 咪 胍 组 合 计
4 4( 4 9 . 8 ) 9 8
2 0( 1 4 . 2 ) 2 8
6 4 1 2 6
6 8 . 7 5 7 7 . 7 8
设 H 0 : 1 2 H 1: 1 2
α= 0.05 计算统计量χ2值: χ2值的基本公式为:
2
《推断统计》课件

推断统计的局限性和注意事项
1 样本误差
样本数据有限,推断结果可能存在误差和不确定性。
2 样本偏倚
样本选择不充分或不具有代表性,推断结果可能失真。
总结和展望
推断统计学为我们提供了一种解释和利用数据的有效方法。随着技术的发展, 推断统计学在各个领域的应用将继续扩大。
推断和解释
4
行分析和解读。
基于样本结果,对总体特征进行推断 和解释。
案例分析:推断统计在市场调研中的应 用
研究目标
探索消费者购买行为和偏好,为市场推广提 供依据。
数据分析
运用推断统计方法对数据进行分析,发现消 费者喜好和购买模式。
数据收集
通过在线调查和购物记录采集大量消费者数 据。
结果解释
根据分析结果制定市场策略,提高销售和市 场份额。
《推断统计》PPT课件
探索统计学的定义及其在实践中的重要性,介绍推断统计学的概念,原理以 及广泛应用的领域。探讨推断统计学的方法和步骤,并以市场调研案例分析 其实际应用。总结推断统计学的局限性和注意事项,并展望未来发展。
统计学的定义和重要性
什么是统计学?
统计学是研究收集、分析、解释和展示数据 的科学领域。
为什么统计学重要?
统计学帮助我们掌握信息,做出准确的决策, 并从数据中发现隐藏的模式和趋势。
推断统计的概念和原理
1 什么是推断统计学?
2 推断统计学的原理
推断统计学是通过样本数据对总体特征进 行推断和预测的过程。
基于概率理论和数理统计学的基础,推断 统计学利用样本信息来推理总体特征。
推断统计的应用领域
市场调研
推断统计学在市场调研中帮助了解消费者需求、 市场趋势和产品定位。
两分类资料的统计描述与推断

详细描述
频数分布表包括两列,一列表示类别, 另一列表示该类别出现的频数。通过 频数分布表,可以直观地了解各类别 的数量分布情况,为后续的统计分析 提供基础数据。
比例与百分比
总结词
比例和百分比是用来描述两分类资料中各类别的相对大小。
详细描述
比例是各类别的数量与总数量的比值,而百分比则是比例乘以100。通过比例和 百分比,可以了解各类别的相对大小,进一步分析各类别的权重和影响。
详细描述
在两分类资料中,中位数通常用于描述某一类别的中间状态或中心趋势。例如,在一组 关于消费者年龄的数据中,中位数可以表示消费者的平均年龄或年龄分布的中心趋势。
算术平均数
总结词
算术平均数是所有数值的和除以数值的 个数。
VS
详细描述
在两分类资料中,算术平均数可以用于描 述某一类别的平均水平或中心趋势。例如 ,在一组关于消费者购买力的数据中,算 术平均数可以表示消费者的平均购买力水 平。
概率与概率分布
概率
描述随机事件发生的可能性大小。
概率分布
描述随机变量取值可能性的分布情况。
随机抽样与抽样分布
随机抽样
从总体中按照随机原则抽取一部分观察单位进行研究 。
抽样分布
由样本数据推导出的统计量值的分布。
统计量与参数
统计量
基于样本数据计算出的量值,用于描 述样本数据的特征。
参数
描述总体特性的量值,通常通过总体 数据计算得出。
03
CHAPTER
两分类资料的离散程度描述
异众比率
异众比率
异众比率是用于描述分类数据中非众数频数 的相对重要性。其计算公式为异众比率=非 众数频数/总频数。异众比率越大,说明非 众数频数所占比重越大,数据的离散程度越 大。
频数分布表包括两列,一列表示类别, 另一列表示该类别出现的频数。通过 频数分布表,可以直观地了解各类别 的数量分布情况,为后续的统计分析 提供基础数据。
比例与百分比
总结词
比例和百分比是用来描述两分类资料中各类别的相对大小。
详细描述
比例是各类别的数量与总数量的比值,而百分比则是比例乘以100。通过比例和 百分比,可以了解各类别的相对大小,进一步分析各类别的权重和影响。
详细描述
在两分类资料中,中位数通常用于描述某一类别的中间状态或中心趋势。例如,在一组 关于消费者年龄的数据中,中位数可以表示消费者的平均年龄或年龄分布的中心趋势。
算术平均数
总结词
算术平均数是所有数值的和除以数值的 个数。
VS
详细描述
在两分类资料中,算术平均数可以用于描 述某一类别的平均水平或中心趋势。例如 ,在一组关于消费者购买力的数据中,算 术平均数可以表示消费者的平均购买力水 平。
概率与概率分布
概率
描述随机事件发生的可能性大小。
概率分布
描述随机变量取值可能性的分布情况。
随机抽样与抽样分布
随机抽样
从总体中按照随机原则抽取一部分观察单位进行研究 。
抽样分布
由样本数据推导出的统计量值的分布。
统计量与参数
统计量
基于样本数据计算出的量值,用于描 述样本数据的特征。
参数
描述总体特性的量值,通常通过总体 数据计算得出。
03
CHAPTER
两分类资料的离散程度描述
异众比率
异众比率
异众比率是用于描述分类数据中非众数频数 的相对重要性。其计算公式为异众比率=非 众数频数/总频数。异众比率越大,说明非 众数频数所占比重越大,数据的离散程度越 大。
医学统计学课件:分类资料的统计描述

交叉表
交叉表是一种更为复杂的表格形式 ,可以展示两个或多个分类变量之 间的关系,进一步分析变量之间的 关联。
分层资料的统计描述
分层平均数
对于分层资料,可以使用分层平 均数来描述各层内数据的平均水 平,通过比较不同层的平均数,
可以了解各层之间的差异。
层间方差
层间方差是用来衡量不同层次间 的变异程度,通过计算和比较层 间方差,可以了解各层次之间的
辅助决策制定
准确的分类资料统计描述 能够为决策制定提供有力 支持,帮助决策者了解情 况、制定合理方案。
分类资料统计描述的应用场景
临床研究
在临床研究中,分类资料 统计描述常用于分析患者 的疾病分布、治疗反应等 。
流行病学
流行病学中,分类资料统 计描述用于分析疾病的地 区分布、人群特征等。
公共卫生
公共卫生领域中,分类资 料统计描述用于监测和评 估公共卫生状况、健康问 题分布等。
动态数的计算与解读
动态数的计算
动态数是用来描述某一指标在不同时间点上的变化情况,通常通过将某一指标在 不同时间点的数值进行对比来计算。例如,某医院某年的治愈率与前一年的治愈 率之比。
动态数的解读
动态数的值越大,说明该指标的变化趋势越明显;反之,则越小。动态数可以用 来预测未来的发展趋势,以及评估政策或措施的效果。
相对数与动态数的应用场景
相对数在医学研究中应用广泛,如比较不同地区、不同时间 、不同人群的发病率、患病率、死亡率等指标,以了解疾病 在特定人群中的分布和发生情况。
动态数在医学监测和流行病学研究中应用较多,如监测某种 疾病的发病率、死亡率等指标的变化趋势,以及评估干预措 施的效果等。
04
统计图表在分类资料中的应用
在制作箱线图时,应将数据按照数值 大小进行排序,并使用合适的横轴和 纵轴尺度。
交叉表是一种更为复杂的表格形式 ,可以展示两个或多个分类变量之 间的关系,进一步分析变量之间的 关联。
分层资料的统计描述
分层平均数
对于分层资料,可以使用分层平 均数来描述各层内数据的平均水 平,通过比较不同层的平均数,
可以了解各层之间的差异。
层间方差
层间方差是用来衡量不同层次间 的变异程度,通过计算和比较层 间方差,可以了解各层次之间的
辅助决策制定
准确的分类资料统计描述 能够为决策制定提供有力 支持,帮助决策者了解情 况、制定合理方案。
分类资料统计描述的应用场景
临床研究
在临床研究中,分类资料 统计描述常用于分析患者 的疾病分布、治疗反应等 。
流行病学
流行病学中,分类资料统 计描述用于分析疾病的地 区分布、人群特征等。
公共卫生
公共卫生领域中,分类资 料统计描述用于监测和评 估公共卫生状况、健康问 题分布等。
动态数的计算与解读
动态数的计算
动态数是用来描述某一指标在不同时间点上的变化情况,通常通过将某一指标在 不同时间点的数值进行对比来计算。例如,某医院某年的治愈率与前一年的治愈 率之比。
动态数的解读
动态数的值越大,说明该指标的变化趋势越明显;反之,则越小。动态数可以用 来预测未来的发展趋势,以及评估政策或措施的效果。
相对数与动态数的应用场景
相对数在医学研究中应用广泛,如比较不同地区、不同时间 、不同人群的发病率、患病率、死亡率等指标,以了解疾病 在特定人群中的分布和发生情况。
动态数在医学监测和流行病学研究中应用较多,如监测某种 疾病的发病率、死亡率等指标的变化趋势,以及评估干预措 施的效果等。
04
统计图表在分类资料中的应用
在制作箱线图时,应将数据按照数值 大小进行排序,并使用合适的横轴和 纵轴尺度。
分类资料的统计描述课件
峰态及其测度
峰态
描述数据分布的集中程度,可以通过计算峰态系数来衡量。
峰态系数的计算方法
利用数据分布的均值、标准差和四分位距,通过公式计算得出峰 态系数。
峰态系数的值域
正值表示尖峰分布,负值表示平峰分布。
偏态与峰态的图形描述
01
02
03
直方图
通过绘制直方图可以直观 地展示数据的分布情况, 从而观察偏态和峰态。
THANKS
感谢观看
Q-Q图
通过绘制Q-Q图可以比较 数据分布与正态分布的偏 离程度,从而判断偏态和 峰态。
P-P图
通过绘制P-P图可以比较 数据分布与正态分布的理 论概率,从而判断偏态和 峰态。
05
分类资料的统计图表
条形 图
总结词
直观展示不同类别数据的大小关系
详细描述
条形图通过长度相等的条形来代表各类别的数值,条形之间的横向距离表示数 值的大小。条形图能够直观地展示不同类别数据的大小关系,便于比较。
分类资料的统计描述课件
目 录
• 分类资料统计描述概述 • 分类资料的频数分布 • 分类资料的集中趋势与离散趋势 • 分类资料的偏态与峰态 • 分类资料的统计图表 • 分类资料统计描述的应用场景
contents
01
分类资料统计描述概述
定义与特点
定义
分类资料是指将观察单位按照某 种属性或类别进行分类的统计数 据,例如性别、婚姻状况、学历等。
医学数据分析
要点一
总结词
医学数据分析也是分类资料统计描述的一个重要应用场景, 通过对医学数据的统计描述,可以了解疾病分布、治疗效 果和药物反应等。
要点二
详细描述
医学研究是提高疾病防治水平和医疗服务质量的重要途径, 通过临床试验、流行病学调查等方式收集数据,然后利用 分类资料统计描述的方法对数据进行整理和分析,可以得 出疾病流行特征、治疗方案效果等方面的信息,为医生制 定治疗方案和开展医学研究提供依据。
医学统计学课件:分类资料的统计推断
n 较大时,正态近似法
p
u
n 较小时,直接计算概率法
p (1 )
n
6.3 两样本率的比较
➢目的: 推断两总体率是否不等 ➢两样本率比较的u 检验(u test)
➢两样本率比较的2检验 (chi-square test)
两样本率的比较的u 检验
– 正态近似法
当n1, n2均较大,p1, p2, (1-p1), (1-p2)均不太小, 如n1p1, n2p2, n1(1-p1), n2(1-p2)均大于5时,可用u 检验。
例6.1
• 有人调查29名非吸毒妇女,出狱时有1名HIV阳 性,试问HIV阳性率的95%的可信区间是多少?
• 本例 n=29,X=1,查附表7得0.1~17.8,即该HIV 阳性率的95%的可信区间为:0.1%~17.8%。
总体率的区间估计 (二)
正态近似法
– n足够大,p与1-p不太小,如np>5和n(1பைடு நூலகம்p)>5 样本率p的抽样分布近似正态分布。
衡量理论数与实际数的差别
2 ( A T )2
T
2 43 40.362 10 12.642 40 42.642 16 13.362 1.41
40.36
12.64
42.64
13.36
第四步:确定 P 值,下结论
表 四格表资料的基本形式
χt检2验检验
率的抽样误差
• 由于总体中个体变异的存在,在抽样过 程中产生的样本率与总体率的差异或样 本率间的差异 ,称为率的抽样误差。
率的标准误(SE of Rate)
• 率的抽样误差大小的衡量指标
1
p
n
p1 p
sp
【推荐文档】统计推断基础PPT
①单峰分布,曲线在t=0 处最高,并以t=0为中心
左右对称
②与正态分布相比,曲线 最高处较矮,两尾部翘得 高(见绿线)
③ 随自由度增大,曲线逐 渐接近正态分布;分布的 2 3 4 极限为标准正态分布。
t分布曲线下面积(附表2)
3.71 3.92 4.12 4.33 4.54 4.74 4.95 5.15 5.36 5.57 5.77 5.98 6.19
0
0
50
50
100
100
150
150
200
200
频数 频数
250
250
0.1580
n 10; SX
400 350 300
n 5; SX 0.2212
400 350 300
450
450
3个抽样实验结果图示
抽样实验小结
均数的均数围绕总体均数上下波动。
均数的标准差即标准误 X 与总体标
准差 相差一个常数的倍数,即 / n X 样本均数的标准误(Standard Error) =样本标准差/ 样本含量=S n 从正态总体N(,)中抽取样本,获得
均数的分布仍近似呈正态分布N(, X) 。
二、中心极限定理
central limit theorem
①即使从非正态总体中抽取样本,所得均数分布仍近似呈正态。 为①自即由 使度从(非d正②e态gr随总ee体o着f中fr抽e样e取do本样m本)量,,所是的得t分均增布数的大分唯布,一仍参近样数似;本呈正均态。数的变异范围也逐渐变窄。
重复抽取1000次,获得1000份样本; ②与正态分布相比,曲线最高处较矮,两尾部翘得高(见绿线) 假设检验(test of hypothesis) 总体率 均数的均数围绕总体均数上下波动。 第一节 均数的抽样误差 第一节 均数的抽样误差 95%可信区间 99%可信区间 大样本总体均数的可信区间(2) 区间估计:在一定可信度(Confidence level) 下,同时考虑抽样误差 总体率 常用100(1-α)%或(1-α)表示, α值一般取0. 以t为横轴,f(t)为纵轴,可绘制t分布曲线。 ②与正态分布相比,曲线最高处较矮,两尾部翘得高(见绿线)
8=chap7两分类资料的统计描述与推断
2019/8/24
33
健康报2019-01-30:卫生部、联合国艾滋病规划署、世界卫生组织 联合所作2019年中国艾滋病疫情评估报告:2019年底,中国存活 艾滋病病毒感染者和艾滋病患者78万人,女性占28.6%;艾滋病病 人15.4万人;全人群感染率0.058%。2019年当年中国新发艾滋病 病毒感染者4.8万人,2019年艾滋病相关死亡2.8万人。 在存活的78万名感染者和艾滋病病人中,经异性传播占46.5%,经 同性传播占17.4%,经注射吸毒传播占28.4%,经既往有偿采供血、 输血或使用血制品传播占6.6%,经母婴传播占1.1%。异性传播多 分布在艾滋病流行较严重省份,同性传播多分布在大、中城市及 流动人口集中地区。云南、新疆、广西、广东、四川、贵州6省 (区)注射吸毒人群估计感染数都在1万人以上,6省(区)注射 吸毒人群估计感染数,占全国该人群估计感染数的87.2%。在经既 往有偿采供血、输血或使用血制品传播中,河南、安徽、湖北、 山西4省估计感染数,占全国该人群估计感染数的92.7%。 在估计2019年当年新发感染的约4.8万人中,异性传播占52.2%, 同性传播占29.4%,注射吸毒传播占18.0%,母婴传播占0.4%。
中11146→14032;初中33961→38788人;小学35701→26779人。 • 城镇人口为66557万人,占49.68%,乡村67415万人,占50.32%。
同2000年相比,城镇人口比重上升13.46个百分点。 • 东部占37.98%,中部占26.76%,西部占27.04%,东北占8.22%。 • 居住地与户口乡街不一致且离开半年以上的26139万人 (流动)。 • 随机质量抽样调查402个普查小区,人口漏登率为0.12%。
(2)构成比和率不能相互混淆。表7-1 “0~岁组”在各年龄组1064个患者中占 47.09%最高,而非患病率最高。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2019/3/9
5
• 20190428:第六次全国人口普查(20191101) • 总人口1370536875人:大陆1339724852人,香港7097600 人,澳门552300人,台湾23162123人。与2000年第5次相比, 增加7390万人,增长5.84%,年均增长0.57%,比1990年 到2000年的年平均增长率1.07%下降0.5个百分点。 • 户均人口3.10人,比2000年3.44人减少0.34人。 • 男性51.27%,女性48.73%,性别比由2000年106.74下降 为105.20. • 0-14岁人口占16.60%,比2000年下降6.29个百分点;
2019/3/9
6
• 60岁~13.26%,比2000↑2.93个百分点,65岁~8.87%,↑ 1.91。 • 汉族91.51%,比2000年91.59%下降0.08个百分点; • 与2000年比,每十万人中:大学文化程度由3611人→8930人,高 中11146→14032;初中33961→38788人;小学35701→26779人。 • 城镇人口为66557万人,占49.68%,乡村67415万人,占50.32%。 同2000年相比,城镇人口比重上升13.46个百分点。 • 东部占37.98%,中部占26.76%,西部占27.04%,东北占8.22%。 • 居住地与户口乡街不一致且离开半年以上的26139万人 (流动)。 • 随机质量抽样调查402个普查小区,人口漏登率为0.12%。
教学目的与要求 :6学时→3 掌握:相对比、构成比、率以及动态数列的意义,总体率的置信 区间,样本率与已知总体率比较、两样本比较。 熟悉:率的标准化思想。 了解:概率的加法、乘法及全概率公式、Bayes公式。 教学内容提要 : 重点讲解:相对数的意义,样本率与已知总体率、两样本比较。 讲解:总体率的置信区间,率的标准化。 介绍:概率的加法、乘法定理及全概率、Bayes公式。 重点:相对数的意义,样本率与总体率、两样本比较。 难点:概率的加法、乘法定理及全概率、Bayes公式,二项分布 和Poisson分布。
27
2019/3/9
28
2019/3/9
29
2019/3/9
3
2019/3/9
4
• 1. 相对比 (relative ratio,对比指标):两个有关指标之比。对 比水平,绝对数或相对数之比,质可同可异。 • 性别比=男性人口数÷女性人口数×100 • 正常情况下,出生性别比103~107,生物学规律决定。 • 中国全球最高、持续时间最长。 • 出生性别比:2000年116.86,2019年121.2,2019年118.06。 • 2000:海南135.6,广东130.3。 • 重庆: 2019年137.1,2019年139.61,二胎高达177.9。 • 2020:20~45岁的男性将比女性多 3000万 , 1990年代出生的男性 10%的被挤出婚姻市场。 • 2019 :全国 132802 万,比上年末增加 673 万。全年出生 1608 万, 出生率为 12.14‰ ;死亡 935 万,死亡率为 7.06‰ ;自然增长率为 5.08‰,出生性别比为120.56。
13
2019/3/9
14
2019/3/9
15
2019/3/9
16
2019/3/9
17
2019/3/9
18
2019/3/9
19
2019/3/9
20
2019/3/9
21
2019/3/9
22
2019/3/9
23
2019/3/9
24
2019/3/9
25
2019/3/9
26
2019/3/9
(教学时间: 理论6学时。§1~2 , §3~5.1, §5.2~7 )
Chap7 两分类资料的统计描述与推断 P106~120
2019/3/9பைடு நூலகம்
1
2019/3/9
2
§1
常用相对数、动态数列
P106
一、常用相对数 绝对数:实际频数。实际水平,统计分析基础。但不便进行比较。 相对数(relative number):两个有联系的指标之比。 • 相对比、构成比和率。 2019年中国特大城市人均GDP排名(主城区常住人口300万以上) 深圳 广州 佛山 包头 无锡 上海 大连 厦门 北京 苏州 天津 青岛 杭州 宁波 长沙 南京 沈阳 武汉 济南 唐山 郑州 合肥 南昌 福州 成都 长 春 太原 西安 哈尔滨 重庆
132802 60667
72135 68357 64445 25166 91647 15989
100.0 45.7
54.3 51.5 48.5 19.0 69.0 12.0
其中:65岁及以上
2019/3/9
10956
8.3
8
3. 率 (frequency,rate ):频率,强度。总π ,样p 。 率= 某现象实际发生的例数 × K (7-2)
可能发生该现象的总例数
K:①习惯:有效、病死用%;出生、死亡用‰; ②保留1或2位整数。 患病率(prevalence ratePR ,现患率):某时点频率。
病的例数 患病率=检查时发现的现患某疾 ×1000‰(7-3) 某时点受检查的人数
发病率(incidence rate,IR:新发生的频率。
同时期内新发生该疾病 的例数 发病率=某时期可能发生某疾病 ×1000‰ 的平均人口数
2019/3/9
7
• 2. 构成比 (constituent ratio构成指标):比重或分布。
• 构成比=
某一组成部分的观察单 位数 ×100% 同一事物各组成部分观 察单位总数
• 特点:①总和必为100%;
指 标
②相互影响。
年末数 比重%
2019全国总人口 其中:城镇
乡村 其中:男性 女性 其中:0-14岁 15-59岁 60岁及以上
or/10万(7-5) 特点:①分母的每个个体都可能成为分子; ②分率一般不能直接相加; ③某一分率改变对其他无影响。
2019/3/9
9
2019年我国卫生事业发展统计公报 2019-04-20 10:59:14
2019/3/9
10
2019/3/9
11
2019/3/9
12
2019/3/9