预防医学统计学部分

合集下载

流行病学和医学统计学基础知识-健康管理师考试

队列研究:进一步验证病因假设
实验流行病学: 干预性研究:进一步验证病因假说
病因推论
1 是获得疾病的频率和分布特征的特点。如不同的地区、不同时间、不同人群的死亡水平和死因构成（三间分布）。
即公共卫生意义较大
归因危险度百分比AR%
AR % [( I e I 0 ) / I e ] 100 %
概念：暴露人群中由暴露因素引起的发病在所有发病中所占的百分比。
人群归因危险度 PAR
It：全人群发病率
PAR= It－I0
Io：非暴露组发病率
概念：指总人群发病率中归因于暴露的部分。
意义
K=100%，1000‰，10000/万，100000/10万
率必须包括受累人群数目（可以是某病的临床症状、死亡、残疾、实验室异常等）、被观察到的受累人群所处的总体数目和规定的时间三方面内容才能构成“率”。
（二）发病指标
v发病率（incidence rate） v罹患率（attack rate） v患病率（prevalence rate） v感染率 (infection rate) v病残率 (disability rate)
• • • • •
流行病学研究 • • • • • •
•
观察性研究
横断面研究比例死亡比研究描述性研究生态学研究病例对照研究队列研究（随访研究）分析性研究
实验性研究
临床试验现场试验社区干预试验和整群随机试验
理论性研究
理论流行病学流行病学方法研究
二、常用指标
（一）率和比
1.比例比例（proportion）是表示同一事物局部
• （5）2000年期间该病的病死率是多少？
病死率
某时期内因某病死亡人数同期患某病的病人数

预防医学章节重点整理

预防医学知识点总结第一章绪论（不要忽视）1、预防医学：是医学的一门应用学科，它以个体和确定的群体为对象，目的是保护、促进和维护健康，预防疾病、失能和早逝。

内容：医学统计学、流行病学、环境医学、社会医学、健康促进、卫生管理学特点：⒈工作对象:个体和群体⒉着眼于:健康和无症状患者⒊研究重点:影响健康的因素与人群健康的关系⒋采取的对策:更具积极的预防作用和更大的效益⒌研究方法:注重微观和宏观相结合、多学科技术和方法的综合应用2、健康（health）：是身体、心理和社会适应的完好状态，而不仅是没有疾病和虚弱。

健康是日常生活的资源，而不是生活的目标，健康是一个积极的概念，它不仅是个人身体素质的体现，也是社会和个人资源。

健康的组成：身体，心理（又包括智力，情绪，精神），人际交往和社会适应健康决定因素（四大类）社会经济环境物质环境个人因素卫生服务3、健康生态学模型记住五层及五层内容4、三级预防：根据疾病发生发展过程以及健康决定因素的特点，把预防策略按等级分类，称为三级预防策略一级预防：又称病因预防。

如果疾病因子还没有进入环境之前就采取预防措施，又称为根本性预防。

包括：针对健康个体的措施、针对整个公众的社会措施二级预防：二级预防又称为临床前期预防(或症候前期)，即在疾病的临床前期作好早期发现早期诊断、早期治疗的（三早）预防措施，以控制疾病的发展和恶化。

三级预防：三级预防又称为临床预防，这一级预防主要是借助各种临床治疗方法，对患三级预防某些病者，及时治疗，防止恶化使疾病早日康复，减少疾病的不良作用，预防并发症和伤残。

第二章流行病学概论1、流行病学：（定义）流行病学是研究人群中疾病与健康状况的分布及其影响因素，并研究防治疾病及促进健康的策略和措施的科学。

包含四层意思：1）流行病学研究的对象时人群2）流行病学关注的事件包括疾病与健康状况3）流行病学的主要研究内容和流行病学研究的三个阶段4）流行病学研究和实践的目的是防治疾病，促进健康。

预防医学大四课程

预防医学大四课程预防医学是一门研究如何预防和控制人类疾病的专业，旨在通过改善环境、饮食、生活习惯等，降低人们患病的风险，提高健康水平。

在大学四年级，预防医学专业的学生将进一步深入学习专业知识，以掌握更多的预防医学理论和技能。

以下是预防医学专业在大学四年级的一些主要课程：一、专业课程1、卫生化学这门课程主要介绍卫生化学的基本原理和方法，包括水质、食品、环境等方面的化学检测和分析技术，以及化学物质对人类健康的影响等。

2、流行病学和公共卫生实践这门课程主要介绍流行病学的原理和方法，以及在公共卫生实践中的应用。

流行病学是预防医学的重要组成部分，它研究疾病在人群中的分布特征和影响因素，为制定有效的预防和控制措施提供科学依据。

3、卫生统计学这门课程主要介绍统计学的基本原理和方法，包括描述性统计、推论性统计、实验设计等，以及在公共卫生实践中的应用。

统计学是预防医学中数据处理和分析的重要工具。

4、环境卫生学这门课程主要介绍环境卫生的基本概念和方法，包括空气、水质、土壤和噪音等环境因素的监测和控制方法，以及环境卫生对健康的影响等。

5、营养学这门课程主要介绍营养学的基本知识，包括各种营养素的生理功能、食物来源和需要量等，以及食品安全和营养与健康之间的关系等。

6、职业卫生学这门课程主要介绍职业卫生的基本概念和方法，包括职业病危害因素的识别、评估和控制方法等，以及各种职业病的临床表现、诊断和治疗措施等。

7、妇女保健与儿少卫生这门课程主要介绍妇女保健和儿少卫生的基本知识，包括妇女和儿童的生理特点、保健措施和常见疾病的预防和控制方法等。

8、健康教育与健康促进这门课程主要介绍健康教育的基本原理和方法，包括健康教育的计划和实施、效果评价和推广等，以及在公共卫生实践中的应用。

通过这门课程的学习，学生将掌握如何设计和实施健康教育计划，提高人们的健康意识和行为习惯。

二、实践课程在大学四年级，预防医学专业的学生将进行实习和论文写作等实践活动。

兰大《预防医学与卫生统计学》16秋平时作业

兰州兰大《预防医学与卫生统计学》16秋平时作业2一、单选（共40 道，共80 分。

）1. 少年儿童人口系数下降，可使( )题1. 粗死亡率上升题2. 粗死亡率下降题3. 婴儿死亡率上升题4. 婴儿死亡率下降E. 病死率下降F.标准解：2. 某健康人老怀疑自己有病，这种不良行为称为题1. 题1.角色行为超前题2. 题2.角色行为缺如题3. 题3.角色心理冲突题4. 题4.瞒病行为E. E.以上均是标准解：3. 选择标准人口常用( )题1. 有代表性，较稳定，数量较大的人群题2. 任意选定人群题3. 比较组合并人群题4. 任意假定人群E.标准解：4. 卡方值的取值范围是（）题1. 负无穷大至正无穷大题2. 小于0题3. 大于0题4. –1 ----1E.标准解：5. 当今我国预防医学研究的对象是题1. 题1.致病因素的高危人群题2. 题2.对疾病抵抗力弱的人群题3. 题3.有职业致病因素接触的人群题4. 题4.低收入、无医疗支付能力的人群E. E.全社会的人群标准解：6. 变异系数CV的数值( )题1. 一定大于1题2. 一定小于1题3. 一定小于均数题4. 一定小于标准差E. 可以大于1，也可以小于1F.标准解：7. 表示全体中各部分的比重宜用（）题1. 直条图题2. 普通线图题3. 圆图题4. 直方图E.标准解：8. 在下述抽样调查方法中，在样本量相同的前提下,抽样误差最小的是( )题1. 简单随机抽样题2. 系统抽样题3. 分层抽样整群抽样题4. 多阶段整群抽样E.标准解：9. 预防地方性甲状腺肿流行的最有效措施是题1. 题1.食用碘盐题2. 题2.除往水中硫氰酸盐题3. 题3.煮沸饮水题4. 题4.降低饮用水的硬度E. E.饮水除氟标准解：10. 下列那项不是性格的影响因素题1. 题1.思想题2. 题2.意识题3. 题3.信仰题4. 题4.世界观E. E.家庭标准解：11. 城市大气CO污染的主要来源为题1. 题1.工业企业题2. 题2.生活污染题3. 题3.吸烟题4. 题4.自然灾害E. E.汽车废气标准解：12. 以下属于分类变量的是（）题1. IQ得分题2. 心率题3. 性别题4. 住院人数E. 腰围标准解：13. 计算平均潜伏期宜用题1. 题1.全距题2. 题2.中位数题3. 题3.离均差题4. 题4.积和变异数E. E.算术平均数标准解：14. 在两样本均数比较的t检验中，无效假设是（）题1. 两样本均数不等题2. 两样本均数相等题3. 两总体均数不等题4. 两总体均数相等E.标准解：15. 用标准差比较，分析两个同类总体平均指标的代表性的前提条件是( )题1. 两个总体的标准差应相等题2. 两个总体的平均数应相等题3. 两个总体的单位数应相等题4. 两个总体的离差之和应相等E.标准解：16. 铅对血红素合成的影响是由于铅主要抑制题1. 题1.δˉ氨基乙酰丙酸脱水酶和血红素合成酶题2. 题2.δˉ氨基乙酰丙酸合成酶题3. 题3.粪卟啉原氧化酶题4. 题4.粪卟啉原脱羧酶E. E.以上都不是标准解：17. 决定生产性毒物进入人体剂量的最主要因素题1. 题1.毒物的溶解度与挥发度题2. 题2.环境中毒物的浓度与接触时间题3. 题3.毒物联合作用题4. 题4.个体状态E.环境条件标准解：18. 在简单线性回归分析中，得到回归系数为-0.30，经检验有统计学意义，说明( )题1. X对Y的影响占Y变异的30%题2. X增加一个单位，Y平均减少30%题3. X增加一个单位，Y平均减少0.30个单位题4. Y增加一个单位，X平均减少30%E. Y增加一个单位，X平均减少0.30个单位F.标准解：19. 随机事件的概率为（）题1. P=1题2. P=0题3. P=-0.5题4. 0≤P≤1E. -0.5标准解：20. 某地某年的总和生育率反映该地( )题1. 平均每千现有妇女的生育总数题2. 育龄妇女实际的生育率水平题3. 平均每千育龄妇女的已生育数题4. 育龄妇女标化了的生育水平E.标准解：21. 不属于SO2的生物学效应是题1. 题1.促癌作用题2. 题2.呼吸阻力作用题3. 题3.刺激作用题4. 题4.吸收作用E. E.水解作用标准解：22. 水俣病是由以下哪种物质中毒引起的题1. 题1.砷题2. 题2.汞题3. 题3.镉题4. 题4.铅标准解：23. 统计推断的内容是( )题1. 计算样本率题2. 检验统计上的“假设”题3. 计算样本均值题4. 计算标准化率E. 估计参考值范围F.标准解：24. 对两个数值变量同时进行了相关和回归分析，假设检验结果相关系数有统计学意义(P<0.05)，则( )题1. 回归系数有高度的统计学意义题2. 回归系数无统计学意义题3. 回归系数有统计学意义题4. 不能肯定回归系数有无统计学意义E. 以上都不是F.标准解：25. 多种毒物作用于人体表现出不同于每种毒物分别作用的总和为题1. 题1.相加作用题2. 题2.协同作用题3. 题3.联合作用题4. 题4.相乘作用E. E.拮抗作用标准解：26. 为预防缺钙应多食题1. 题1.低盐、高蛋白质题2. 题2.低盐、低胆固醇题3. 题3.奶及奶制品题4. 题4.动物性食品E. E.合理热能，优质蛋白，富含铁，锌，碘标准解：27. 通常可采用以下那种方法来减小抽样误差：题1. 减小样本标准差题2. 减小样本含量题3. 扩大样本含量题4. 以上都不对E.标准解：28. 关于噪声对听力的损害，正确的说法为题1. 题1.听觉疲劳后进入听觉适应题2. 题2.听觉疲劳是噪声性耳聋的前驱信号题3. 题3.听觉疲劳为功能性改变，听觉适应为器质性改变题4. 题4.听觉疲劳为器质性改变，听觉适应为功能性改变标准解：29. 实验设计的基本原则是( )题1. 随机化重复设置对照题2. 齐同对比均衡性随机化题3. 设置对照重复盲法题4. 设置对照重复随机化E.标准解：30. 设配对资料的变量为x1和x2，则配对资料秩和检验的编秩方法是( )题1. 把x1和x2混合按绝对值从小到大编秩题2. 把x1和x2混合从小到大编秩题3. 分别按x1和x2从小到大编秩题4. 把x1和x2的差数从小到大编秩E. 把x1和x2的差数的绝对值从小到大编秩F.标准解：31. 在相同条件下抽样误差最大的是（）题1. 单纯随机抽样题2. 系统抽样题3. 整群抽样题4. 分层随机抽样E.标准解：32. 概率P（A）=0时表示事件题1. 题1.已经发生题2. 题2.可能发生题3. 题3.极可能发生题4. 题4.不可能发生E. E.在一次抽样中不发生标准解：33. 在同一正态总体中以固定n随机抽100个样本，有95%的样本均数在下述范围内( )题1. 样本均数加减１.９６个标准差范围内题2. 样本均数加减２.５８个标准差范围内题3. 样本均数加减１.９６个标准误范围内题4. 样本均数加减２.５８个标准误范围内E.标准解：34. 样本率与总体率差别的假设检验可用( )题1. 四格表确切概率法计算题2. 四格表χ2检验题3. 不能检验题4. 由样本率制定总体率的可信区间来判断E. 以上都不是F.标准解：35. 关于率的标准误sp的描述中不正确的是( )题1. 与成正比题2. 与成反比题3. 值越大，说明率的抽样误差越小题4. 指由于抽样造成的样本率与总体率之差E. 可用于总体率的区间估计与μ检验F.标准解：36. 氰化氢中毒最有效的急救办法题1. 题1.快速使用硫酸钠题2. 题2.快速使用亚硝酸钠题3. 题3.先用亚硝酸钠，接着再用硫代硫酸钠题4. 题4.先用硫代硫酸钠，接着再用亚硝酸钠E. E.静脉注射美蓝标准解：37. 长期吸入游离SiO2粉尘可引起题1. 题1.硅酸盐肺题2. 题2.矽肺题3. 题3.炭尘肺题4. 题4.混合性尘肺标准解：38. 应用百分位数法估计参考值范围的条件是（）题1. 数据服从正态分布题2. 数据服从偏态分布题3. 有大样本数据题4. 数据服从对称分布E. 数据变异不能太大F.标准解：39. 影响环境污染物对健康危害程度的因素有以下各项，但不包括题1. 题1.剂量或强度题2. 题2.作用持续时间题3. 题3.受害的人群数量题4. 题4.个体差异E. E.多种因素综合作用标准解：40. 矽肺是由下列哪种粉尘引起的题1. 题1.石英尘题2. 题2.煤尘题3. 题3.石棉尘题4. 题4.硅酸盐粉尘E. E.碳素粉尘标准解：《预防医学与卫生统计学》16秋平时作业2二、多选（共2 道，共4 分。

卫生统计学习题集三

（）2.只适用于小样本，不适用于大样本。（）3.相关系数 r 与回归系数 b 均无单位。（）4.欲研究某种药物治疗糖尿病的疗效，某医师收集了 2003 年乌市某医院所有就诊并服用该药的糖尿病病人的疗效，此研究是一个总体研究。（）5.在偏态总体中抽样，样本均数的分布必然服从正态分布。（）6.样本量增大，极差会增大。（）7.调查某小学 40 名小学生中患龋齿的学生有 30 人，其中男生 14 名，女生 16 名，可认为女生比男生更易患龋齿。（）8.若两样本均数比较的假设检验 P 远远小于 0.01,则说明两总体均数差异非常大。（）9.同一批计量数据的标准差必定比标准误小。（）10.要评价某市一名 8 岁女孩的身高是否偏高或偏矮，应选用的方法是用该市 8 岁女孩身高的 95％或 99％的可信区间来评
A.P＞0.05 B.P＜0.01 C.0.05＞P＞0.02 D.0.02＞P ＞0.01
E.0.1＞P＞0.05 27．完全随机设计资料的方差分析中，必然有Ａ．ＳＳ总＝ＳＳ组间+ＳＳ组内Ｂ．ＳＳ总＝ＳＳ组间+ ＳＳ组内+ＳＳ误差Ｃ．ν组间>ν组内Ｄ．ＭＳ总＝ＭＳ组间+ＭＳ组内Ｅ．ＳＳ组间>ＳＳ组内 28.某地对 100 名儿童作蛔虫感染情况粪检，发现蛔虫卵阳性者 50 名，估计其 95％的可信区间为 A.35～60％ B.37～63％ C.30～70％ D.45～65％ E. 40～60％ 29.当一组计量资料呈明显偏态分布时，选用下列指标来描述其集中趋势和离散趋势。 A.均数、标准差 B.中位数、标准差 C.中位数、四分位数间距 D.均数、四分位数间距 E.几何均数、标准差 30．配对设计的秩和检验，确定 P 值的方法为
出率.
o 试判断两种检验结果有无差别（） 3.某医院用某新药与常规药物治疗婴幼儿贫血，将 20 名贫血患儿随机分为两组，分别接受两种药物治疗，测得血红蛋白增加量（g/l）如下，问新药与常规药物的疗效有无差别？

潍坊医学院预防医学专业2020-2021学年《卫生统计学》期中考试题

潍坊医学院预防医学专业2020-2021学年《卫生统计学》期中考试题1. 下列哪种分布的均数等于方差？( ) [单选题] *A. 正态分布B. t分布C. Poisson分布(正确答案)D. F分布E. 二项分布2.已知动脉硬化患者载脂蛋白B的含量(mg/dl)呈明显偏态分布，描述其个体差异的统计指标应使用( ) [单选题] *A.全距B.标准差C.变异系数D.方差E.四分位数间距(正确答案)3. 研究血清低密度脂蛋白LDL与载脂蛋白B-100的数量依存关系，应绘制的图形是( ) [单选题] *A. 直方图B. 箱式图C. 线图D. 散点图(正确答案)E. 直条图4. 下列观测结果属于有序数据的是( ) [单选题] *A.收缩压测量值B.脉搏数C.住院天数D.病情程度(正确答案)E.四种血型5. 一组原始数据呈正偏态分布，其数据的特点是( ) [单选题] *A. 数值离散度较小B. 数值离散度较大C. 数值分布偏向较大一侧D. 数值分布偏向较小一侧(正确答案)E. 数值分布均匀6. 收集资料不可避免的误差是( ) [单选题] *A. 随机误差(正确答案)B. 系统误差C. 过失误差D. 记录误差E.仪器故障误差7. 某项指标95%医学参考值范围表示的是( ) [单选题] *A. 在此范围“异常”的概率大于或等于95%B. 在此范围“正常”的概率大于或等于95%C. 在“异常”总体中有95%的人在此范围之外D. 在“正常”总体中有95%的人在此范围(正确答案)E. 在人群中检测指标有5%的可能超出此范围8. 计算标准化死亡率的目的是 ( ) [单选题] *A. 减少死亡率估计的偏倚B. 减少死亡率估计的抽样误差C. 便于进行不同地区死亡率的比较D. 消除各地区内部构成不同的影响(正确答案)E. 便于进行不同时间死亡率的比较9. 假设检验中的Ⅱ类错误指的是( ) [单选题] *A. 可能出现的误判错误B. 可能出现的假阳性错误C. 可能出现的假阴性错误(正确答案)D. 可能出现的无效假设错误E. 可能出现的备择假设错误10. 患病率与发病率的区别是( ) [单选题] *A. 患病率高于发病率B. 患病率低于发病率C. 计算患病率不包括新发病例D. 发病率更容易获得E. 患病率与病程有关(正确答案)11.描述某疾病患者年龄(岁)的分布，应采用的统计图是( ) [单选题] *A.线图B.直条图C.百分条图D.直方图(正确答案)E.箱式图12.研究三种不同麻醉剂在麻醉后的镇痛效果，采用计量评分法，分数呈偏态分布，比较终点时分数的平均水平及个体的变异程度，应使用的图形是( ) [单选题] *A.复式条图B. 复式线图C. 散点图D. 直方图E. 箱式图(正确答案)13. 对药物的四种剂量(0剂量、低剂量、中剂量和高剂量)进行临床试验，计算有效率，规定检验水准α=0.05，若需要进行多重比较(多个实验组与对照组比较)，用Bonferroni方法校正后的检验水准应该是( ) [单选题] *A.0.050B. 0.010C. 0.025D. 0.005E. 0.017(正确答案)14. 以下不能用配对检验方法的是( ) [单选题] *A. 比较15名肝癌患者癌组织和癌旁组织中的Sirt1基因的表达量B. 比较两种检测方法测量15名肝癌患者组织中Sirt1基因的表达量C. 比较早期和晚期肝癌患者各15例癌组织中的Sirt1基因的表达量(正确答案)D. 比较糖尿病患者经某种药物治疗前后糖化血红蛋白的变化E. 比较15名受试者针刺檀中穴前后的痛阈值15. 某省甲、乙两市分别用抽样调查了解2000年食管癌的死亡率。

预防医学数据分析报告(3篇)

第1篇一、摘要随着我国医疗体系的不断完善和大数据技术的飞速发展，预防医学在疾病防控中的重要性日益凸显。

本报告通过对大量预防医学数据的分析，旨在揭示疾病发生发展的规律，为疾病防控策略的制定提供科学依据。

报告内容主要包括疾病流行趋势分析、危险因素识别、预防干预效果评估等方面。

二、数据来源本报告所采用的数据来源于我国卫生健康部门、疾病预防控制中心以及相关医疗机构，涵盖了传染病、慢性病等多个领域。

数据类型包括病例报告、健康检查数据、流行病学调查数据等。

三、数据分析方法1. 描述性统计分析：对疾病流行趋势、危险因素分布等进行描述性分析，了解疾病的基本特征。

2. 相关性分析：通过统计学方法，分析疾病发生与危险因素之间的相关性。

3. 生存分析：对疾病预后、干预效果等进行生存分析，评估干预措施的有效性。

4. 多因素分析：通过统计学模型，筛选出影响疾病发生的多个危险因素，为防控策略提供依据。

四、数据分析结果（一）疾病流行趋势分析1. 传染病：近年来，我国传染病疫情总体呈下降趋势，但仍存在局部暴发风险。

其中，病毒性肝炎、艾滋病、肺结核等传染病发病率较高。

2. 慢性病：慢性病是我国居民死亡的主要原因，主要包括心脑血管疾病、恶性肿瘤、慢性呼吸系统疾病等。

近年来，慢性病发病率持续上升，已成为公共卫生的一大挑战。

（二）危险因素识别1. 传染病：不良生活习惯、环境污染、职业暴露等因素是传染病发生的主要危险因素。

2. 慢性病：吸烟、饮酒、不合理膳食、缺乏运动、心理压力等是慢性病发生的主要危险因素。

（三）预防干预效果评估1. 传染病：疫苗接种、健康教育、环境治理等预防干预措施在一定程度上降低了传染病发病率。

2. 慢性病：健康教育、健康生活方式干预、药物治疗等预防干预措施在一定程度上降低了慢性病发病率。

五、结论与建议（一）结论1. 我国传染病疫情总体呈下降趋势，但仍需加强监测和防控。

2. 慢性病已成为公共卫生的一大挑战，需加强慢性病预防和控制。

防疫期间的统计学应用-以SIR等模型为例

防疫期间的统计学应用--以SIR等模型为例2019年春节以来，一场疫情席卷全国，我们经历了国内疫情大爆发。

全民参与，共同抗疫。

统计学也在预测疫情发展、探索新冠病毒来源及进化史及药物研发中起到了重要作用。

作为一种传染病。

在传染病领域，为了研究传染病的传播能力、传播途径等问题，学者建立了各种模型，帮助指导传染病的防治。

模型一方面可以预测一些关键的数值指标在未来的变化，使相关人员提前做好应对准备；另一方面，模型可以用来评估政策的影响，决策者可以参考不同政策下的模型结果，在合适的时间实施更有效的防控政策。

一、SIR模型SIR是传染病领域一个经典的数学模型，模型假设总人口不变，将人群分为三类：三类人群的比例随着时间的推移不断变化，SIR模型用一个微分方程组来刻画这种变化。

给定疾病传播率β和移除率γ这两个参数，以及初值θ0S,θ0I,θ0R就可以求解SIR模型，对未来三类人群的比例进行预测。

SIR模型的模型结果非常依赖于疾病传播率和移除率这两个固定参数。

然而，就此次实际情况来看，以湖北省为例，为了控制病毒的扩散，各市陆续实行了各项防控措施；随着火神山、雷神山医院的投入使用，以及各地医疗队的赴鄂支援，湖北的医疗水平也在不断提升。

因此SIR模型中的这些参数并不是固定不变的，用固定参数得到的模型结果也难以准确地刻画真实的疫情状况。

二、eSIR模型DAVE OSTHUS等人在SIR模型的基础上，提出了一个状态空间概率模型，称为DBSSM（Dirichlet-Beta state-space model）。

密西根大学的Peter Song 教授领导的团队又在DBSSM的基础上，把防控措施的影响考虑进来，提出了若干种扩展的SIR模型（eSIR），并给出了一个R包，感兴趣的同学们可以在eSIR 的github主页上了解更多信息。

接下来，以湖北省的疫情为例，介绍其中一种eSIR模型。

模型包含两部分变量：一部分是可观测变量，在时间t感染者和移除者占总人口的比例分别记为YtI和YtR；另一部分是三类人群在时间t的潜在比例θtS,θtI,θtR，这些变量不可观测。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

集中趋势的统计指标
变异程度的统计指标
适用于均值相差悬殊的数据
正态分布（高斯分布）
特点：1.单峰分布，以X=μ为对称轴，正态曲线以X轴为渐近线，不与X轴相交
2.在X=μ处取得最大值，f（μ）=1/（σ√2π）；X=μ+-σ处有拐点
3.μ是位置参数；σ是形态参数，σ越大曲线越矮胖，σ越小曲线越瘦高
4.曲线下面积即为概率；总面积为1；左右任意个标准差范围内面积相同
（μ+-1.64σ范围90.00%；μ+-1.96σ范围95.00%；μ+-2.58σ范围99.00%）
运算：1.μ→ψ（μ） 2. ψ（μ）→μ 3. ψ（μ）→μ→X 4.X→μ→ψ（μ）
标准正态分布
Z=（X-X）/S
医学参考值范围
是指包括绝大多数正常人的人体形态、功能和代谢产物等各种生理及生化指标常数，也称正常值。

1.无肝、肾、心、脑、肌肉等疾患
2.近期未服用对肝脏有损害的药物
3.检测前未做剧烈运动，还要注意划分同质对象
计算方法：1.正态分布法2.百分位数法（适用于不满足正态分布的）
参数估计与假设检验
参数估计：由样本统计量估计总体参数（点估计，区间估计）
抽样误差：由抽样造成的样本统计量与总体参数的差异
标准误：样本统计量的标准差
点估计：用单一的数值直接作为总体参数的估计值
区间估计：按预先给定的概率，计算出一个区间，使它能够包含未知的总体参数
（理解可信区间：95%可信区间表示该区间包括总体均数μ的概率为95%，即若作100次抽样算得100个可信
区间，则平均有95%可信区间包括μ，只有5个可信区间不包括μ。

按一定的概率或可信度(1-α)用一个区间来估计总体参数所在的范围）
①σ已知()
②σ未知,n ＞30() ③σ未知,n ＜30() 正态分布总体中进行抽样
服从自由度ν=n-1的t 分布,t 分布是以0为中心的对称分布。

随自由度ν的增大，t 分布曲线越来越接近于标准正态分布曲线，当ν→∞，t 分布的极限分布就是标准正态分布
标准差与标准误的联系与区别（论述题）
假设检验（显著性检验）
思想：①小概率事件②反证法（都是统一的）
服从t 分布（S d 为差值的标准差）
基本步骤
①建立假设和确定检验水准 H 0为原假设（无效假设） α=0.05 0.01 0.1 常用0.05 即检验水准或拒绝域（其实就是建立要否定的结论，设立假设最后否定之）H 1是备择假设 ②选择检验方法和计算检验统计量（假设检验、卡方检验等） ③根据P 值做出统计推断
（当ABS （t ）≥t a/2，ν，则P ≤α，按α检验水准拒绝H 0，接受H 1，“差异有统计学意义”；若P ＞α，则不能拒绝H 0“尚不能认为差别有统计学意义”）
不拒绝H 0不等以支持H 0成立，仅表示现有样本信息不足以拒绝H 0
t 检验
单样本t 检验
适用于样本均数（X 拔）与已知总体均数μ0的比较，目的是检验样本均数（X 拔）所代表的总体均数μ是否与已知总体均数μ0有差别配对样本均数t 检验
两个独立样本均数t检验
①独立性要求这两个样本所对应的主题相互独立
②正态性这两个样本所对应的总体服从正态分布
③方差齐性这两个样本所对应的总体方差相等
t检验中的注意事项
1.假设检验结论正确的前提①代表性（相应的总体）②均衡性
2.检验方法的选用及其适用条件T检验以正态分布和方差相同为基础
3.双侧检验与单侧检验的选择相同检验水准下，对同一资料作单侧检验更容易获得显著的结果；一般应用双侧
4.假设检验的结论不能绝对化假设检验统计结论的正确性是以概率作保证的，统计结论时不能绝对化
5.正确理解P值的统计意义P≤α只能说明差异具有统计学意义，并不代表实际差异的大小
6.假设检验和可信区间的关系假设检验用于推断总体均数间是否不同，而可信区间则用于估计总体均数所在的
范围，计算时都利用了抽样误差估计公式
假设检验中的两类错误
Ⅰ.拒绝了实际成立的H0所犯的错误假阳性
Ⅱ.不拒绝实际上不成立的H0所犯的错误假阴性
确定的检验水准α值越小，出现Ⅱ类错误的概率β越大，反之亦然，若要同时减小α和β，可以通过增加样本容量的方法实现
第八章方差分析
方差分析由R.A.Fisher首先提出，又称F检验。

基本思想：将全部观测值的总变异按影响因素分解为相应的若干部分变异，在此基础上，计算假设检验的统计量F值，实现对总体均数是否有差别的推断
基本思想分子：组间
①处理因素
②误差因素分母：组内误差因素
步骤：
①提出检验假设，确定检验水准
②计算检验统计量F值
③确定P值，做出推断结论
第三节多个样本均数的两两比较
SNK-Q检验（对于单因素分析 MS误差就是MS组内）各比较组样本含量可不相等
若Q值大于或等于Q界值，则可以推断比较的两组间差别有统计学意义
☆不用T检验的原因：
T检验对K组均数进行两两比较C（2，K）次，需要进行N次比较，若规定检验水准α=0.05，在原假设H0成立的条件下，n次检验均不犯Ⅰ类错误的概率为0.95^n，累计犯Ⅰ类错误的概率为1-0.95^n，可明显大于0.05。

因此，均数间的多重比较不能直接使用两均数比较的t检验。

（对于两组资料的比较，方差分析与t检验——完全等价）
第四节方差齐性检验
Bartlett检验法 Levene检验法
第四章定性数据的统计描述
相对数：两个有关的绝对数之比，也可以是两个有关联统计指标之比
为什么引入相对数？
相对比：①两类别例数之比②相对危险度
比数比：流病中表示病例组和对照组中的暴露比例与非暴露比例的比值之比，反映疾病与暴露之间关联强度的指标标准化率
为了正确比较率，统计学上用标准化的方法消除内部结构构成的影响（选择的标准不同，得到的标准化率可能不同）相对数指标使用的注意问题（简答题） ①不要把构成比与率混淆 ②使用相对数时分母不宜过小 ③注意资料的可比性
④样本率或构成比存在抽样误差
第九章卡方检验
四个表资料的卡方检验
当两个样本率不同时，有两种可能：
1.π1=π2；P1、P2的不同是由抽样误差造成的
2.π1≠π2；P1、P2的不同是由本质差异造成的 χ2
=∑
（A−T ）
2
T
，ν=（行数-1）（列数-1）；A 为实际频数，T 为理论频数（基于H 0成立算得，即π1=π2确定）
计算理论频数公式 T ij =n i .n j n
，n i .n j 为相应行与列的周边合计数，n 为总例数
χ2值反映了实际频数与理论频数的吻合程度。

若检验假设H0成立，实际频数与理论频数的差值应高较小，即χ2值
也应该较小；若检验假设H0不成立，实际频数与理论频数的差值应高较大，即χ2值也会较大。

因为公式每个加数都大于0，所以自由度愈大，χ2值也会愈大。

（α=0.05，自由度为1时，χ2=3.84）查表：χ2值愈大，P 值愈小；反之χ2值愈小，P 值愈大。

若检验水准为α，当χ2≥χ2α，ν时，P ≤α，拒绝H 0，接受H 1；当χ2＜χ2α，ν时，P ＞α，不拒绝H 0
四个表资料χ2检验的专用公式使用条件：总例数n ≥40且所有格子的T ≥5时，可用专用公式 χ2=
（ad−bc ）2
n
(a+b )(c+d )(a+c )(b+d)
四格表资料χ2检验的校正公式（χ2分布是连续型分布，实际频数A 为分类资料不连续，计算得的χ2值得出的P 偏小）
校正公式为： χ2
=∑（|A−T |−n/2）
2
(
a+b )(c+d )(a+c )(b+d ）
；χ2
=
（|ad−bc |−n/2）2
n
(a+b )(c+d )(a+c )(b+d)
在实际工作中，对于四格表资料，常用规定为（简答题）
①当n ≥40且所有的T ≥5时，用χ2检验的基本公式或四格表资料χ2检验的专用公式 ②当n ＜40但有1＜T ＜5时，用四格表资料χ2检验的校正公式 ③当n ＜40或T ＜1时，用四格表资料的Fisher 确切概率法
配对四格表资料的χ2检验
总体有B=C b+c ≥40→χ2
=
（b−c ）2
b+c
, ν=1 ; b+c ＜40→χ2
=
（|b−c |−1）
2
b+c
,ν=1
R*C 列联表资料的χ2检验多个样本率间多重比较
Bonferroni 方法，重新规定检验水准α’ ;
多个实验组间两两比较：α’=
α
(k 2)
（(k 2) =(k−1)k 2
,k 为需要比较样本率的组数
实验组与同一个对照组的比较：α’=
α
k−1
R*C 列联表资料的χ2检验的注意事项（简答题）
1.对于多个率或频率分布比较的χ2检验，结论为拒绝H 0时，仅表示多组之间有差别，并不是任意2组之间都有差别。

若要明确哪两组之间不同，还需要进一步作两两比较
2.R*C 列联表χ2检验要求理论频数不宜太小，一般不宜有1/5以上的格子的理论频数小于5，或有一个理论频数小于1
3. χ2检验不适于有序分类资料的比较分析
第五章统计表与统计图
统计表标题在上面；统计图标题在下面（考）
统计表
统计表的编制原则①重点突出，简单明了②主谓分明，层次清楚③数据表达规范，文字和线条从简统计表由标题、标目（包括横标目、纵标目）、线条、文字和备注构成（填空题）统计表分类：简单表、复合表
编制统计表的注意事项：1.统计表不一定是唯一的2.避免内容混杂，表达不清，结构混乱
统计图。