卫生统计学整理笔记
卫生统计学知识点整理

卫生统计学知识点整理1.数据类型:卫生统计学包括两种主要类型的数据,即定量数据和定性数据。
定量数据是数值型数据,如身高、体重等,可以使用各种统计方法进行分析。
定性数据是非数值型数据,如性别、职业等,可以使用描述性统计方法进行分析。
2.数据收集方法:卫生统计学使用多种方法收集数据,其中包括调查、观察、实验和文献研究等。
调查是最常用的数据收集方法,通过设计问卷或面对面访谈等手段收集信息。
观察是观察和记录事件或行为,以获取相关数据。
实验是通过对照组和干预组进行比较来确定原因和效果的方法。
文献研究是通过分析已有的文献、报告和统计数据来获取相关信息。
3.数据描述和总结:在数据收集完成后,卫生统计学需要对数据进行描述和总结。
这包括计算各种统计指标,如平均数、中位数、众数和标准差等,以了解数据的分布和变异程度。
4.假设检验:卫生统计学中常用的方法之一是假设检验,用于判断一些变量是否与其他变量有显著关联或差异。
假设检验基于统计学原理,通过计算样本数据与预期数据之间的差异,评估是否拒绝或接受一些假设。
5.相关分析:相关分析是研究两个或多个变量之间关系的统计方法。
它可以确定变量之间的相关性大小和方向,并计算相关系数来度量相关性的强弱。
6.回归分析:回归分析是用来预测和解释一个或多个因变量与一个或多个自变量之间关系的方法。
它可以估计自变量对因变量的影响程度,并评估其统计显著性。
7.生存分析:生存分析是研究个体在一定时间内生存或发生一些事件的概率的统计方法。
它通常用于研究疾病的生存率和治疗效果。
8.抽样方法:抽样方法是在卫生调查中常用的一种方法,它可以通过选择一部分样本来代表整体群体。
常见的抽样方法包括随机抽样、系统抽样、分层抽样和整群抽样等。
9.统计软件:卫生统计学使用各种统计软件来进行数据分析和统计计算。
常用的统计软件包括SPSS、SAS、R和STATA等,它们提供了丰富的统计功能和图形展示方式。
10.数据伦理:卫生统计学中数据伦理是一个重要的问题,主要涉及数据的保密性、隐私保护和知情同意等方面。
卫生统计学笔记整理

卫生统计学笔记整理第1章绪论1、卫生统计学的概念:2、统计工作的基本步骤:3、卫生统计学的几个基本概念(attention:资料的分类)第2章调查研究设计1、调查研究的特点:2、调查研究的类型,按调查抽样比例划分.第3章实验设计1、实验设计的特点.2、实验设计的三要素四原则。
3、常用的实验设计方案:(attention:正确区别完全随机设计和配对设计)第4章定量资料的统计描述1、频数表的编制步骤和频数表的用途2、集中趋势的描述。
(P55知识点4-2)3、离散趋势的描述。
(P58知识点4-3)4、正态分布的特征5、制定医学参考值范围第5章定性资料的统计描述1、相对数是对定性资料进行统计描述的一类指标。
2、常用相对数(率、构成比、相对比)的定义3、应用相对数需要注意的问题[知识点5-3] P694、标准化法的意义和基本思想5、标准化率的计算方法与注意事项[知识点5-5] P74补充:1、该方法便于比较,但不能反映实际情况。
2、并非所有资料都可以计算标准化率,若各组间出现交叉,不宜用该方法。
3、两样本做标准化率后应做假设检验第6章总体均数和总体率的估计1、抽样误差的概念。
2、标准误的概念。
[知识点6-2] P793、t分布(了解)(一)t分布的概念与计算公式(二)t分布的特征与t界值表4、可信区间的概念。
5、总体均数的估计方法:[知识点6-3] P83第7章假设检验1、假设检验的基本思想及基本步骤[知识点7-1] P922、Ⅰ型错误与Ⅱ型错误。
[知识点7-2] P933、单侧检验与双侧检验区分。
[知识点7-3] P954、假设检验应该注意的问题。
[知识点7-3] P97第8章 t检验第一节样本与总体均数的比较1.检验步骤2.[知识点8-1] P1003.当样本数量n≧50或总体均数已知时用z检验[知识点8-2] P102第二节配对设计均数的比较1.检验步骤2.[知识点8-3] P103第三节两样本均数的比较1.检验步骤2.z检验的适用条件第9章方差分析第一节方差分析的基本思想和应用条件(1)总变异、组间变异、组内变异的定义与公式(2)条件:符合定量资料,具有独立性正态分布方差齐性的特征,多样本(3或3个以上)间的比较第二节完全随机设计的方差分析(1)检验步骤(2)注意事项:[知识点9-2] P120第四节多个样本均数的两两比较1.q检验适用范围:当方差分析得出结论拒绝H0接受H1假设时需进行q检验2.掌握检验步骤第10章 X2检验第一节2x2表的X2 检验(一)完全随机设计X2 检验1.检验步骤及公式2.注意事项:[知识点10-2] p141(二)配对设计X2 检验1.检验步骤及公式2.[知识点10-3] p142第二节RⅹC表的X2 检验1.注意事项:[10-4] p143第11章非参数检验适用条件:(1)总体分布形式未知或分布类型不明(2)偏态分布的资料(3)等级资料不能精确测定,只能以严重程度优劣等级次序先后等表示(4)不满足参数检验条件资料各组方差明显不齐(5)数据的一端或两端为不确定数值的资料、等级资料(6)[知识点11-1] p153第一节秩和检验1.检验步骤:详读p154 (2)(3)3.第二节两样本比较的秩和检验1.掌握编秩的方法2.注意条件详看p157的3第12章双变量关联性分析第一节直线相关1、直线相关的概念:又称简单相关,是用来描述具有直线关系的两变量x、y相互关系的统计方法,要求两变量均来自双变量正态分布的随机变量,且两变量不分主次,处于同等地位。
卫生统计学知识点汇总

卫生统计学知识点汇总卫生统计学知识点汇总卫生统计学是一门研究如何收集、整理、分析和解释与人类健康相关的统计数据的学科。
以下是一些卫生统计学的知识点汇总:1. 健康指标和健康统计数据卫生统计学研究的核心是健康指标和健康统计数据。
健康指标是用来衡量人类健康状况的指标,如死亡率、发病率、存活率等。
健康统计数据是指收集和整理的与人类健康相关的数据信息。
2. 健康调查和流行病学研究卫生统计学包括健康调查和流行病学研究。
健康调查是通过问卷调查、面访和体检等方式,对人群的健康状况进行评估和监测。
流行病学研究是研究疾病在人群中分布、发生和传播规律的学科。
3. 死因统计学死因统计学是研究人口死亡原因及其统计方法的学科。
通过对死亡证明和其他相关资料的分析,可以得到不同死因的死亡率和死因结构,为公共卫生和医疗健康政策制定提供依据。
4. 卫生服务利用统计卫生服务利用统计研究人群对卫生服务的需求,以及卫生服务的提供情况。
包括统计各类卫生机构的数量、位置和服务范围,以及人群对卫生服务的需求和利用情况。
5. 卫生经济学指标卫生经济学指标是研究卫生经济学相关问题的统计指标。
包括卫生资源投入和产出指标,如医疗卫生总费用、卫生人力资源和医疗服务产出等。
6. 因素分析和回归分析因素分析是研究多个相关变量之间关系的统计方法,可以用于探索影响健康的各种因素。
回归分析是通过建立数学模型,研究一个或多个自变量对因变量的影响程度和方向。
7. 卫生统计学软件与工具卫生统计学的研究除了基本的统计学知识外,还需要掌握一些卫生统计学软件和工具的使用。
如SPSS、R、EpiInfo等数据处理和分析软件。
以上是一些卫生统计学的知识点汇总,这门学科涵盖了众多的知识领域,为研究人类健康提供了重要的数据支持和决策依据。
卫生统计学知识点(笔记)

第一章绪论1.统计学(statistics)是一门处理数据中变异性的科学与艺术,内容包括收集、分析、解释和表达数据,目的是求得可靠的结果。
2.▲总体(population)用来表示大同小异的对象全体,例如一个国家的所有成年人;某地的所有小学生。
可分为目标总体和研究总体。
若试图对某个总体下结论,这个总体便称为目标总体(target population);资料常来源于目标总体中的一个部分,它称为研究总体(study population)。
需要谨慎的是,就研究总体所下的结论未必适用于目标总体。
3.▲样本(sample)是指从研究总体中抽取的一部分有代表性的个体。
获取样本的过程称为抽样(sampling)。
抽样研究的目的是用样本数据推断总体的特征。
需要注意的是,统计学的结论从来就不是完全肯定或完全否定的,能不能成功地达到从样本推断总体的目的,关键是抽样的方法、样本的代表性和推断的技术。
4.▲同质(homogeneity)是指同一总体中个体的主要性质相同。
5.▲变异(variation)是指同质的个体之间存在的差异。
6.▲变量的类型二分类变量分类变量或名义变量定性变量多分类变量变量有序变量或等级变量定量变量离散型变量连续型变量变量的转化:只能由“高级”向“低级”转化,即由信息量多的向信息量少的类型转化,如:定量有序分类二值7.▲参数(parameter)是反映总体特征的指标,参数的大小是客观存在的,是一个常数,不会发生变化,然而往往是未知的,需要通过样本资料来估计,如总体均数μ,总体标准差σ。
8.▲统计量(statistic)又称样本统计量,是反映样本特征的指标,是由观察资料计算出来的,如样本均数 X,样本标准差S。
统计学的任务就是依据样本统计量来推断总体参数。
9.▲概率与频率的区别:概率是参数,频率是统计量;频率总是围绕概率上下波动。
当某事件发生的概率≤0.05时,即P≤0.05,统计学习惯上称该事件为小概率事件。
卫生统计学知识点总结

卫生统计学统计工作基本步骤:统计设计(调查设计和实验设计)、资料分析{收集资料、整理资料、分析资料【统计描述和统计推断(参数估计和假设检验)】。
★统计推断:是利用样本所提供的信息来推断总体特征,包括:参数估计和假设检验。
a参数估计是指利用样本信息来估计总体参数,主要有点估计(把样本统计量直接作为总体参数估计值)和区间估计【按预先设定的可信度(1-α),来确定总体均数的所在范围】。
b假设检验:是以小概率反证法的逻辑推理来判断总体参数间是否有质的区别。
变量资料可分为定性变量、定量变量。
不同类型的变量可以进行转化,通常是由高级向低级转化。
资料按性质可分为计量资料、计数资料和等级资料。
定量资料的统计描述1频率分布表和频率分布图是描述计量资料分布类型及分布特征的方法。
离散型定量变量的频率分布图可用直条图表达。
2频率分布表(图)的用途:①描述资料的分布类型;②描述分布的集中趋势和离散趋势;③便于发现一些特大和特小的可疑值;④便于进一步的统计分析和处理;⑤当样本含量足够大时,以频率作为概率的估计值。
★3集中趋势和离散趋势是定量资料中总体分布的两个重要指标。
(1)描述集中趋势的统计指标:平均数(算术均数、几何均数和中位数)、百分位数(是一种位置参数,用于确定医学参考值范围,P50就是中位数)、众数。
算术均数:适用于对称分布资料,特别是正态分布资料或近似正态分布资料;几何均数:对数正态分布资料(频率图一般呈正偏峰分布)、等比数列;中位数:适用于各种分布的资料,特别是偏峰分布资料,也可用于分布末端无确定值得资料。
(2)描述离散趋势的指标:极差、四分位数间距、方差、标准差和变异系数。
四分位数间距:适用于各种分布的资料,特别是偏峰分布资料,常把中位数和四分位数间距结合起来描述资料的集中趋势和离散趋势。
方差和标准差:都适用于对称分布资料,特别对正态分布资料或近似正态分布资料,常把均数和标准差结合起来描述资料的集中趋势和离散趋势;变异系数:主要用于量纲不同时,或均数相差较大时变量间变异程度的比较。
卫生统计学的重点归纳

卫生统计学的重点归纳卫生统计学的重点归纳一、卫生统计学的定义卫生统计学是以统计理论和方法为基础,应用数学、物理、化学、计算机等学科技术,研究卫生和医疗问题的数据分析方法。
它以收集,处理,分析和解释卫生和医疗等领域的统计数据为基础,以定量分析和定性分析卫生数据,研究卫生和应用流行病学方法,识别患病危险因素,以及制定卫生与医疗保健的政策与措施,为医学和公共卫生提供科学依据的一门学科。
二、卫生统计学的基本原理(1)基本理论卫生统计学的基本理论包括:(1)数理统计学:数理统计学是以统计学的数据处理方法为工具,探讨多变量间相互关系的学科;(2)社会科学统计学:社会科学统计学是以统计学的方法为工具,研究社会判断和实证研究的学科;(3)中国统计学:中国统计学是以中国传统的统计学理论和方法为基础,研究社会发展进程中社会变迁的学科;(4)应用统计学:应用统计学是以统计学的方法来解决实际问题,如实验设计与分析、生态学分析、经济学分析等。
(2)基本方法卫生统计学的基本方法包括:(1)分类法:分类法是按照实际问题的性质,将被研究对象进行科学的定性分类;(2)测度法:测度法是按照实际问题的性质,将被研究对象进行科学的定量测度;(3)统计方法:统计方法是利用统计技术处理数据,以处理、描述、分析和预测实证问题;(4)流行病学方法:流行病学方法是指在全面调查的基础上,利用统计技术,研究病因、流行病学及其预防控制等方面的方法。
三、卫生统计学的应用1、卫生统计学用于事件分析。
事件分析包括:病原体检测、医疗并发症监测、病因研究、新药研发、疾病控制等研究;2、卫生统计学用于政策分析,为卫生政策、医疗政策、公共卫生政策的制订、实施和评价,提供科学依据;3、卫生统计学用于质量控制。
对质量控制体系中的质量指标进行定量分析、定性分析和评价;4、卫生统计学用于教育考试。
有助于改进教育评价,提高客观能力,开发判断及决策技能;5、卫生统计学用于职业卫生领域,可以指导职业卫生政策的制定和促进各种职业病的预防。
卫生统计学-重点整理资料

卫生统计学第一章绪论1、卫生统计学的概念(P1)卫生统计学是应用概率论和数理统计学的基本原理和方法,研究居民卫生状况以及卫生服务领域中数据的收集、整理和分析的一门科学,是卫生及其相关领域研究中不可缺少的分析问题。
2、卫生统计学的4个基本步骤(P3):设计、收集资料、整理资料、分析资料3、卫生统计学的几个基本概念(P4):⑴同质:在统计学中,若某些观察对象具有相同的特征或属性,我们就称之为同质,或具有同质性。
⑵变异:同质个体的某项特征或属性的观察值或测量值之间的差异。
⑶总体:同质的所有观察单位某种特征或属性的观察值或测量值的集合。
⑷样本:从总体中随机抽取的具有代表性的部分观察单位的集合。
样本中包含的观察单位个数成为样本含量。
⑸参数:反映总体特征的指标,一般是未知的,常用希腊字母表示,如总体均数μ、总体率π等。
⑹统计量:根据样本观察值计算出来的指标,常用拉丁字母表示,如样本均数⎺x 、样本率ρ等。
⑺变量与资料:对每个观察单位进行观察或测量的某项特征或属性称为变量;变量值的集合成为资料。
⑻定量资料:亦称计量资料,其变量值是定量的,表现为数值大小,一般有度、量、衡单位。
⑼定性资料:亦称分类资料,其观察值是定性的,表现为互不相容的类别或属性,一般无度、量、衡单位。
可细分为:①计数资料;②等级资料第二章调查研究设计★1、调查研究的特点(P7):①不能人为施加干预措施;②不能随机分组;③很难控制干扰因素;④一般不能下因果结论2、常用抽样方法(名称、原理):⑴单纯随机抽样:先将调查总体的全部观察单位统一编号,然后采用随机数字表、统计软件或抽签方法之一随机抽取n(样本大小)个编号,由这n 个编号所对应的n个观察单位构成研究样本。
⑵系统抽样:又称机械抽样或等距抽样。
事先将总体内全部观察单位按某一顺序号等距分成n(样本大小)个部分,每一部分内含m个观察单位;然后从第一部分开始,从中随机抽出第i号观察单位,依此用相等间隔m机械地在第2部分、第3部分直至第n部分内各抽出一个观察单位组成样本。
卫生统计知识点总结

卫生统计知识点总结1. 卫生统计学的基本概念卫生统计学主要包括了一些基本的概念,比如卫生数据的来源、收集、整理和分析方法等。
卫生数据的来源通常包括了临床记录、流行病学调查、专门调查、统计报表等。
在数据收集方面,卫生统计学强调了数据的质量和准确性,以及避免数据偏倚和错误。
数据整理方面,卫生统计学的方法包括了数据清理、归并和分类等,以确保数据的有效性和可分析性。
而在数据分析方面,卫生统计学的方法包括了描述性统计、推断性统计、假设检验、回归分析、生存分析等。
2. 卫生调查和流行病学卫生统计学与卫生调查和流行病学密切相关。
卫生调查是指对于个人和集体的健康状况、卫生问题和医疗服务等进行调查的活动。
流行病学则是研究人群中疾病的发病规律和传播特点的学科。
卫生调查和流行病学的知识点包括了调查设计、样本选择、问卷设计、调查实施、数据分析和结论推断等。
在卫生调查和流行病学中,卫生统计学的方法和技巧是非常重要的。
3. 生物统计学和生物信息学生物统计学是统计学在生物学领域的应用,包括了基因组学、蛋白质组学、代谢组学等领域的统计方法。
在卫生统计学中,生物统计学的知识点包括了遗传分析、基因关联研究、基因组关联分析、蛋白质质谱分析等。
而生物信息学则是应用计算机和统计学方法进行生物学数据的处理和分析,包括了序列比对、基因结构预测、蛋白结构预测、基因表达分析等。
在当今的医学和卫生领域,生物统计学和生物信息学的知识是非常重要的。
4. 健康统计学健康统计学是研究人群健康状况、卫生问题和医疗服务等的统计学方法和理论。
健康统计学的知识包括了健康指标的计算、健康数据的分析、健康状况的评估、卫生问题的研究和医疗服务的评价等。
在健康统计学中,常用的指标包括了死亡率、发病率、患病率、健康质量等。
健康统计学的知识对于评价和改善人群健康状况具有非常重要的意义。
5. 卫生经济学和医疗统计学卫生经济学是研究卫生服务的经济问题的学科,主要包括了卫生支出、卫生保险、医疗机构的效率和成本、医疗资源的配置等。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
方差分析条件
1.样本是正态分布总体的随机样本
2.方差齐
3.观察值相互独立
卡方分布:n个相互独立的标准正态分布的平方和。
拟合优度检验
定义:利用样本频数分布,检验样本是否来自一个理论总体。
原理:判断样本观察频数(Observed frequency)与理论频数(Expected frequency )之差是否由抽样误差所引起
假设检验的思想
反证法
小概率事件
应用假设检验注意事项
统计推断并非对所有数据有效,要有严密的设计,设计与分析是一个整体。
选择假设检验方法时,要符合相应条件。
权衡I类错误和II类错误,选择合适的检验水准。
正确选择单双侧检验。
正确理解P值得意义,区分统计学意义和专业意义,有统计学意义不意味着有专业意义。P值很小反映如果拒绝H0犯一类错误的概率很小,不代表差异很大。不要忽略无统计学意义的结果,有专业意义不意味着有统计学意义。
抽样调查数据:对总体中的样本进行了解,即通过观察性研究获得的数据。
特点:观察者对被观察事物或现象在不进行任何干预的情况下所作的观察。
实验数据:通过实验性研究所得到的数据。
特点:研究对象所处的状态是由研究者决定的。研究者决定研究对象状态的过程称为给予人为的干预措施。
随机抽样:总体中每个个体有相同的机会被选中作为样本参与调查。
3.样本量小(不是必须条件)
两独立样本资料的t检验的条件
两总体σ未知
两样本相互独立,来自正态分布总体的随机样本
样本量小(不是必须条件)
为什么要进行两两比较?
当方差分析拒绝H0时,表明多组均数之间不全相同。我们要面临着发现哪些组之间不相同,哪些组之间是相同的问题。
为什么不能直接进行t检验?
两两比较的方法
2.样本是正态分布总体的随机样本
3.样本量小(不是必须条件)
单样本Z检验的条件
1.总体σ已知或σ未知但样本量大
2.样本是正态分布总体的随机样本
配对设计:将两个受试对象按配对条件(相同属性)配成配对子,每对配对子中的个体接受不同的处理。
同体配对
异体配对
配对设计t检验的条件
1.差值总体σ未知
2.差值样本是正态分布总体的随机样本
中位数条件:
所有分布、尤其偏态分布:
1.变量值中出现个别特小或特大的数值
2.资料的分布呈明显偏态
3.含有不确定数值
4.资料的分布不清
极ห้องสมุดไป่ตู้应用条件:所有分布、尤其偏态分布
不足:
不能全面的反映所有值的偏离程度
不稳定、小样本小于大样本、样本小于总体
四分位数间距应用条件
所有分布、尤其偏态分布:
1.变量值中出现个别特小或特大的数值
二项分布的应用条件
互斥性
稳定性
独立性
泊松分布
定义:随机变量X的概率分布为
则称X服从参数为的泊松分布,记为X~P()。
作用:用于描述罕见事件,单位时间、空间等发生概率极低的事件,是二项分布的极端情况。
Poisson分布的图形特点(对称性)
当<20时,Poisson分布对称性差
当≥20时,Poisson分布对称性好,可以近似为正态分布。
谨慎追求统计学意义,结论不能绝对化,因为每次推断都面临I类错误和II类错误中的一个。
t分布特征
单峰、高峰位于中央、0处最高、两边对称下降
t分布曲线下面积规律
有一个参数ν;ν减小,曲线峰下降,尾部上升;ν增加,曲线峰上升,尾部下降
ν增加,t分布逼近z分布
ν趋向无穷大时,t变成z分布
单样本t检验的条件
1.总体σ未知
可得数据:为了某些特定目的已收集或积累的数据。如:各类监测数据、统计年鉴等。
特点:可免费或以低廉价格获取,但通常难以完全满足某些特定的研究目的。
观察性研究:研究者观察并测量研究对象的一个或多个变量,但不施加任何干预措施。
实验性研究:研究者对研究对象施加处理因素即干预措施,并测量一个或多个变量。
实验性研究的因果关联推断更具说服力。
简单随机抽样、系统抽样、分层抽样、整群抽样
简单随机抽样:从总体中以相同机会抽取一定数量个体的一种抽样方式,没有应用复杂的抽样技术。
随机对照试验设计原则
对照
随机化
重复
均衡
随机试验的特点
可重复性:在相同的条件下,可以重复进行。
可观察性:每次试验的可能结果不止一个,并且试验前能明确试验的所有可能结果。
不确定性:进行每次试验之前,不能确定哪一个结果会发生。
意义:人为认为在一次随机试验中,小概率事件不会发生。
二项分布的图形特点(对称性)
当n固定时,越远离0.5,二项分布对称性越差;越靠近0.5,二项分布对称性越好;等于0.5,二项分布对称。
当越远离0.5时,n越小,二项分布对称性越差;n越大,二项分布对称性越好;n越大且n和n(1-)大于5,二项分布近似正态分布。
正态分布
定义:若随机变量X的密度函数为
则称X服从参数为μ,σ的正态分布,记为
正态分布曲线
正态分布的概率密度函数决定的一条,高峰位于中央、均数处最高、两边对称下降、永远不与横轴相交的光滑钟形曲线。
特征
单峰、钟形,均数处最高,两边对称下降,不与横轴相交。
曲线在x=u±σ处为拐点。
μ为位置参数(决定对称轴位置)、σ为尺度参数(决定曲线分散性)。当固定μ时,σ越大,曲线的峰越低,落在μ附近的概率越小,取值就越分散,σ是反映X的取值分散性的一个指标。
2.不能混淆概念,尤其不能以构成比代替率。
3.正确计算合计率(平均率)。
4.在比较相对数时应注意可比性。
5.比较多组样本率(或构成比)时,需假设检验。
为什么要标准化?
当比较多组间率的大小时,各组之间某一因素的构成比不一致(不具有可比性),并且该因素与率有关,此时不能比较合计率,需要进行标准化。
标准化思想
样本空间:随机试验的所有可能的结果构成的集合被称为随机试验的样本空间,记为S。样本空间的元素,即随机试验的每个可能结果,被称为样本点。
事件:具有特定特征的随机试验的结果构成的集合。
随机事件:在随机试验中可能发生也可能不发生的事件,简称事件,用A、B、C等表示。
必然事件:在每次随机试验中都必然发生的事件。
可信区间的含义是:总体均数被包含在该区间内的可能性是1-α,没有被包含的可能性为α。
影响区间估计的因素
准确度:包含总体参数的概率大小
精密度:区间的宽度
影响区间的宽度的因素
置信概率
样本量
标准差
假设检验的概念
首先将我们要推断的总体参数或者总体分布(我们要研究的问题)描述成一对假设,然后利用样本的信息判断是否拒绝其中一个假设,接受另一个假设的过程。
偏态分布,无法转换成正态分布。
等级资料。
含有不能或没有精确测量的数据,如大于或小于。
分布不易确定或未知。
秩和检验:是一类重要的非参数检验,基于秩转换,对原始数据从小到大编秩次。
线性相关系数:定量反映两变量线性相关的密切程度和方向的指标,又称Pearson相关系数。
线性相关分析注意事项
线性相关分析,先画散点图,再计算线性相关系数。
2.资料的分布呈明显偏态
3.含有不确定数值
4.资料的分布不清
方差应用条件:
对称分布,尤其正态分布
变异系数应用
1.量纲不一致
2.均数相差较大
散点图作用
观察两组数据的总体趋势和明显偏离趋势的观察点
判断两组数据的关联形式、方向和密切程度
相关分类
线性相关
秩相关
分类变量相关
线性相关意义
r>0表示正相关,r=1表示完全正相关;r<0表示负相关,r=-1表示完全负相关。
相对数:选择一个数作为参照,计算比值。
率
构成比
比
率
作用:反映随机事件(现象)发生的频率或强度。
按照作用分为:
频率型指标
强度型指标
频率型指标
作用
反映随机事件发生的频率,用于估计概率。
1.无单位
2.取值范围[0,1]
强度型指标
作用反映随机事件发生的强度,用于估计单位时间的概率。
1.有单位(人/人时)
2.取值范围[0,∞)
构成比
作用说明某一事物内部各组成部分占总的比重或分布。
计算
1.无单位
2.取值范围[0,1]
相对比,简称比,是两个有关指标A、B之比,说明A是B的若干倍或者百分之几。
1.A、B可以是绝对数、相对数、平均数
2.A、B性质可以相同、可以不相同
相对数应用注意事项:
1.计算相对数时分母一般不宜过小,如果太小用绝对数描述。
如何绘制频数表?
求组距
确定各组段的两个端点
归组计数
频数分布表与分布图作用
1.揭示变量分布形态
2.揭示变量分布趋势
3.便于发现特大的或特小的极端值
4.便于进一步计算统计指标和分析
5.作为一种数据陈述的形式
算数应用条件:
对称分布,尤其正态分布
几何应用条件:
1.对数对称分布、等比资料
2.变量值中不能有0;不能同时有正值和负值;若全是负值,计算时可先把负号去掉,得出结果后再加上负号。
R×C列联表资料卡方检验注意事项
理论频数不能太小(T < 1或1≤T < 5的格子数超过20%):如果出现,可采用如下方法:
1.增加样本量
2.合并相应的列或者行
3.删除相应的列或者行
4.用Fisher确切概率法
参数检验:对总体参数进行的假设检验,对总体分布要求严格。
非参数检验:对总体分布进行的假设检验,对总体分布不作严格要求,不依赖于总体分布类型。