医学统计学重点总结

合集下载

医学统计学重点重点知识总结

医学统计学重点重点知识总结

医学统计学重点一.选择1.几何均数:平均血清抗体滴度(如P9例2.4)2.正态分布:横轴为µ1.962.5%单侧双侧90%: 1.6495%: 1.64 1.9699%: 2.583.P值与ɑ的关系,ɑ是人为规定的,它们之间没有关系; P值↑,ɑ↑(×)4.方差分析自由度v的计算,v总=n-1;v组间=组数(k)-1;v组间=v总-v组间5.理论秩和(n(n+1)/2),实际秩和(通过平均秩次算)6.可信区间的正确应用:总体参数有95%的可能落在该区间内(×);有95%的总体参数在该区间内(×);该区间包含95%的总体参数(x);该区间有95%的可能包含总体参数。

(x);这个区间的可信度为95%(√);总体参数只有一个,要么在区间内,要么不在7.相关系数与回归系数:相关系数为0,两个变量之间没有相关关系(×);回归系数↑,相关系数↑(×);(要做假设检验)二、名解1.参考值范围:根据正常人的数据估计绝大多数的正常人所在的范围2.区间估计(可信区间):按一定的概率或可信度(1-α)用一个区间估计总体参数所在范围。

这个范围称作可信度为1-α的可信区间,又称置信区间。

3.P值:拒绝H0时所冒的风险(或“作出拒绝H0 而接受H1 ”结论时冒了P风险)4.ɑ(第一类错误):H0真实时被拒绝(或H0真实时,拒绝H0,接受H1)5.β(第二类错误):H0不真实时不拒绝(或H0不真实时,不拒绝H0)1-β检验效能:对真实的H1做肯定结论之概率6.秩次:是指全部观察值按某种顺序排列的位序;7.秩和:同组秩次之和8.剩余标准差:扣除了X的影响后,Y方面的变异; 引进回归方程后, Y方面的变异。

三、简答1.假设检验与可信区间的联系与区别分辨多个样本是否分别属于不同的总体,并对总体作出适当的结论。

分辨一个样本是否属于某特定总体等。

区间估计(可信区间):按一定的概率或可信度(1-α)用一个区间估计总体参数所在范围。

医学统计学重点总结

医学统计学重点总结
医学统计学
综合练习
三类资料
(1) 定量资料(quantitative data) 以定量值表达每个观察单位的某项观察指标, 如血脂、心率等。 特点:
① 各观察单位间只有量的差别; ② 数据间有连续性。
三类资料
(2) 定性资料(qualitative data) 以定性方式表达每个观察单位的某项观察指标, 如血型、性别等。 特点:
举例 血型(A、B、O、AB) 人群中某病发生与否(发生、不发生)
描述指标: 相对数
率 构成比 相对比
常用相对数(1)
率(rate),又称频率指标,说明某现 象发生的频率和强度。(强度相对数)
率 = 可 实 能 际 发 发 生 生 某 某 现 现 象 象 的 的 观 观 察 察 单 单 位 位 总 数 数 比 例 基 数
比 A B
四格表(fourfold table)的概念
a
b
c
d
这四个格子的频数是整个表的基本数据,其 余数据都是从这四个基本数据推算出来的,这 种资料称为四格表资料。
2检验的基本思想
如果H0假设成立,则实际频数( actual
frequency)与理论频数应该比较接近。
如果实际频数与理论频数相差较大,超出了
区别
r 没有单位,b有单位;所以,相关系数与单位无 关,回归系数与单位有关;
相关表示相互关系;回归表示依存关系; 对资料的要求不同:
当X和Y都是随机的,可以进行相关和回归分析; 当Y是随机的(X是控制的),理论上只能作回归而不能作相关分析

实验研究的基本要素
处理因素:作用于受试对象,要求在实验过 程中观察其处理的因素
两样本比较的秩和检验(基本原理) Wilcoxon符号秩和检验(基本原理)

医科大学医学统计学重点知识总结

医科大学医学统计学重点知识总结

第一章绪论1、统计学的定义:统计学研究数据的收集、整理、分析的一门学科。

医学统计学:医学统计学是以医学理论为指导,应用概率论与数理统计的有关原理、方法,研究医学资料的搜集、整理、分析和推断的一门科学。

2、医学统计研究三个步骤:研究设计、资料分析、结论3、(必考的)几个概念:(1)同质:性质相同异质:性质不同观察单位间的同质性是进行研究的前提同质是相对的(不同研究中或同一研究中不同观察指标对观察对象的同质性的要求不同)(2)个体变异:同质个体间的差异。

变异的两个方面:不同观察单位(个体)间的差别;同一个体在不同阶段的差别(重复测量)个体变异是普遍存在的;个体变异是有规律的。

注意:由于个体变异的存在,同质个体指标的取值会存在差异!(例:体温波动)(3)总体:按研究目的所确定的同质研究对象的全体。

有限总体:有时间、空间的概念,观察单位有限无限总体:无时间、空间的概念(例:某种治疗措施的效果,就包括接受这种治疗措施的所有病人过去、现在、未来,因而观察单位无限)(4)个体:组成总体的基本单位。

样本:从研究总体中随机抽取具有代表性的部分观察单位随机性的三个体现:抽样随机、分组随机、试验顺序随机(5)随机变量:观察对象个体的特征或测量的结果观察结果在一定范围内以一定的概率分布随机取值的变量,表示随机现象。

在一定条件下,并不总是出现相同结果变量值:个体观察指标具体取值(6)总体参数:总体的统计指标或特征值固有的、不变的,但往往是未知的(7)样本统计量:由样本所算出的统计指标或特征值已知的,且随着试验的不同而不同,但分布是有规律的(8)样本含量:样本中包含个体的数量(9)频率f=m/n,f的值随n的增大接近常数p,概率P(A)=p即:频率为一变量,是样本统计量;概率为常数,是一总体参数小概率事件:概率小于等于0.05小概率原理:小概率事件在一次试验中是不会发生的(10)抽样误差:两个表现:样本统计量与总体参数间的差别;不同样本统计量间的差别两个原因:个体变异;抽样过程抽样误差不可避免,但是有规律。

医学统计学重点

医学统计学重点

医学统计学重点说明:本重点仅供参考:不能包括所有选择题考题,名词和简答可信度高,计算题熟练运算过程;同时自己要清楚各种检验方法的基本思想,重点程度与星号数量相关)一、名词解释1、★★★医学统计学:用概率论和数理统计方法研究医学事件的群体特征的一门方法。

2、★总体:根据研究目的确定的同质的研究对象的全体(集合)。

3、样本:从总体中随机抽取的部分研究对象。

4、随机:总体中每个个体有同等的机会进入样本。

5、系统误差:指数据搜集和测量过程中由于仪器不准确、标准不规范等原因,造成观察结果呈倾向性的偏大或偏小,这种误差称为系统误差。

6、随机误差:由于一些非人为的偶然因素使得结果或大或小,是不确定、不可预知的。

7、★★抽样误差:由于抽样原因造成的样本指标与总体指标之间的差,或者是样本指标与样本指标之间的差。

8、准确度(accuracy)或真实性(validity):观察值与真值的接近程度,受系统误差的影响(9、可靠度(reliabiliy)——也称精密度(precision)或重复性(repeatability):重复观察时观察值与其均值的接近程度,受随机误差的影响。

10、★★★小概率事件:一般常将p ≤ 0.05或p ≤ 0.01称为小概率事件,表示某事件发生的可能性很小。

通俗讲一次抽样是不可能发生的事件。

11、★★正态分布定:又称高斯分布,是一条中间高,两头低,左右完全对称地下降,但永远不与横轴相交的钟形曲线。

12、★★医学参考值范围:指绝大多数正常人的解剖、生理、生化、免疫及组织代谢产物的含量等各种数据的波动范围。

最常用的是95%参考值范围。

13、★★标准误:用于反映均数抽样误差大小的指标,也叫样本均数的标准差,它反映了样本均数之间的离散程度。

14、★95%的可信区间:如果从同一总体中重复抽取100个独立样本,将可能有95个可信区间包括总体均数,有5个可信区间未包括总体均数。

二、填空题1、★医学统计学工作基本步骤:统计设计;收集资料.;整理资料;分析资料2、★统计分析包括:统计描述、统计推断3、频数分布的两个重要特征:集中趋势和离散趋势4、正态分布的两个参数:均数;标准差。

医学统计学 重点知识总结

医学统计学 重点知识总结

名词解释1、一类错误:拒绝了实际上成立的Ho,这类“弃真”的错误称为I型错误或第一类错误。

2、参数和统计量:这些总体的统计指标或特征值称为参数。

由样本所算出的统计指标或特征值称为统计量。

3、变异系数:亦称离散系数,为标准差与均数之比,常用百分数表示。

4、P值:即概率,反映某一事件发生的可能性大小。

5、检验效能:1-β称为检验效能或把握度,即两总体却有差别,按α水准能发现它们有差别的能力。

简答题1、描述数值变量资料(统计资料)的集中程度有哪些指标,有何运用条件?算数均数:单峰对称分布的资料几何均数:对数变换后的单峰对称的资料中位数:偏态分布,分布不明资料,有不确定值的资料。

百分位数:当样本含量较少时不宜用靠近俩端的百分位数来估计频数分布范围。

2、实验研究的基本要素和基本原则是什么?基本要素:处理因素、受试对象和实验效应。

基本原则:对照原则、随机化原则和重复原则大题1、(1)变量资料(2)成组t检验对立性正态性方差齐性(3)HO:μ1=μ2,新药与常规药物的疗效相同H1:μ1≠μ2,新药与常规药物的疗效不同α=0.05T=1.0195V=n1+n2-2=18(2)t<t0.05,18 ,p>0.05,按a=0.05水准,不拒绝H0,差别无统计学意义。

结论:t检验结果表明,故尚不能认为新药与常规药物的疗效相同。

2、(1)T=13×17/47=4.7(2)x2 检验(3)X2>X2(0.05,1),p<0.05,按a=0.05水准,拒绝H0,接受H1,差别有统计学意义。

结论:x2检验结果表明,乙疗法比甲疗法好。

3、(1)成组设计两样本比较的秩和检验(2)实验组秩次:13、11.5、8.5、14、15.5、15.5、17、18对照组秩次:1、2、4、3、5、6、8.5、7、10、11.5(3)H0:两组局部温热的疗效总体分布相同H1:两组局部温热的疗效总体分布不同4(1)Ho:ρ=0,即母体内时间与体重无线性相关关系H1:ρ≠0,即母体内时间与体重有线性相关关系α=0.05F>5.23,拒绝HO,接受H1,相关系数有统计学意义。

医学统计学重点重点知识总结

医学统计学重点重点知识总结

医学统计学重点选择1.几何均数:平均血清抗体滴度(如P9例2.4)2.正态分布:横轴为μ(界值、面积)2.5% I1.962.5%单侧双侧90%: 1.6495%: 1.64 1.9699%: 2.583.P值与α的关系,α是人为规定的,它们之间没有关系;P值f,Qt(X)4.方差分析自由度V的计算,V总=nT;V组间=组数(k)-1;V组间=V总-V组间5.理论秩和(n(n+1)∕2),实际秩和(通过平均秩次算)6.可信区间的正确应用:总体参数有95%的可能落在该区间内(X);有95%的总体参数在该区间内(X);该区间包含95%的总体参数(X);该区间有95%的可能包含总体参数。

(X);这个区间的可信度为95%(√);总体参数只有一个,要么在区间内,要么不在7.相关系数与回归系数:相关系数为0,两个变量之间没有相关关系(X);回归系数t,相关系数t(X);(要做假设检验)二、名解1.参考值范围:根据正常人的数据估计绝大多数的正常人所在的范围2.区间估计(可信区间):按一定的概率或可信度(bα)用一个区间估计总体参数所在范围。

这个范围称作可信度为1-a的可信区间,又称置信区间。

3.P值:拒绝HO时所冒的风险(或“作出拒绝HO而接受H1”结论时冒了P风险)4.a(第一类错误):HO真实时被拒绝(或HO真实时,拒绝H0,接受H1)5.β(第二类错误):HO不真实时不拒绝(或HO不真实时,不拒绝HO)1-β检验效能:对真实的H1做肯定结论之概率6.秩次:是指全部观察值按某种顺序排列的位序;7.秩和:同组秩次之和8.剩余标准差:扣除了X的影响后,Y方面的变异;引进回归方程后,Y方面的变异。

三、简答1.假设检验与可信区间的联系与区别分辨多个样本是否分别属于不同的总体,并对总体作出适当的结论。

分辨一个样本是否属于某特定总体等。

区间估计(可信区间):按一定的概率或可信度(1-a)用一个区间估计总体参数所在范围。

(完整版)医学统计学重点总结

(完整版)医学统计学重点总结

1.简述总体和样本的定义,并且举例说明。

总体是研究目的确定的所有同质观察单位的全体。

样品是从研究总体中抽取部分有代表性的观察单位。

2.简述参数和统计量的定义,并且举例说明。

描述总体特征的指标称为参数,描述样本特征的指标称为统计量。

3.变量的类型有哪几种?举例说明各种类型变量有什么特点。

①定量数据:计量资料;定量的观测值是定量的,其特点是能够用数值的大小衡量其水平的高低。

②定性数据:计数资料;变量的观测值是定性的,表现为互不相容的类别或属性。

③有序数据:半定量数据/等级资料;变量的观测值是定性的,但各类别(属性)有程度或顺序上的差异。

4.请举例说明一种类型的变量如何变换为另一种类型的变量。

定量数据>有序数据>定性数据--------------->5.请简述什么是小概率事件?概率是描述事件发生可能性大小的度量,P 0.05事件称为小概率事件。

≤6.举例说明什么是配对设计。

配对设计是将受试对象按某些重要特征相近的原则配成对子,每对中的两个个体随机地给予两种处理。

①同源配对:同一受试对象或同一标本的两个部分,随机分配接受两种不同处理;②异源配对:为消除混杂因素的影响,将两个同质受试对象配对分别接受两种处理。

7.非参数假设检验适合什么类型数据进行分析?①总体分布类型未知或非正态分布数据;②定量或半定量数据;③数据两端无确定的数值。

8.简述P 25 P 50 P 75的统计学意义。

(条件:明显偏态且不能转化为正态或近似对称;一端或两端无确定数值;分布情况未知)用来描述资料的观测值序列在某百分位置的水平,四分位数间距可以作为说明个体差异的指标(说明个体在不同位置的变异情况)。

9.直条图、直方图、圆饼图的使用条件是什么?直条图:各自独立的统计指标的数值大小和他们之间的对比;直方图:连续变量频数分布情况;圆饼图:全体中各部分所占的比例。

10.统计分析包括哪两个方面的内容?为什么要进行统计推断?统计描述和统计分析;统计描述用来描述及总结一组数据的重要特征,其目的是使实验或观察得到的数据表达清楚并便于分析。

医学统计学重点官方版

医学统计学重点官方版

一:基本概念:1.参数:反映总体的统计指标。

2. 统计量:反映样本的统计指标称为统计量。

3. 概率:描述随机事件发生的可能性的大小的一个量度4.小概率事件:把p小于等于0.05或小于等于0.01的随机事件。

资料类型:计量资料,计数资料,等级资料。

医学统计的基本步骤:研究设计,收集资料,整理资料,分析资料,结果报告与结论表达。

二:变量分布:1.正态分布:指变量的频数或频率呈中间最多,两端逐渐对称地减少,表现为钟形的一种概率分布。

特征:(1)正态分布曲线是单峰,对称,钟形曲线,X=μ时曲线达到最高峰。

(2)正态曲线有两个参数,总体均数μ和总体标准差σ,μ越大曲线右移,越小左移,故称位置参数,σ越小曲线越瘦高,越大曲线越矮胖,故称形状参数。

(3)正态分布曲线下的面积分布具有一定的规律。

P80页。

应用:(1)质量控制(2)是统计学的理论基础(3)制定医学参考值范围制定医学参考值范围:包括绝大多数正常人的人体形态功能和代谢反应等各种生理生化指标的波动范围,是作为判定某项指标正常与否的参考标准。

方法:确定正常人对象的范围,统一测量标准,确定分组,样本含量确定,确定参考值范围的但双侧,确定百分界值,医学参考值范围的估计。

2.二项分布特征:(1)二项分布的图形:当π=0.5时图形对称,π≠0.5时,图形呈偏态,且当n的含量增大时,图形趋于对称。

(2)二项分布的均数与标准差:μ=n π;σ²=nπ(1-π);σ=根号下nπ(1-π)(3)二项分布的正态近似:当n无限增大时越趋近于正态分布。

应用:对立性,独立性,重复性三:统计分析:㈠1.统计描述:图表和指标(1)图表:频数分布图分为正偏态和负偏态,长尾向右侧延伸为正偏态,向左侧延伸为负偏态。

频数分布的特点:集中趋势和离散趋势。

(2)指标:分为计数指标和计量指标。

计数指标:相对数。

应用相对数的注意事项:①计算相对数时分母不宜太小②观测单位数不等的几个率不能直接想加求其合计率③资料对比时注意可比性④资料分析时不能以构成比代替率⑤考虑存在抽样误差计量指标:1.集中趋势:①算数均数χ:适用于对称分布资料,特别是正态或近似正态分布的计量资料。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
小结:
(1) 单个样本均数 H0:μ=μ0t= ν=n-1 (小样本)
(已知样本——均数) H1:μ≠μ0
α=u= 或u= (大样本)(2)配对:H0:μ=μ0
H1:μ≠μ0t= ν=对子数-1
α=
(3) 两独立样本均数H0:μ=μ0t= ν=n1+n2-2
(4)(已知样本——样本) H1:μ≠μ0
9.对任何参数μ和σ的正态分布,都可以通过一个简单的变量变换成标准正态分布,即μ=X-μ
σ
9
标准正态分布
正态分布
面积或概率
-1~1
μ σ
%
~
μ σ
%
·
μ σ
%
10.医学参考值范围(reference value range)传统上称作正常值范围,指正常人的解剖、生理、生化、免疫及组织代谢产物的含量等各种数据的波动范围。习惯上是包含95%的参照总体的范围。
实际工作中标准差 σ往往未知,因而通常用样本标准差S代替σ,求得样本均数 准误估计值S ,计算公式为 S = (当n→无穷,S→σ,S →0)
3 95%的可信区间的计算:x (μ,σ ) 1) σ已知,可信区间= σ
2)σ未知,n为小样本: t 3)σ未知,n为大样本:
T变换
μ变换
N (0,1)
3、t分布曲线的形态变化与自由度v=n-1有关。
2.四格表专用公式(
3对于四格表资料,通常规定为:(1)当n≥40且所有的T ≥ 5时,用检验的基本公式或四格表的专用公式;(2)当n ≥ 40 但有1≤T<5时,用四格表资料的校正公式;(3)当n<40,或T<1时,用四格表资料的Fisher确切 概率法。
4 行×列表资料的χ 检验: 自由度:ν=(行数-1)(列数-1)
4.方差(varience)适用于正态分布,标准差是将方差取平方根,反映一组观察值的离
5.散程度,标准差小,离散程度小,均数代表性好(方差和标准差常与均数一起用)。
6.变异系数(coefficient of variation,CV)常用于度量衡单位不同或均数相差悬殊的两组资料的变异程度,其计算公式为:CV= (CV可能大于1,等于1,小于1;S为标准差,X为均数)
8.正态近似法的条件:当n足够大,且nP和n(1-P)均大于5时,P的分布
接近正态分布,可用公式来求总体率的可信区间:(P- u S ,P+u S )
第八章 χ 检验
a
b
c
d
1.χ 检验常用于检验两个或多个率(或构成比)之间差别是否有统计学意义,可用于检验配对计数资料差异有无统计学意义及两种属性或特征之间是否有关系,还可做频数分布资料拟合优度检验。
G= 为了计算方便,常改用对数的形式计算,即 lg ( )
对于频数表资料,可用公式 G=lg ( )
三 中位数(M)和百分位数
中位数:适用于偏态分布资料,末端无确切数值的资料及分布情况不确定
公式:M=L+( ) L, , 分别为M所在组段的下限,组距和频数, 为M所在组段之前各组数的累积频数。
百分位数:用符号 表示,x即百分位
α=u=
第十二章统计表与统计图
1 统计表可由标题(在表格上方)、标目(包括横标目、纵标目)、线条、数字和备注5部分组成。标题包括时间、地点和研究内容。线条一般采用三横线表。表内不留空格,无数字用“-”表示,缺失数字用“...”表示。备注时用“*”。
2 直条图又称条图,用等宽直条的长短来表示相互独立的统计指标数值大小和它们之间的对比关系。
11.表 参考值范围所对应的百分位数
百分位数(%)
单侧
双侧(对称)
下限
上限
下限
上限
95
P
P
P
P
99
P
P
P
P
第四章 抽样误差与假设检验
1.抽样误差(sampling error) :在抽样的过程中由于个体差异造成的样本统计量与总体参数之间的差异。
2.标准误 (standard error):样本均数中用来衡量抽样误差的大小用符号σ 表示,计算公式为σ = (标准误小于原始测量值的标准差,标准误越小说明估计越精确,因此可以用标准误表示抽样误差的大小)
3构成图常用于描述构成比的资料,常用的构成图有圆图和百分条图。
4 线图适用于描述一个变量随另一个变量变化的趋势。普通线图用来描述变化趋势,半对数线图用来描述变化速度。
5 直方图用于表示连续变量频数分布情况。
6 散点图用点的密集程度和变化趋势来表示两指标之间的直线相关关系。
小结(第二章):算术均数
集中趋势几何均数
1线性相关分析(linear correlation analysis):研究两个服从正态分布的随机变量间有无直线相关关系,关系的方向及关系的密切程度。
2 线性相关系数r没有测量单位,其数值在-1和1之间,相关系数的绝对值
愈接近1,相关愈密切;相关系数愈接近0时,相关愈不密切。自由度:ν=n-2
3 线性相关的步骤:1)绘制散点图2)求相关系数r3)假设检验(H :ρ=0)或查找b界值表4)得出结论
4.应用相对数时的注意事项:1)不要把构成比与率相混淆2)使用相对数时分母不宜过小3)注意资料的可比性4)要考虑存在抽样误差
5.标准构成的选取:1)另外选取一个包含比较各组(如各地区)的有代表性的、较稳定的、数量较大的构成为标准。如世界的、全国的、全省的数据为标准构成2)取比较各组的各层例数的合计为标准构成。3)从比较的各组中任选其一的构成作为标准构成。
特点:各组成部分的构成比之和为100%
某一部分比重增大,则其它部分相应减少。
3.相对比(relative ratio)是两个有关指标之比,用以描述两者的对比水平,常用R表示
R=A指标/B指标 A>B 结果多用倍数表示; A<B 结果多用百分数表示
两指标互不包含,可以是相对数,绝对数,平均数,可以性质不同,不一定有相同的量纲
4、假设实验的基本步骤:1)建立假设和确定检验标准 包括无效假设(符号为H )和备择假设(符号为H )【H 是在H 成立证据不足的情况下而被接受的假设,有双侧和单侧两种情况,未作说明时,选用的均是双侧检验】 检验标准用α表示,一般取α=或α=. 2)选择检验方法和计算检验统计量 3)确定P值和作出统计推断结论【结论:P>α,不拒绝H ,差别无统计学意义,还不能认为两总体均数不等;P<α,拒绝H ,接受H ,差别有统计学意义,结论是两总体均数不相等】
统计描述 (平均水平) 中位数
极差
计量资料 离散趋势 四分位数间距
(变异水平) 方差
标准差
统计推断 变异系数
4总体(population):根据研究目的确定的同质的全部研究对象称总体。
样本(sample):根据随机化的原则从总体中抽出有代表性的一部分观察单位组成的子集称样本。
5参数(parameter):总体的设计指标称为参数。
统计量(statistic):样本的统计指标称为统计量。
6变量(variable):观察对象的特征或指标称为变量,测量的结果即为变量值。
1.率 (rate)—— 表示某种现象发生的频率和强度,通常以百分率(%)、千分率(‰)、万分率(/万)、十万分率(/10万)表示。
率= ×比例基数
2.构成比(constituent ratio):表示某一事物各组成部分所占的比重或分布的情况.
构成比通常以100%为比例基数.
计算公式:构成比= ×100%
医学统计学重点总结(总7页)
医学统计学
第一章医学统计中的基本概念
1医学统计工作的内容:设计,收集资料,整理资料,分析资料。
2资料的类型:计量资料(数值变量),计数资料(无序分类),等
变异(variation):在同质的基础上被观察个体的差异。级分组资料(有序分类)。
3同质(homogeneity):对研究指标有影响的非实验因素相同。
公式: =L+( ) 式中L, , 分别为 所在组段的下限,组距和频数, 为 所在组段之前各组段的累积频数
第三章 变异程度的统计描述
1.衡量.变异程度的指标有:极差,四分位数间距,方差,标准差,变异系数。
2.极差(range)也称全距,即观察值中最大值和最小值之差,用符号R表示。
3.四分位数间距(quartile)用符号Q表示,可以通过计算百分位数 和 之差得到,即Q= ,适用于偏态分布资料,特别是末端没有确定数据的资料(常与中位数一起用)。
4 线性回归(linear regression):用直线回归方程来描述两个变量X和Y数量上依存关系的一种统计分析方法。
5 线性回归的步骤:1)绘制散点图2)作方程3)假设检验:t 检验、方差分析、t =t (X,Yj均服从正态分布)
6线性回归方程: =a+bX,b称为回归系数,b与r的符号一致,b的统计学意义:X每增加(减少)一个单位,Y平均改变b个单位,自变量既可以是随机变量(Ⅱ型回归模型,两个变量都服从正态分布),也可以是给定的量(Ⅰ型回归模型)。计算b和a的数学原理是最小二乘法,该方法的原则是保证各实测点到回归直线的纵向距离的平方和最小。
7 r 是确定系数,R 越接近1,回归效果越好
第九章 非参数检验
1 非参数检验通常适用下列条件:偏态分布或分布不明的资料;末端无确定数值; 方差不齐; 等级资料
2 在资料服从正态分布的前提下,当H 不真时,非参数检验方法不如参数检验方法能灵敏地拒绝H ,换句话说患第二类错误的可能性大于参数检验法。
3 怎样编秩次 依差值绝对值,从小到大编秩,并按差值的正负,标上正负号。编秩时,在正负号不同的差数中,若有绝对值相等的观测值,则取其平均秩次。对差值为0的对子,舍去不计,相应的总的对子数也要减去减去其对子数,记为n。分别求其正负秩次之和T 与T ,并以绝对值较小者作为统计量T值。正负秩和相加应等于总秩和,即T +T =
相关文档
最新文档