医学统计学复习资料
医学统计学总复习--资料

平均数与变异度
均数±标准差(min,max)
中位数±四分位数间距 (min,max) 几何均数± 对数标准差 变异度小,则均数代表性好! 变异度大,数据分散,则均数代表性差! 平均数所表示的集中性与变异度所表示的离散性,从两个 不同的角度阐明计量资料的特征!
1. 某医学资料数据大的一端没有确定数值,描述其集中趋势适用 的统计指标是() A. 中位数 B. 几何均数 C. 均数 D. 频数分布 2. 算术均数与中位数相比,其特点是() A.不易受极端值的影响 B.能充分利用数据的信息 C.抽样误差较大 D.更适用于偏态分布资料 3. 一组原始数据呈正偏态分布,其数据的特点是 A. 数值离散度较小 B. 数值离散度较大 C. 数值分布偏向较大一侧 D. 数值分布偏向较小一侧
男
女 女 男 女
1.71
1.58 1.60 1.76 1.62
A
B O AB O
异常
正常 异常 正常 正常
++
++ ++ +++ +
工人
工人 干部 干部 军人
3.49
5.48 6.78 7.10 5.24
研究设计的常见类型
完全随机设计:将实验对象完全随机地分配 到实验组与对照组或几个对比组中或从几个 不同总体中随机抽样 配对设计:
参考值范围(reference interval)
参考值范围又称正常值范围(normal range)。
什么是参考值范围:
是绝大多数正常人的某观察指标所在的范围。
绝大多数:90%,95%,99%等等。
确定参考值范围的意义:
用于判断正常与异常。
医学统计学复习资料

医学统计学第一章绪论第一节医学统计学的定义和内容1.医学统计学的主要内容 :统计推断、统计描述第二节统计工作的基本步骤1.医学统计工作可分为四个步骤:统计设计搜集资料整理资料分析资料第三节统计资料的类型医学统计资料按研究指标的性质一般分为:定量资料、定性资料、等级资料一、定量资料(计量资料)定量资料(quantitative data)是用定量的方法测定观察单位(个体)某项指标数值的大小,所得的资料称定量资料。
如身高(㎝)、体重(㎏)、脉搏(次/分)、血压(kPa,mmHg)等为数值变量,其组成的资料为定量资料。
二、定性资料(计数资料)定性资料(qualitative data)是将观察单位按某种属性或类别分组,清点各组的观察单位数,所得的资料。
亦称无序分类资料。
如:男-女分组;中医的虚、实,阴、阳等分组;按生存-死亡分组;A、B、O、AB分组。
三、等级资料等级资料(ranked data)是将观察单位按属性的等级分组,清点各组的观察单位数,所得的资料为等级资料。
亦称有序分类资料。
如治疗结果分为治愈、显效、好转、无效四个等级。
:疾病的严重程度可以分为,轻、中、重;中医辨证中舌象的颜色有,淡、红、暗、紫。
♦根据需要,各类变量可以互相转化。
♦若按贫血的诊断标准将血红蛋白分为四个等级:重度贫血、中度贫血、轻度贫血、正常,可按等级资料处理。
有时亦可将定性资料或等级资料数量化,如将等级资料的治疗结果赋以分值,分别用0、1、2…等表示,则可按定量资料处理。
第四节统计学中的几个基本概念一、同质与变异同质(homogeneity)是指观察单位或研究个体间被研究指标的主要影响因素相同或基本相同。
如研究儿童的生长发育,同性别、同年龄、同地区、同民族、健康的儿童即为同质儿童。
变异(variation)由于生物个体的各种指标所受影响因素极为复杂,同质的个体间各种指标存在差异,这种差异称为变异。
如同质的儿童身高、体重、血压、脉搏等指标会有一定的差别。
医学统计学复习资料(完整版)

第1章绪论医学统计学是一门“运用统计学的原理和方法,研究医学科研中有关数据的收集、整理和分析的应用科学。
1.个体:又称观察单位,是统计研究的最基本单位,也是构成总体的最基本的观察单位。
2.总体:根据研究目的确定的同质观察单位某项指标测量值(观察值)的集合。
分为有限总体(明确规定了空间、时间、人群范围内有限个观察单位)和无限总体(无时间和空间范围的限制)。
反映总体特征的指标为参数,常用小写希腊字母表示。
3.样本:从总体中随机抽取的一部分有代表性的观察单位组成的整体。
(抽样,随机化原则,样本含量)根据样本资料计算出来的相应指标为统计量,常用大写英文字母表示。
4.抽样研究:从总体中随机抽取样本,根据样本信息推断总体特征的方法。
抽样误差是由随机抽样(样本的偶然性)造成的样本指标与总体指标之间、样本指标与样本指标之间的差异。
其根源在于总体中的个体存在变异性。
只要是抽样研究,就一定存在抽样误差,不能用样本的指标直接下结论。
统计分析主要是针对抽样误差而言。
5.变量(一个个体的任意“特征”);资料(变量值的集合),资料类型:①计量资料/定量资料/数值变量资料:表现为数值大小,一般有度量衡单位,又可分为连续型和离散型两类;②计数资料/定性资料/无序分类变量资料/名义变量资料:表现为互补相容的属性或类别,一般无度量衡单位,可分为二分类和多分类;③等级资料/半定量资料/有序分类变量资料:表现为等级大小或属性程度。
各类资料间可相互转化。
①可选分析方法有:t检验、方差分析、相关回归分析等;②可选分析方法有:χ2检验、z检验等;③可选分析方法有:秩和检验、Ridit分析等。
6.误差:实测值与真实值之差。
可分为随机误差(随机测量误差+抽样误差)与非随机误差(系统误差与非系统误差)。
①随机误差:是一类不恒定、随机变化的误差,由多种尚无法控制的因素引起,它是不可避免的;②系统误差:是实验过程中产生的误差,它的值或恒定不变,或遵循一定的变化规律,其产生原因往往是可知的或可以掌握的,它是可以消除或控制的;③非系统误差:又称过失误差,是指在实验过程中由于研究者偶然失误而造成的误差,可以消除。
医学统计学复习资料与复习题答案

教学提要(一)《医用统计学》基本概念1、变异:宇宙中的事物,千差万别,各不相同。
即使是性质相同的事物,就同一观察指标来看,各观察指标(亦称个体)之间,也各有差异,称为变异。
同质观察单位之间的个体变异,是生物的重要特征,是偶然性的表现。
2、变量:由于生物的变异特性,使得观察单位某种指标的数值互相不等,所以个体值称为变量值或观察值。
3、总体:即根据研究目的确定的同质的研究对象的全体。
更确切地说,是性质相同的所有观察单位的某种变量值的集合。
4、样本:即从总体中抽取一部分作为观察单位进行观察,这部分观察单位称为样本。
为了使样本对总体有较好的代表性,抽样必须遵循随机化的原则,即总体中每一观察单位均有相同的机会被抽取到样本中去。
5、计量资料(数值变量资料):对每个观察单位用定量方法测定某项指标量的大小,所得的资料称为计量资料,一般有度量衡等单位。
6、计数资料(分类变量资料):将观察单位按某种属性或类别分组,所得各组的观察单位数,称为计数资料。
可分为二项式或多项式分类变量。
7、等级资料:将观察单位按某种属性的不同程度分组,所得各组的观察单位数,称为等级资料。
这类资料与计数资料不同的是:属性的分组有程度的差别,各组按大小顺序排列;与计量资料不同的是:每个观察单位未确切定量,因而称为半定量资料。
8、抽样误差:由于总体中各观察单位间存在个体差异, 抽样研究中抽取的样本, 只包含总体的一部分, 因而样本指标不一定等于相应的总体指标, 这种样本统计量与总体参数间的差别称为抽样误差。
(二)统计工作的基本步骤1、设计: 这是关键的一步。
要求科学、周密、简明。
2、搜集资料: 要求完整、准确、及时。
医学统计资料的来源主要有三个方面:(1) 统计报表; (2) 日常医疗工作的原始记录和报告卡片; (3) 专题调查3、整理资料: 核查资料; 按性质或数量分组, 拟定整理表。
4、分析资料: 包括指标的计算、统计图表的绘制, 用统计方法如参数估计、假设检验等对资料作统计分析。
医学统计学复习资料

医学统计学复习资料导言医学统计学是医学领域中非常重要的一门学科,它的作用是帮助医生和研究人员通过收集、分析和解释数据来评估医学检验和治疗的效果。
本文将提供一份医学统计学的复习资料,帮助读者回顾和巩固相关的知识。
一、基本概念1.1 总体和样本在医学统计学中,总体是指我们研究的整体对象,而样本则是总体的一个子集。
例如,我们对某种疾病的患者进行研究时,患者总体就是所有患该病的人群,而样本则是我们实际观察到的一部分患者。
1.2 参数和统计量在医学统计学中,参数是用来描述总体特征的统计量,例如总体均值、总体方差等。
而统计量是通过样本数据来估计总体参数的量,例如样本均值、样本方差等。
假设检验是医学统计学中常用的一种方法,它用于判断总体参数的假设是否成立。
在假设检验中,我们先假设总体参数的某个值是正确的(称为零假设),然后通过收集样本数据来判断该假设是否成立。
二、数据的分布2.1 正态分布正态分布在医学统计学中非常重要,因为许多统计方法都假设数据服从正态分布。
正态分布具有钟形曲线的特点,均值、中位数和众数都重合在一起。
常见的正态分布检验有Shapiro-Wilk检验和Kolmogorov-Smirnov检验。
2.2 t分布t分布是一种在样本量较小的情况下使用的概率分布,它比正态分布的尾部更加厚重。
t分布的形状取决于样本量,当样本量增加时,t分布逐渐趋近于正态分布。
在医学研究中,常用t分布来进行样本均值的假设检验。
非参数检验是一种不依赖于数据分布的统计方法,它对数据的要求相对较低。
与参数检验不同,非参数检验适用于无法确定数据分布或偏离正态分布的情况。
常见的非参数检验方法有Wilcoxon秩和检验和Mann-Whitney U检验。
三、统计推断3.1 置信区间置信区间是一种用来估计总体参数的范围,它是一个区间,表示我们对总体参数的估计在一定置信水平下的可信程度。
通常,置信区间的宽度与置信水平相关,越高的置信水平意味着更宽的置信区间。
医学统计学复习资料(名解+简答)

医学统计学复习资料(名解+简答)一、名词解释1.统计量 (statistic):统计量是统计理论中用来对数据进行分析、检验的变量。
2.同质 (homogeneity):是指观察单位(研究个体)间被研究指标的影响因素相同。
3. 抽样误差 (sampling error):由于随机抽样造成的样本均数与总体均数的差别。
4. 总体 (population):根据研究目的而确定的同质观察单位的全体称为总体,更确切的说,它是同质的所有观察单位某种观察值的集合。
5. 变异 (variation):变异就是标志在同一总体不同总体单位之间的差别。
6. 参数 (parameter):参数,也叫参变量,是一种变量。
7. 样本 (sample):研究中实际观测或调查的一部分个体称为样本,研究对象的全部称为总体。
8. 概率 (probability):概率是对随机事件发生的可能性的度量,一般以一个在0到1之间的实数表示一个事件发生的可能性大小。
越接近1,该事件更可能发生;越接近0,则该事件更不可能发生。
1. 正态分布 (normal distribution):靠近均数分布的频数最多,离开均数越远,分布的数据越少,左右两侧基本对称,这种中间多、两侧逐渐减少的基本对称的分布,称为正态分布2. 中位数 (median):一组数据按从小到大(或从大到小)的顺序依次排列,处在中间位置的一个数(或最中间两个数据的平均数,注意:和众数不同,中位数不一定在这组数据中)3. 方差 (variance):是各个数据与其算术平均数的离差平方和的平均数,通常以σ2表示。
4. 四分位数间距 (quartile interval):是上四分位数与下四分位数之差,用四分位数间距可反映变异程度的大小。
5. 正偏态分布 (positively skewed distribution):为统计学概念,即统计数据峰值与平均值不相等的频率分布。
如果频数分布的高峰向左偏移,长尾向右侧延伸称为正偏态分布,也称右偏态分布。
《医学统计学》复习资料

统计学概述一、统计学的意义统计学是研究数据的收集、整理、分析的一门科学,是认识社会和自然现象客观规律数量特征的重要工具。
统计学方法就是帮助人们透过偶然现象认识其内在的规律性,揭示疾病或现象发生、发展规律,为预防疾病、促进健康提供客观依据。
二、统计学的基本概念(一)同质与变异同质是指被研究指标的影响因素相同。
变异是同质基础上的观察单位(亦称为个体)之间的差异。
(二)总体与样本总体是指根据研究目的确定的同质观察单位的全体。
样本从总体中随机抽取的部分观察单位,其测量值(或变量值)的集合。
(三)变量与变量值变量:确定总体后,研究者应对每个观察单位的某些特征进行测量或观察,这种特征称为变量,如:身高、体重等。
变量值:变量的测得值。
如身高150cm,体重50Kg等。
(四)参数与统计量参数是指总体特征的统计指标。
如某地健康成年男性的平均血红蛋白值。
统计量是指样本特征的统计指标。
如从某地健康成年男性中抽取一部分人的平均血红蛋白值。
(五)误差误差泛指测量值与真实值之差。
根据误差的性质和来源,统计工作中产生的误差主要有三种类型,即系统误差、随机测量误差、抽样误差。
1.系统误差:测量结果有倾向性。
查明原因,可以避免。
特点:①测量结果有倾向性。
如仪器、试剂、判定标准等。
②查明原因,可以避免。
2.随机测量误差:收集资料的过程中,即使避免了系统误差,但由于各种偶然因素造成的测量值与真实值不完全一致,这种误差称为随机测量误差。
特点:①随机误差没有大小和方向。
②不可避免。
3.抽样误差:由于随机抽样所引起的样本统计量与总体参数之间的差异以及各样本统计量之间的差异称为抽样误差。
特点:变异是绝对的,抽样误差不可避免。
原因:个体之间的差异;抽样时只能抽取总体中的一部分作为样本。
(六)概率(P)概率是描述某随机事件发生可能性大小的量值,常用符号P表示。
随机事件的概率在0~1之间,即0≤P≤1。
小概率事件:P≤0.05或P≤0.01的事件。
医学统计学复习资料

医学统计学复习资料1、卫生统计工作的步骤为统计研究设计、搜集资料、整理资料、分析资料。
2、反应一组数据的平均离散水平是方差。
3、适合任意分布资料,不依赖于总体分布形式的检验方法是Levene检验。
4、临床疗效属于等级资料。
5、有7名高血压患者的收缩压(mmHg)分别是135、130、142、147、150、139、180,计算中位数142。
6、正态分布曲线下横轴上,从μ-1.96σ到μ+1.96σ的面积为95%。
7、SNK-q检验适用于多个样本均数间任意两组的比较方法。
8、比较身高和体重两组数据变异度大小宜采用方差。
9、均数是表示变量值水平的指标是平均。
10、构成比用来反映某事物内部各部分占全部的比重。
11、在配对t检验的双侧检验一般可表示为μd=0。
12、某医院的资料计算各种疾病所占的比例,该指标为构成比。
13、四格表中当a=20,b=60,c=15,d=5时,最小的理论频数等于T2114、比较某地10年间结核与白喉两病死亡率的下降速度,宜绘制半对数线图。
15、直线回归系数的假设检验,其自由度n-1 。
16、就收入而言,高收入所占比例很少,中低收入比例偏高,属于右偏态分布。
17、关于个体变异说法不正确的是增加样本含量,可以减小个体变异。
18、比较身高和体重两组数据变异度大小宜采用变异系数。
19、从一个数值变量资料的总体中抽样,产生抽样误差的原因是总体中个体值存在差别。
20、均数与标准差计算的数值均数可以是负数,标准差不可以。
21、医学统计学研究的对象是有变异的医学事件。
22、随机测量误差指的是由不可预知的偶然因素引起的误差。
23、系统误差指的足由某些固定的因素引起的误差。
24、抽样误差指的是样本统计量与总体参数间的误差。
25、收集数据不可避免的误差是随机误差。
26、统计学中所谓的总体通常指的是同质观察单位的全体。
27、统计学中所谓的样本通常指的是总体中有代表性的部分观察单位。
28、医学研究中抽样误差的主要来源是生物个体的变异。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
小;③要注意分子分母正确选用;④要注意率与比的正确应用;⑤要注 意平均率的计算方法;⑥要注意资料的可比性;⑦率和构成比比较时作 假设检验。 7. 简述直线回归与直线相关的区别。 (1)资料要求上不同:直线回归分析适用于应变量是服从正态分布的随 机变量,自变量是选定变量;直线相关分析适用于服从双变量正态分布 的资料。 (2) 两种系数的意义不同:回归系数是表明两个变量之间数量上的依存 关系,回归系数越大回归直线越陡峭,表示应变量随自变量变化越快; 相关系数是表明两个变量之间相关的方向和紧密程度的,相关系数越 大,两个变量的关联程度越大。 9. 假设检验的理论依据是什么?请简述假设检验的基本步骤。 答:假设检验的理论依据是小概率事件原理,步骤为: (1)根据研究目的建立假设,确定检验水准 (2)根据样本统计量的抽样分布规律,选择适当的统计方法,计算检验 统计量 (3)确定P值,做出推断结论 10.方差分析应用广泛,可用于:①两个或多个样本均数间的比较;②分 析两个或多个因素间的交互作用;③回归方程的线性假设检验;④多元 线性回归分析中偏回归系数的假设检验等。本章主要介绍完全随机设计 资料的方差分析、配伍组设计资料的方差分析及重复测量数据的方差分 析。 11. 完全随机设计的两样本率比较时,如何正确选择统计分析方法 (写出相应的计算公式)。 (1)当总例数n≥40且所有格子的T≥5时,用2检验的基本公式或四格表 资料2检验的专用公式; (2)当n≥40但有1≤T<5时,用四格表资料2检验的校正公式;或改用四 格表资料的Fisher确切概率法的连续性校正法: (3)当n<40,或T<1时,用四格表资料的Fisher确切概率法。 12. 什么是医学参考值范围?估计医学参考值范围如何正确选用统计 方法? 答:医学参考值范围是指所谓“正常人”的解剖、生理、生化等指标的 波动范围,亦称正常值范围。如95%的参考值范围包括了95%的观察 值,而有5%的观察值不在这一范围内。 估计医学参考值范围确定方法:
的样本进行研究,目的是通过样本的信息判断总体的特征,这一过程
称为统计推断。
29. 标准误(standard error, SE):在统计理论上将样本统计量的标
准差称为标准误,用来衡量抽样误差的大小。据此,样本均数的标准
差称为标准误。
30. 参数估计(parameter estimation):由样本信息估计总体参数。
差悬殊的两组或多组资料的离散程度。
21. 频率(relative frequency):在n次随机试验中,事件A发生了m
次,则比值
称为事件A在n次试验中出现的频率(relative frequency)。m称为出现
的频数(frequency)。
在实际工作中,当观察单位的例数足够多时,可以用频率来代替概率。
位数Px将全部观察值分为两个部分,理论上有x%的观察值小于Px小,有
(1-x%)的观察值大于Px。
19. 变异系数(coefficient of variance, CV):亦称离散系数
(coefficient of dispersion),为标准差与均数之比,常用百分数表
示。, 变异系数没有度量衡单位,常用于比较度量单位不同或均数相
信区间(confidence interval, CI),又称置信区间。这种估计方法
称为区间估计。
33. 95%可信区间含义:如果重复若干次样本含量相同的抽样,每个样
本均按同一方法构建95%可信区间,则在这些可信区间中,理论上有95
个包含了总体参数,还有5个未估计到总体均数。
34.Ⅰ类错误(typeⅠerror):统计学上规定,拒绝了实际上成立的
察个体,故变异亦称为个体变异(individual variation)。
14. 组间变异(variation between group):用各组均数与总均数的
离iation within group):用各组均数与总均数的离
均差平方和表示
18. 百分位数(percentile):是一种位置指标,以Px表示,一个百分
频率是概率的估计值。
22. 概率(probability):在重复试验中,事件A的频率,随着试验次
数的不断增加将愈来愈接近一个常数p,这个常数p就称为事件A出现的
概率(probability),记作P(A)或P。
描述随机事件发生的可能性大小的数值,常用P来表示。
23. 统计量(statistic):由样本所算出的统计指标或特征值。
(1-α)用一个区间估计总体参数所在范围,这个范围称作可信度1-α的
可信区间,又称置信区间。
12. 总体均数的可信区间:按一定的概率大小估计总体均数所在的范
围(CI)。常用的可信度为95%和99%,故常用95%和99%的可信区间。
13. 变异(variation):同质事物间的差别。由于观察单位通常即为观
常值范围。绝大多数:可以是90%、95%、99%等等,最常用的是95%。正
常人:不是指健康人,而是指排除了影响所研究指标的疾病和有关因素
的同质人群。又称参考值范围,是指特定健康人群的解剖、生理、生化
等各种数据的波动范围。习惯上是确定包括95%的人的界值。
27. 正偏态和负偏态分布:频数分布可分为对称分布和非对称分布两
它包括两种:点估计(point
estimation)和区间估计(interval
estimation)。
31. 点估计(point estimation):直接用样本统计量作为对应的总体
参数的估计值。
32. 区间估计(interval estimation):按一定的概率或可信度(1-
α)用一个区间估计总体参数所在范围,这个范围称作可信度1-α的可
种类型。非对称分布又称为偏态分布,是指观察值偏离中央的分布。
当尾部偏向数轴正侧(或右侧)时,称正偏态(或右偏态)分布,如人体
中一些重金属元素的分布等。反之,尾部偏向数轴负侧(或左侧)时,
则称为负偏态(或左偏态)分布。
28. 统计推断(statistic inference):从总体中随机抽取一定含量
医学统计学复习资料
一、名词解释题 1. 总体(population):根据研究目的所确定的同质观察单位的全体。 只包括(确定的时间和空间范围内)有限个观察单位的总体,称为有限总 体(finite population)。假想的,无时间和空间概念的,称为无限总 体(infinite population)。 2. (总体)参数(parameter):总体的统计指标或特征值。总体参数是 事物本身固有的、不变的。 3. 样本(sample):从总体中随机抽取的部分个体。 4. 样本含量(sample size):样本中所包含的个体数。 5. 变量(variable):观察对象个体的特征或测量的结果。由于个体的 特征或指标存在个体差异,观察结果在测量前不能准确预测,故称为随 机变量(random variable),简称变量(variable)。变量的取值称为变 量值或观察值(observation)。根据变量的取值特性,分为数值变量和 分类变量。 6. 数值变量(Numerical variable):又称为计量资料、定量资料,指 构成其的变量值是定量的,其表现为数值大小,有单位。对每个观察单 位用定量的方法测定某项指标的数值,组成的资料。 7. 计数资料:将全体观测单位按照某种性质或特征分组,然后再分别 清点各组观察单位的个数。 分类变量(categorical variable):或称定性变量,其取值是定性 的,表现为互不相容的类别或或属性,有两种情况: 1)无序分类(unordered categories):包括①二项分类,如上述“性 别”变量,表现为互相对立的结果;②多项分类,如上述“血型”变 量,表现为互不相容的多类结果。 2)有序分类(ordered categories):各类之间有程度上的差别,或等 级顺序关系,有“半定量”的意义,亦称等级变量。 等级资料:介于计量资料和计数资料之间的一种资料,通过半定量方法 测量得到。 8. 抽样(sampling):从总体中抽取部分观察单位的过程称为抽样。 9. 抽样误差(sampling error):由于抽样造成的统计量与参数之间的 差别,特点是不能避免的,可用标准误描述其大小。 10. 误差(error):统计上所说的误差泛指测量值与真值之差,样本指 标与总体指标之差。主要有以下二种:系统误差和随机误差 。 11. 可信区间(confidence interval, CI):按一定的概率或可信度
H0,这类“弃真”的错误称为Ⅰ型错误或第一类错误,Ⅰ型错误的概
率用α表示。
35.Ⅱ类错误(typeⅡerror):统计学上规定,不拒绝实际上不成立的
H0,这类“存伪”的错误称为Ⅱ型错误或第二类错误,Ⅱ型错误的概
率用β表示。 36. 检验效能(power of a test):又称把握度,即两总体确有差别, 按α水准能发现它们有差别的能力。 37. 参数检验:总体分布已知,对其中一些未知参数进行估计或检验。 这类统计推断的方法叫参数统计或参数检验。 参数检验:假定比较数据服从某分布,通过参数的估计量(, s)对比较总 体的参数(μ)作检验,统计上称为参数法检验(parametric test)。如 t、u检验、方差分析。 38. 非参数检验:适用于任意分布(distribution free)的统计方法, 这种方法称为非参数统计。这种假设检验方法,比较的是分布而不是 参数,故称为非参数检验。 非参数检验:是指在统计检验中不需要假定总体分布形式和用参数估 计量,直接对比较数据的分布进行统计检验的方法,称为非参数检验 (nonparametric test). 39. 率(rate):又称频率指标,用以说明某现象发生的频率或强度。 常以百分率(%)、千分率(‰)、万分率(1/万)、十万分率(1/10万)等表 示。其计算公式为: 40. 构成比(proportion):又称构成指标,它说明一种事物内部各组 成部分所占的比重或分布,常以百分数表示,其计算公式为: 41. 比(ratio):又称相对比,是A、B两个有关指标之比,说明A为B的 若干倍或百分之几,它是对比的最简单形式。其计算公式为:比=A/B。 二、问答题和简答题 5. 标准差与标准误有何区别和联系? 区别:(1)含义不同: ①s描述个体变量值(x)之间的变异度大小,s越 大,变量值(x)越分散;反之变量值越集中,均数的代表性越强。② 标准误是描述样本均数之间的变异度大小,标准误 越大,样本均数 与总体均数间差异越大,抽样误差越大;反之,样本均数越接近总体均 数,抽样误差越小。 (2)与n的关系不同: n增大时,①s→σ(恒定)。②标准误减少并趋 于0(不存在抽样误差)。 (3)用途不同: ①s:表示x的变异度大小,计算cv,估计正常值范围,计 算标准误等②:参数估计和假设检验。 联系: 二者均为变异度指标,样本均数的标准差即为标准误,标准差 与标准误成正比。 6. 应用相对数时的注意事项有哪些? ①要注意绝对数与相对数结合应用;②要注意观察单位样本数不宜过