第四章 正 态 分 布 体育统计学要点

合集下载

体育统计

体育统计

名词解释1、体育统计:体育统计是运用数理原理和方法对体育领域里各种随机现象规律性进行研究的一门基础应用学科,属方法论的学科范畴。

2、随机变量:由于变量受随机因素的影响呈随机变化,具有偶然的一面,也有规律性的一面,通过大量的实验或观或观察,这种规律性可以揭示出来,这种具有变化规律的变量称为随机变量。

3、随机现象:在相同条件下进行的试验或观察,其可能结果不止一个,事先无法确定,对于这类现象称之为随机现象。

4、总体:根据统计研究的具体研究目的而确定的同质对象的全体。

5、样本:根据需要与可能从总体中抽出可以推测总体的部分对象称为样本。

6、个体:总体中的每一观测对象称为个体。

7、指标:在实验观察中,用来指示或反映研究对象中某些特征的可被研究者或仪器感知的一种现象标志,称为指标。

8、概率:随机事件 A 的频率随试验次数 N 的变化而变化,当 N 充分大时,频率越来越接近一个常数 P,则 P 就是随机事件 A 的概率。

9、假设检验:根据样本所提供的信息对总体的分布及分布的参数作出一定可信程度的推断。

10、小概率事件:在统计学中,经检验常把发生在概率 0.05 以下的事件称之为小概率事件。

11、方差分析:简称 ANOVA,又称变异数分析,能够解决多个总体均值是否相等的检验问题,其主要功能在于分析实验数据中不同来源的变异对总体变异的贡献大小,从而确定实验中的自变量是否对因变量有重要影响12、随机事件:在一定的实验条件下,有可能发生也有可能不发生的事件称随机事件13、变量:随机现象的各种结果总是可以用一定的数量来表现,而且表现为实验结果数值的不确定性,因而称为变量14、参数:数字的整体特征15、间接收集:将他人测试或整理的资料进行积累,以备比较、对照分析所用,不是自己亲自调查的,是别人的数据,公开出版或报道的数据,如图书、期刊等16、抽样调查:从调查对象总体中,随机抽取一部分单位作为样本进行调查,由样本的调查结果来推断总体的数量特征的一种非全面调查17、集中位置量数:反映一群性质相同的观察值的平均水平或集中趋势的统计指标18、离散位置量数:描述一群性质相同的观察值的离散程度的统计指标19、相对数:也称相对指标,是两个有联系的指标的比率,它可以从数量上反映两个互相联系的事物之间的对比关系20、抽样误差:由抽样造成的样本均数与总体均数的偏差,称为均数的抽样误差21、中位数:将样本观察值按其数值大小排列起来,处于中间那个数值就是中位数22、权重:反映指标对某事物在评价中的重要程度的的系数23、动态数列:事物的某一统计指标随时间的变化而形成的数据序列 24 动态分析;用动态数列分析某指标随时间变化而发展的趋势、特征和规律称为动态分析2、样本统计量:由样本所获得的一些数量特征称为样本统计量3、随机事件:在一定的实验条件下,有可能发生也有可能不发生的事件为随机事件4、集中位置量数:反映一群性质相同的观察的平均水平或集中趋势的统计指标5、频数:是将数据资料按一定顺序分成若干组,并数出各组中所含有的数据。

体育统计学概念

体育统计学概念

体育统计学概念体育统计学是应用统计学原理和方法,对体育领域中的数据进行分析、解释和预测的一门学科。

它为体育科研、训练和决策提供了重要的参考依据。

以下是对体育统计学主要内容的简要介绍。

1.描述性统计描述性统计是体育统计学的基础,它通过对数据的概括和描述,使我们能够更好地理解数据。

描述性统计指标包括平均数、中位数、众数、方差、标准差等。

2.推论性统计推论性统计是从样本数据推断总体特征的方法。

在体育领域中,我们通常无法直接对总体进行全面调查,因此推论性统计就成为了一种重要的数据分析工具。

推论性统计方法包括参数估计和假设检验等。

3.变量的测量与分类变量的测量与分类是数据分析的前提。

在体育领域中,我们需要对各种变量进行测量和分类,例如运动员的技术水平、体能状态、比赛成绩等。

这些变量的测量和分类必须具有可靠性、有效性和可重复性。

4.数据分布特征数据分布特征是描述数据分布规律和特征的方法。

在体育统计学中,我们通常需要了解数据的分布特征,以便更好地选择合适的统计方法进行分析。

数据分布特征包括正态分布、偏态分布、分布的离散程度等。

5.置信区间与样本大小置信区间与样本大小是数据分析的重要概念。

在体育领域中,我们需要确定一个合适的置信区间和样本大小,以便对总体参数进行准确的估计和预测。

置信区间表示总体参数落在一定范围内的概率,而样本大小则表示样本的代表性程度。

6.假设检验假设检验是体育统计学中常用的方法,用于验证对总体参数的某种假设是否正确。

在体育科研和实践中,我们需要通过对样本数据的分析来检验某种假设或推论是否正确,进而做出科学决策。

7.方差分析方差分析是一种常见的实验设计方法,用于比较不同组之间的差异。

在体育科研和训练中,我们经常需要对不同组之间的差异进行分析,例如比较不同训练方法对运动员成绩的影响、分析不同营养补给对运动员表现的影响等。

方差分析可以对多组数据进行比较,判断各组之间的差异是否具有统计学意义。

8.相关与回归相关与回归是描述两个变量之间关系的方法。

体育统计学复习提纲

体育统计学复习提纲

体育统计学复习提纲一、填空部分第一章绪论1、根据统计研究得具体研究目得而确定得同质对象得全体,称为总体。

总体具有三个性质,分别就是、、。

2、有10个运动员,现随机抽5人进行专业素质测试,共有种不同得组合。

3、一个骰子有六个面,在一次摇动实验后,出现3点或6点朝上得概率就是。

4、从概率得性质瞧,当m=n时,P(A)=1,则事件A为必然事件。

当m=0时,P(A)=0,则事件A为不可能发生得事件5、在一个密闭得盒子中有8个乒乓球中,其中5个白色与3个黄色得球,随机摸取2个乒乓球,刚好摸到一白一黄得概率为。

6、从概率性质瞧,若A、B两事件互不相容事件,则有:P(A)+ P(B)=P(A+B)。

7、体育统计中,总体平均数用表示,总体方差用表示,总体标准差用表示。

第二章统计资料得整理1、在对连续型数据进行频数整理时,要确定组距及各组组限,设置各组组限得基本原则就是:、。

2、“缺、疑、误”就是资料审核中得内容。

3、对正态分布总体得数据进行审查时,常用±3S法对可疑数据进行筛查,这种方法就是资料审核中得过程。

4、体育统计得一个重要思想方法就是以去推断得特征。

5、频数分布可用直观图形表示,常用得有与两种。

6、统计资料在收集过程中,要求做到、、。

7、资料得审核得基本内容就是审核资料得准确性与完整性,一般要求分三个步骤来完成,即:、、。

第三章样本特征数1、现测试10名学生得引体向上成绩分别为:12、10、8、3、8、9、8、3、9、3。

则其众数就是与。

2、绝对差就是指所有样本观测值与平均数差得之与。

3、自由度就是指能够独立自由变化得变量个数。

因此,对于服从正态分布,样本量分别为n1与n2得两个样本得均值就是否相等进行检验时,其自由度就是。

4、要从甲、乙两运动员中选取一人参加比赛,若要用统计学方法处理,应考虑:、、三个方面。

5、在体育统计中,对同一项目,不同组数据进行离散程度比较时,采用;对不同性质得项目进行离散程度比较时采用。

体育统计知识点

体育统计知识点

第一节体育统计及其研究对象一.统计的涵义1.统计有三种涵义——统计工作、统计资料和统计学。

统计工作——有组织、有计划地对研究对象进行资料信息收集、整理以及分析的工作全过程。

统计资料——在统计工作中所收集到的各种数据资料、统计图表和统计分析报告的总称。

统计学——研究大量社会现象的总体数量的方法论科学。

体育统计——运用数理统计的原理和方法对体育领域内各种随机现象规律性进行研究的方法论科学。

2.体育统计从学科性质来看,可分为“描述性统计”和“推断性统计”两种类型。

描述性统计——对事物特征及状态进行数量描述的工作过程。

推断性统计——通过样本数量特征对总体的特征进行估计和推断的工作过程。

二.体育统计的基本工作过程——统计调查(收集资料)、统计整理(资料整理)和统计分析(资料规律性的揭示)等三个工作阶段。

统计调查——根据一定目的,通过科学的调查方法,搜集体育现象实际资料的活动,是体育统计工作的第一阶段(基础阶段)。

统计整理——对统计调查到的大量统计资料进行整理、加工、汇总、列表等工作过程,是体育统计工作的第二阶段(中间环节、承上启下)。

统计分析——将加工整理好的统计资料加以分析研究,采用各种分析方法,计算各种分析指标,进而揭示体育现象的本质及其发展变化规律性。

是体育统计工作的第三阶段,是对事物由感性认识上升的理性认识的阶段,也是整个统计工作的决定性阶段。

三个工作阶段并不是孤立、截然分开的,他们是紧密联系的一个整体,其中各个环节常常是交叉进行的。

三.体育统计的研究对象及其特征1.体育统计的研究对象——体育领域内的随机现象、非体育领域(但与体育有着一定联系)等其他系统的随机现象。

2.体育统计研究对象的特征——数量性、运动性、综合性以及客观性等。

数量性——体育统计是用大量数据资料说明体育现象的规模、水平、结构、比例关系、差别程度、普及程度等,主要研究体育现象的数量方面。

运动性——体育的最基本特征是运动,体育现象的诸多数量指标都是反映人们运动能力和心理素质方面的特征规律的。

体育统计学

体育统计学

体育统计学复习资料1、体育统计学是统计学的原理和方法在体育中的应用,是统计学的一个分支学科。

体育统计学是一门收集、整理和分析体育中的统计数据的方法科学,其目的在于从量的侧面揭示体育现象的特征和规律性。

2、体育统计分析的过程:(1)根据研究的问题做出研究设计 (2)根据上述设计收集样本数据 (3)整理数据资料统计描述 (4)统计推断 (5)作出统计结论(6)结合专业分析讨论3、总体:根据研究目的所确定的研究对象全体,它是由同质的个体所构成。

样本:从总体中抽取的一部分个体成为样本。

样本中所包含的个体数称为样本含量,通常用符号n 表示。

参数:表示总体分布某种特征的量数。

常用的总体参数有:总体的平均数、标准差、相关系数等。

统计量:表示样本分布某种特征的量数,它是由样本数据计算出来的。

如样本平均数 ,样本标准差统计误差:统计分析不可能避免误差,只可能减少误差。

统计误差归纳起来可分为两类。

第一类是实际测试值与真值之差(测量误差);第二类是样本指标与总体指标之差(抽样误差)。

4、有效数字:通常将仅保留末一位估计数字其余数字为准确数的数字称为有效数字,我们从左起非零数字开始,清点有效数字的位数,命名它是几位有效数字。

5、由于观测数据具有变异性,因而统计学中把它称为变量。

变量按取值情况可分为离散型变量和连续型变量,按性质(层次)可分为定类变量、定序变量、定距变量和定比定量。

定类变量是最低层次的变量,它的取值只有类别属性之分,而无大小、程度之分。

根据变量值,只能知道研究对象是相同还是不相同,定序变量的测度水平高于定类变量,它的取值除了类别属性之外,还有等级、次序的差别,例如学生体育成绩可分为优、良、中、差,这是一种由高到低的等级排列,它可对应为1、2、3、4等级,定距变量是定义变量在某个点值上为零点,以固定间距对变量进行的测度。

如运动时对体温的测定先定义出零度和一百度,然后以固定的间距“度”对某人的体温进行测度。

正态分布大数定律与中心极限定理

正态分布大数定律与中心极限定理

第四章 正态分布、大数定律与中心极限定理
所以

80 d 0.01 利用0.9901正态分布表,有 0.5
故设定温度d至少为81.165度.
(2.33) 0.9901
(2.33) 0.01
一般地,给定实数 则称
(0 1) 存在实数 u 使得 P( X u )

) (
x1

)

) () (
x2

)
,
第四章 正态分布、大数定律与中心极限定理
例题4.1.1 已知X ~ N (0,1),试求 P( X 3) P x 1.5 解:查表可得:(3) 0.9987 (1.5) 0.9332 故
标准正态变量的分布函 数则表示为 ( x),则 ( x)与其密度
( x)的关系式为: ( x ) ( x ), ( x )

x

( x )dx
x

1 e 2

t2 2
dt
第四章 正态分布、大数定律与中心极限定理
4.正态密度函数的性质
() ( x)dx 1
解 (1)由已知,所求的概率为
89 90 P T 89 (2) 1 (3) 1 0.9772 0.0228. 0.5 (2)据题意,需求d,使得 P T 80 0.99 因为
80 d P T 80 1 P X 80 1 0.99 0.5
2 2
其中 及 >0都为常数,这种分布叫做正态分布或高斯分布。 记作 N , 2 .



体育统计学考试重点

体育统计学考试重点

体育统计学考试重点1、体育统计学:体育统计是揭示体育科研中大量随机事件现象的规律的学科。

2、体育统计的基本工作过程:1、统计调查2、统计整理3、统计分析3、体育统计的研究对象除了体育领域里的各种可量化的随机现象之外,还应包括非体育领域但对体育的发展有关的各种随机现象。

4、体育统计研究对象的特征:1、运动性特征2、综合型特征3、客观性特征5、体育统计是在体育教育科研活动的基础(简答)?一、体育统计是体育教育科研活动的基础二、体育统计有助于训练工作的科学化三、体育统计能帮助研究者制定研究计划四、体育统计能帮助研究者有效的获得文献资料6、总体:根据统计科研的具体研究目的而确定的同质对象的全体。

7、样本:根据需要与可能从总体中抽取的部分研究对象所形成的子集。

8、必然事件:在一定条件下,必然会出现的事件。

9、随机事件:在一定的条件下,有可能发生的也有可能不发生的事件。

1、总体参数:反映总体的一些数量特征。

而有样本所获得的一些数量特征称为样本统计量2、概率:某个随机事件再一次实验中发生的可能性大小的数量指标,用p(a)表示。

3、全面普查:是指对研究对象总体中所有个体进行全部的测试或观察。

4、分层抽样;:将总体中的个体按某种属性特征分成若干类型,部分或层。

然后在各种类型、部分、或层中按比例进行简单随机抽样组成研究样本的方法。

5、资料审核的内容和步骤?答:内容1、准确性2、完整性3、时效性步骤1、初审2、逻辑检查3、复核6、集中位置数的类型:中位数、众数、几何平均数、算术平均数7、中位数:将样本的观察值按从大到小的顺序排列起来,处于中间的位置的那个数。

8、众数:是样本观察值在频数分部分布表中频数最多的那一组的组中值。

9、离中位置数的种类:全距、绝对差、标准差、方差、平均差。

1、全距;:即两极差,就是一组观察值中最大值与最小值之差。

2、相对数:相对数也呈相对指标,是两个有联系的指标的比率。

即两个有联系的指标进行对比,所得到的统计指标称为相对指标3、相对数的意义?答1、相对数可是原来不能直接相比的数量指标成为可比2、相对数时进行动态分析的重要依据。

体育统计学

体育统计学

体育统计学第一章绪论第一节体育统计学及其研究对象一、统计学的概念:运用数理统计的原理和方法对体育领域里各种随机现象规律性进行研究的一门基础应用学科,属于方法学科范畴。

二、体育统计学的分类:从性质上来分为:描述性统计:对事物的某些特征及状态进行实际的数量描述推断性统计:通过样本的数量特征以一定方式估计、推断总体的特征三、体育统计工作的基本过程:统计资料的收集—统计资料的整理—统计资料的分析第二节育统计在体育活动中的作用1、体育统计是体育教育科研活动的基础2、体育统计有助于训练工作的科学化3、体育统计能够帮助研究者制定研究设计4、体育统计能帮助研究者有效地获取文献资料第三节体育统计中的若干基本概念一、总体:根据统计研究的具体研究目的而确定的同质对象的全体二、样本:根据需要与能从总体抽取的部分研究对象所形成的子集三、随机事件四、随机变量:分为连续型变量和离散型变量五、概率古典概率:P(A)=m/n概率:统计概率:P(A)=m/n第二章统计资料繁荣收集和整理第一节统计资料的收集一、收集的基本要求:1.资料的准确性2.资料的齐同性3.资料的随机性二、收集资料的方法1.日常积累2.全面普查3.专题研究三、几种常见的抽样方法1.简单随机抽样:抽签法和随机数表法抽签法的操作过程是将总体中的每个个体进行编号,逐个写在签条或卡片上,将签条或卡片完全混乱放置后,不加任何选择地在全部签条或卡片中完全随机抽出所需含量,然后逐个测试并登记其指标数据,形成研究样本。

随机数表法2.分层抽样3.整体抽样四、统计资料的整理(一)资料的审核1.初审2.逻辑检查3.复核(二)频数分布表的制作步骤1. 求极差(或全距R)R=最大值()—最小值()2 .确定组数3.确定组距(I)和组限值(L)I=极差/分组数=R/K第一组下限(L1)=X最大—1/2*I4.列频数分布表本组下限<=X<次组下限组中值=(该组下限+该组上限)/2第三章样本特征数一、样本特征数的两种形式:集中位置量数和离中位置量数二、集中位置量数的概念:反映一群性质相同的观察值的平均水平或集中水平趋势的统计指标。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第四章 正 态 分 布如果将第二章中的(表2 — 1)中的数据绘制成直方图,把每个方条顶部中点联结起来,就得到一个图形,它称为频数多边形。

(图4 — 1)当分组数很多,组距很小时,频数多边形就趋于类似(图4 —2)所示的平滑的曲线。

这种曲线呈现出两侧近似对称的钟形。

随机变量的类似这种分布,在自然界是相当普遍的其中最有代表性的是正态分布。

下面就来介绍正态分布及其在体育中的几个应用。

图4 — 1 频数多边形图第一节 正态分布曲线的形式如果随机变量X 的概率密度函数为y =πσ21e 222)(σμ--x (+∞<<∞-x ) (4 — 1)则称随机变量X 是服从正态分布的由上式绘出的图形叫做正态曲线。

(图4 — 2)X 的变动范围在 ∞- 至 +∞ 间。

YX0μ图4 — 2 正态分布曲线正态分布曲线中有两个参数:均值 μ 及方差 2σ。

为了应用方便,对式(4 — 1)中的随机变量经过一个称为标准化的变换,即令u 来代替原式中的 σμ-x , 寻这时的随机变量u 的概率密度函数成为:y = π21e 22u - (4 — 2) 按照(4 — 2)式绘出的图形,称作标准正态曲线。

(图4 — 3)Y00.40.30.20.1-1-2-3123μ图4 — 3 标准正态分布曲线第二节正态分布曲线的特征正态分布曲线有许多特点,它们对实际工作有很大的帮助。

它的主要特点有以下几个方面:一,正态分布的形式是对称的(但对称的分布不一定是正态分布)。

在正态分布中均值与中位数相重合。

二,从中央最高点逐渐向两侧降低,降低的速度是先慢后快,以后又再次减慢,最后接近横轴,但终究不能与横轴相交。

三,从中央向两侧逐渐下降,它的方向是先向内弯,达到离均值左右各一个标准差时又改向外弯,是以σμ1±的点为曲线从内弯转向外弯的转折点,即正态曲线中标准差与曲线有固定的关系。

四,因为正态曲线是对称的,在曲线下不仅平均数的两侧面积相等,各相当距离间的面积相等,而且各相当距离间的曲线高度也相等,正态曲线下(与横轴间)的总面积为1. 00。

五,正态曲线可以有不同形式,它们的均值和标准差可以不相同,均值不同表明曲线在横轴上所处位置不同,标准差不同表明曲线的形态不同。

标准差小则曲线高、且窄;标准差大则曲线低、且宽。

(图4 — 4)由式(4 — 1)和(4 — 2)知,标准正态曲线的μ= 0,σ= 1,即标准正态曲线是关于纵轴对称;它在μ= 0时,有最大值,它近似等于0. 4,如(图4 — 3)所示。

YX 0μσ=0.5σ=1σ=2图4 — 4 三种不同形式的正态分布曲线第三节 正态分布表从某市17岁男生中随机抽出205人测量身高,由这个样本计算得到 X = 168. 40厘米,S = 6. 13厘米。

假定该市17岁男生身高服从正态分布,试估计身高在16. 40 — 172. 40厘米之间的人数。

求解这类问题的一般方法是:求从正态总体中随机选取一个个体的测量值落在区间(a, b )上的概率。

这个概率在标准正态曲线下就是曲线、X 轴、直线X = a 和X — b 所围成的面积。

(图4 — 5)当概率P 求得后,要求的人数约等于总人数乘以P 值。

Y00.1-1-2-3123μ0.20.40.3a b图4 — 5 随机变量X在区间(a,b)内取值的概率示意图表的左边第1 列这横轴上的位置,它是指横轴上某一点与平均值的距离,以标准差为单位来表示,通常记为u,即u =σμ-x(4 — 3)表上边的第1 行为u值的第2位小数。

表的主体部分是各u值与均数(u = 0)之间所对应的单侧面积(或概率)。

一、知U值求对应的面积例 4 —1求u 值为-1 至+2 之间对应的面积。

解:由于标准正态曲线是关于x = u对称的均数处的u值为零,所以u值在-1至0这间对应的面积与它在0 至+1 之间的对应面积相等。

查书后附表1得u值在-1至0的对应面积是34. 13%;u 值在0至+2 之间的面积是47. 72%。

前者在均值的左边,后者在均值的右边,因此这两块面积之和便是所求面积。

(图4 — 6)即:34. 13% + 47. 72% = 81. 85%-12=+81.85%34.13%47.72%00-12图4—6例 4 —2 本节开始提出的问题,即试估计身高在160. 40 —172. 40厘米之间的人数。

解:首先要求出身高为160. 40厘米和172. 40厘米的u值,按式(4 — 3)有(当u 和σ未知时,可用X和S近似代替):u 1 = 13.640.16840.160- = -1. 31 u 2 = 13.640.16840.172- = 0. 65 查书后附表1 求 u 1、u 2 所对应的面积。

u 1 = -1. 31 所对应的面积是40. 49%,u 2 = 0. 65所对应的面积是24. 22%。

u 值-1. 31至0. 65所对应的面积为40. 49% + 24. 22% = 64. 71%,见(图4 — 7)所示,于是身高在 160. 40 — 172. 40厘米之间的人数约为 205×64. 71%≈133(人)。

0-1-212μ24.22%40.49%172.40米0.65-1.31图4-7 估计身高在160. 40-172. 40厘米间的人数百分数二、已知面积求对应的U 值例 4 — 3 试求从 +1σ 向右到什么位置对应的面积为14. 15%?解:设从 +1σ 向右到 +k σ 对应的面积为14. 15%。

查标准正态分布表知+1σ对应的面积是34. 13%。

24. 13%+14. 15% = 48. 28%,就是u 值从0 到 +k 之间对应的面积。

查书后附表1和K = 2. 11,即从 +1σ 向右到 +2. 11σ 之间对应的面积为14. 15%。

(图4 — 8)从标准正态分布表中,可以找出标准正态曲线下面的分布规律。

在下表中列出的五个分布位置与其对应的概率是统计中电子学用到的,应该熟记。

μ+2.11б图4 — 8 从+1σ— +2. 11σ对应的面积表4 — 1 正态曲线下的概率分布μuσ该范围具有的概率±μ1σ68. 26%±μ 1. 96σ95. 00%±μ2σ95. 44%±μ 2. 58σ99. 00%±μ3σ99. 73%±第四节统计资料的正态性检验正态分布的理论适用于正态或近似正态分布的资料。

对样本要想用正态分布理论进行分析,首先要检验样本是否为正态分布。

检验的方法有多种,简单而实用的方法是“概率格纸绘图法”。

这种方法使用的概率纸是正态概率纸,它的横轴是普通的刻度,纵轴是按正态分布的规律刻划的。

使用时,先根据样本数据求出累计频率,然后根据累计频率和组限,将其点绘在正态概率纸上,如果样本资料是呈正态分布的则所有点几乎在一条直线上。

例 4 — 4 广州市某中学初中生800米跑的抽样测验成绩的累计频率如下表所示,试检验该资料是否近似正态分布?组 限 频 数 累计频数 累计频率(%) -'''732 1 1 0. 8 -'''442 6 7 5. 6 -'''152 15 22 17. 6 -'''852 20 42 33. 6 -'''503 27 69 55. 2 -'''213 25 94 75. 2 -'''913 21 115 92. 0 -'''623 6 121 96. 8 -'''333 2 123 98. 4 -'''043 2 125 100. 0由样本计算得:X = 2303''' , S = 421''然后根据每组的下限值和相应的累计频率,将它们分别标在图上。

根据点的分布趋势画一直线,观察这些点的分布是否接近一条直线。

在画直线时应以靠近中部的点为主,两端的点为辅,因为中部的点的组频数大,所以占比重也大。

由(图4 — 9)可见,所有的点几乎都在一条直线上,故该样本资料接近于正态分布。

2′51″2′2′2′3′3′3′3′3′37″44″58″05″12″19″26″33″图 4—9当样本资料符合正态分布时,籍助正态概率纸做图,还可以对 μ 和 σ 作出近似地估计。

从正态分布理论知道累积频率为50% 的位置应在中点,即接近均数位置。

从纵轴50% 的位置画横线与钭线交于a 点,由不得a 点向横轴做垂线交于 μ 点,其值为 8203''' ,即为估计均数,它与计算值 2203''' 仅相差 50''。

又知均数减一个标准差位置的面积为34. 13%,故在纵轴上的应是50%-34. 13% = 15. 87%(b 点),以此划横线交于钭线上c 点,向横灿做垂线交于 9052''' 处,此点距均数的长度应为σ,故估计标准差的值为: 91190528203''='''-''' 。

计算值为 421'',仅相差 50''。

只要图做得准确,这些估计值也还是比较精确的。

第五节可疑数据的舍取在实际工作中,往往能够发现样本资料中具有个别突出的数值(特大或特小的数值)。

按样本数据系列大小顺序来看,发现这些突出的数值和其他数值之间有明显脱节现象。

这种现象使人们怀疑这些特别数值是否属于研究的总体,于是把这些数据称为可疑数据。

人们把来自非同一总体的极端值,称为异常数据。

样本中的异常数据应当及时剔除,否则会影响样本均数和标准差等统计量及计算结果的准确性。

如何判断可疑数据是否为异常数据,方法不少,下面介绍适用于正态分布,且数据个数不多时,比较常用而有效的戈罗伯斯(Grubbs)检验法。

设x1,x2……,x n来自正态分布的总体,将它们按大小重新排列,记为x(1)≤x(2)≤…… ≤x(n)。

首先计算出可疑数据的g n值,其公式为:g n =s |xx|-'(4 — 4)式中x'表示可疑数据值,若计算得g n值大于(表4 — 2)中的临界值a n,则认为x'是异常数据,应舍弃。

若小于临界值,则x'为正常数据,应保留。

表4 — 2 戈罗伯斯检验临界值(a n)表α= 0. 05 n a n n a n n a n n a n n a n3 1. 15 12 2. 29 21 2. 58 30 2. 96 40 2. 874 1. 46 13 2. 33 22 2. 60 31 3. 03 50 2. 965 1. 67 14 2. 37 23 2. 62 32 3. 09 60 3. 036 1. 82 15 2. 41 24 2. 64 33 3. 14 70 3. 097 1. 94 16 2. 44 25 2. 64 34 3. 18 80 3. 148 2. 03 17 2. 47 26 2. 75 35 3. 21 90 3. 189 2. 11 18 2. 50 27 2. 82 36 3. 23 100 3. 2110 2. 18 19 2. 53 28 2. 87 37 3. 24 110 3. 2311 2. 23 20 2. 56 29 2. 92 38 3. 25 120 3. 24例 4 — 5 为了解一般高中学生跳高水平,由随机样本计算得到统计量如下:n = 100人x= 1. 31米s = 0. 09米假定这些学生跳高成绩的分布呈正态分布。

相关文档
最新文档