第四章正态分布体育运动统计学

第四章正态分布体育运动统计学
第四章正态分布体育运动统计学

第四章正态分布

如果将第二章中的(表2 —1)中的数据绘制成直方图,把每个方条顶部中点联结起来,就得到一个图形,它称为频数多边形。(图4 —1)当分组数很多,组距很小时,频数多边形就趋于类似(图4 —2)所示的平滑的曲线。这种曲线呈现出两侧近似对称的钟形。随机变量的类似这种分布,在自然界是相当普遍的其中最有代表性的是正态分布。下面就来介绍正态分布及其在体育中的几个应用。

10

9

8

7

6

5

4

3

2

1

x

图4 —1 频数多边形图

第一节正态分布曲线的形式

如果随机变量X的概率密度函数为

y =π

σ21e 222)(σμ--x (+∞<<∞-x ) (4 — 1) 则称随机变量X 是服从正态分布的由上式绘出的图形叫做正态曲线。(图4 — 2)X 的变动范围在 ∞- 至 +∞ 间。

Y

X

图4 — 2 正态分布曲线

正态分布曲线中有两个参数:均值 μ 及方差 2σ。为了应用方便,对式(4 — 1)中的随机变量经过一个称为标准化的变换,即令u 来代替原式中的

σμ-x , 寻这时的随机变量u 的概率密度函数成为:

y = π

21e 22

u - (4 — 2) 按照(4 — 2)式绘出的图形,称作标准正态曲线。(图4 — 3)

Y

00.4

0.3

0.2

0.1

-1-2-3123μ

图4 — 3 标准正态分布曲线

第二节 正态分布曲线的特征

正态分布曲线有许多特点,它们对实际工作有很大的帮助。它的主要特点有以下几个方面:

一,正态分布的形式是对称的(但对称的分布不一定是正态分布)。在正态分布中均值与中位数相重合。

二,从中央最高点逐渐向两侧降低,降低的速度是先慢后快,以后又再次减慢,最后接近横轴,但终究不能与横轴相交。

三,从中央向两侧逐渐下降,它的方向是先向内弯,达到离均值左右各一个标准差时又改向外弯,是以 σμ1± 的点为曲线从内弯转向外弯的转折点,即正态曲线中标准差与曲线有固定的关系。

四,因为正态曲线是对称的,在曲线下不仅平均数的两侧面积相等,各相当距离间的面积相等,而且各相当距离间的曲线高度也相等,正态曲线下(与横轴间)的总面积为1. 00。

五,正态曲线可以有不同形式,它们的均值和标准差可以不相同,均值不同表明曲线在横轴上所处位置不同,标准差不同表明曲线的形态不同。标准差小则曲线高、且窄;标准差大则曲线低、且宽。(图4 — 4)由式(4 — 1)和(4 — 2)知,标准正态曲线的 μ = 0,σ = 1,即标准正态曲线是关于纵轴对称;它在 μ = 0时,有最大值,它近似等于0. 4,如(图4 — 3)所示。

Y

X 0

μσ=0.5

σ=1

σ=2

图4 — 4 三种不同形式的正态分布曲线

第三节 正态分布表

从某市17岁男生中随机抽出205人测量身高,由这个样本计算得到 X = 168. 40厘米,S = 6. 13厘米。假定该市17岁男生身高服从正态分布,试估计身高在16. 40 — 172. 40厘米之间的人数。

求解这类问题的一般方法是:求从正态总体中随机选取一个个体的测量值落在区间(a, b )上的概率。这个概率在标准正态曲线下就是曲线、X 轴、直线X = a 和X — b 所围成的面积。(图4 — 5)当概率P 求得后,要求的人数约等于总人数乘以P 值。 Y

00.1

-1-2-3123μ0.2

0.4

0.3

a b

图4 —5 随机变量X在区间(a,b)内取值的概率示意图表的左边第1 列这横轴上的位置,它是指横轴上某一点与平均值的距离,以标准差为单位来表示,通常记为u,即

u =

σμ

-

x(4 —3)

表上边的第1 行为u值的第2位小数。表的主体部分是各u值与均数(u = 0)之间所对应的单侧面积(或概率)。

一、知U值求对应的面积

例4 —1 求u 值为-1 至+2 之间对应的面积。

解:由于标准正态曲线是关于x = u对称的均数处的u值为零,所以u值在-1至0这间对应的面积与它在0 至+1 之间的对应面积相等。查书后附表1得u值在-1至0的对应面积是34. 13%;u值在0至+2 之间的面积是47. 72%。前者在均值的左边,后者在均值的右边,因此这两块面积之和便是所求面积。(图4 —6)即:

34. 13% + 47. 72% = 81. 85%

-12=+

81.85%34.13%47.72%

00

-12

图4—6

例4 —2 本节开始提出的问题,即试估计身高在160. 40 —172. 40厘米之间的人数。

解:首先要求出身高为160. 40厘米和172. 40厘米的u值,按式(4 —3)有(当u 和σ未知时,可用X和S近似代替):

u 1 = 13

.640.16840.160- = -1. 31 u 2 = 13

.640.16840.172- = 0. 65 查书后附表1 求 u 1、u 2 所对应的面积。u 1 = -1. 31 所对应的面积是40. 49%,u 2 = 0. 65所对应的面积是24. 22%。u 值-1. 31至0. 65所对应的面积为40. 49% + 24. 22% = 64. 71%,见(图4 — 7)所示,于是身高在 160. 40 — 172. 40厘米之间的人数约为 205×64. 71% ≈133(人)。

0-1-21

24.22%

40.49%

160.40米0.65-1.31

图4-7 估计身高在160. 40-172. 40厘米间的人数百分数

二、已知面积求对应的U 值

例 4 — 3 试求从 +1σ 向右到什么位置对应的面积为

14. 15%?

解:设从 +1σ 向右到 +k σ 对应的面积为14. 15%。查标准正态分布表知+1σ对应的面积是34. 13%。 24. 13%+14. 15% = 48. 28%,就是u 值从0 到 +k 之间对应的面积。查书后附表1和K =

2. 11,即从 +1σ 向右到 +2. 11σ 之间对应的面积为14. 15%。(图4 — 8)

从标准正态分布表中,可以找出标准正态曲线下面的分布规律。在下表中列出的五个分布位置与其对应的概率是统计中电子学用到

的,应该熟记。

μ

图4 —8 从+1σ—+2. 11σ对应的面积

表4 —1 正态曲线下的概率分布

μuσ该范围具有的概率

±

μ1σ68. 26%

±

μ 1. 96σ95. 00%

±

μ2σ95. 44%

±

μ 2. 58σ99. 00%

±

μ3σ99. 73%

±

第四节统计资料的正态性检验

正态分布的理论适用于正态或近似正态分布的资料。对样本要想用正态分布理论进行分析,首先要检验样本是否为正态分布。检验的方法有多种,简单而实用的方法是“概率格纸绘图法”。这种方法使

用的概率纸是正态概率纸,它的横轴是普通的刻度,纵轴是按正态分布的规律刻划的。使用时,先根据样本数据求出累计频率,然后根据累计频率和组限,将其点绘在正态概率纸上,如果样本资料是呈正态分布的则所有点几乎在一条直线上。

例 4 — 4 广州市某中学初中生800米跑的抽样测验成绩的累计频率如下表所示,试检验该资料是否近似正态分布?

组 限 频 数 累计频数 累计频率(%) -'''732 1 1 0. 8 -'''442 6 7 5. 6 -'''152 15 22 17. 6 -'''852 20 42 33. 6 -'''503 27 69 55. 2 -'''213 25 94 75. 2 -'''913 21 115 92. 0 -'''623 6 121 96. 8 -'''333 2 123 98. 4 -'''043 2 125 100. 0

由样本计算得:

X = 2303''' , S = 421''

然后根据每组的下限值和相应的累计频率,将它们分别标在图上。根据点的分布趋势画一直线,观察这些点的分布是否接近一条直线。在画直线时应以靠近中部的点为主,两端的点为辅,因为中部的点的组频数大,所以占比重也大。由(图4 — 9)可见,所有的点几乎都在一条直线上,故该样本资料接近于正态分布。

2′51″2′2′2′3′3′3′3′3′37″44″58″05″12″19″26″33″

图 4—9

当样本资料符合正态分布时,籍助正态概率纸做图,还可以对 μ 和 σ 作出近似地估计。从正态分布理论知道累积频率为50% 的位置应在中点,即接近均数位置。从纵轴50% 的位置画横线与钭线交于a 点,由不得a 点向横轴做垂线交于 μ 点,其值为 8203''' ,即为估计均数,它与计算值 2203''' 仅相差 50''。又知均数减一个标准差位置的面积为34. 13%,故在纵轴上的应是50%-34. 13% = 15. 87%(b 点),以此划横线交于钭线上c 点,向横灿做垂线交于 9052''' 处,此点距均数的长度应为σ,故估计标准差的值为: 91190528203''='''-''' 。计算值为 421'',仅相差 50''。只要图做得准确,这些估计值也还是比较精确的。

第五节可疑数据的舍取

在实际工作中,往往能够发现样本资料中具有个别突出的数值(特大或特小的数值)。按样本数据系列大小顺序来看,发现这些突出的数值和其他数值之间有明显脱节现象。这种现象使人们怀疑这些特别数值是否属于研究的总体,于是把这些数据称为可疑数据。人们把来自非同一总体的极端值,称为异常数据。样本中的异常数据应当及时剔除,否则会影响样本均数和标准差等统计量及计算结果的准确性。如何判断可疑数据是否为异常数据,方法不少,下面介绍适用于正态分布,且数据个数不多时,比较常用而有效的戈罗伯斯(Grubbs)检验法。

设x1,x2……,x n来自正态分布的总体,将它们按大小重新排列,记为x(1)≤x(2)≤……≤x(n)。

首先计算出可疑数据的g n值,其公式为:

g n =

s |x

x|-'(4 —4)式中x'表示可疑数据值,若计算得g n值大于(表4 —2)中的临界值a n,则认为x'是异常数据,应舍弃。若小于临界值,则x'为正常数据,应保留。

表4 —2 戈罗伯斯检验临界值(a n)表α= 0. 05 n a n n a n n a n n a n n

a n

3 1. 15 12 2. 29 21 2. 58 30 2. 96 40 2.

87

4 1. 46 13 2. 33 22 2. 60 31 3. 03 50 2.

96

5 1. 67 14 2. 37 23 2. 62 32 3. 09 60 3.

03

6 1. 82 15 2. 41 24 2. 64 33 3. 14 70 3.

09

7 1. 94 16 2. 44 25 2. 64 34 3. 18 80 3.

14

8 2. 03 17 2. 47 26 2. 75 35 3. 21 90 3.

18

9 2. 11 18 2. 50 27 2. 82 36 3. 23 100 3.

21

10 2. 18 19 2. 53 28 2. 87 37 3. 24 110 3.

23

11 2. 23 20 2. 56 29 2. 92 38 3. 25 120 3.

24

例4 —5 为了解一般高中学生跳高水平,由随机样本计算得到统计量如下:

n = 100人x= 1. 31米s = 0. 09米

假定这些学生跳高成绩的分布呈正态分布。其中有一名学生的成绩是1. 65米,这个成绩超出平均水平三个标准差以上,是个可疑数据。试检验它是否为异常数据。

按公式(4 —4)计算

g n =

s |x

x|-'=

09

.0

| 31

.1

65

.1|-≈ 3. 78

查(表4 —2)n = 100对应的a n值是3. 21,现计算值是3. 78,

大于临界值,故1. 65 米是异常数据应舍弃。据了解,该学生是少体校学生,受过专项训练,不属于一般高中学生跳高水平研究的总体。

第六节 正态分布理论在体育中的两个应用

一、制定测验标准

制定测验标准是体育教学和训练中的一项重要工作,一般是根据学生原有的基础和不同阶段教学目的与要求,事先规定达到各标准的人数比例,并将这个比例数看作正态分布曲线下的面积,然后利用标准下正态分布表去推算相应标准的具体成绩。

例4 — 6 某学校某年级在进行跳高教学之前,从该年级随机抽出一部分学生测验其跳高成绩。现由样本计算得到统计量为: x = 1. 40 米, S = 0. 10米

学校方面根据学生在跳高上的基础水平和教学的要求,规定就目前状况达到优秀的人数比例为10%,良好的人数比例为20%,有15%的人不能及格,试用统计方法求出以上三个标准的具体成绩。

μσ

σ123-1-2-3σσσσ15%20%

10%

c b a -1.04

0.52 1.281.30米 1.45米 1.53米σσσ

图 4—10 跳高测验标准的确定

计算过程如下:

人数比例 查标准正态分布表的面积 u 值 标准)s u x (?+

10 % (优) 50%-10%=40% 1. 28 1. 40+1. 28×0. 10=1. 53(米)

20 % (良) 50%-10%-20%=20% 0. 52 1. 40+0. 52×0. 10=1. 45(米)

15%(不及格) 50%-15%=35% -1. 40 1. 40-1. 04×0. 10=1. 30(米)

综上所述,优秀标准的成绩是1. 53米;良好标准的成绩是1. 45米;及格标准的成绩是1. 30米。

二、估计达标人数

以上阐述的是已知达标人数比例,求出这一标准的具体成绩,下面是叙述先定出具体的成绩标准,而后要求估计出达到标准的人数百分比。这实际上是已知u 值求对应正态分布曲线下面积的问题。

例 4 — 7 某学校对某年级男生的跳远教学测验成绩作出如下规定:成绩为5. 60米以上者得5分;5. 40米以上者得4分;4. 60米以上者得3分。教师从该年级男生中随机抽出部分学生进行测验,得到 x = 5. 00米,S = 0. 40米,试估计该年级男生得各分值的人数比例。

μσσ123-1-2-3σσσσ

σ4.60米 5.40米

5.60米(1.5 )得3分的人数百分数

得4分的人数百分数

得5分的人数百分数

图 4—11 跳远达标人数的估计

计算结果如下:

5分 5.60米以上 (5 60-5.00) / 0.40 =1.5 43.32% 50%-43.32% =

6.7%

4分 5.40米以上 (5.40-5.00) / 0.40 =1.0 34.13% 50%-43.32%-6.7% = 9.2%

3分 4.60米以上 (4.60-5.00) / 0.40 = -1.0 34.13% 34.13%+34.13% =

68.26%

综上所述,该年级男生跳远得5分的人数比例是6. 7%;得4分的人数比例是9. 2%;得3分的人数比例是68. 26%。如果用该年级男生的总人数乘以各人数比例,便可估计达到各标准的人数。

习 题 四

1.什么是正态分布、标准正态分布?正态分布的特点是什么?如何使用正态分布表?

2.在正态分布表中,下列范围包括的面积占总面积的百分之几?

(1)σ±μ1.1;

(2)σ±μ58.2;

(3)σ-μ2.1 — σ+μ4.1间。

3.在正态分布中,已知 σ±μk 间包括的面积是 34 % ,求K 值为若干?

4.某年级有216名学生,随机抽出部分学生测验跳远成绩得到样本统计量为 x = 4. 40米,S = 0. 42米。如规定2. 80米是及格标准,试估计该年级可能有多少人不及格?

5.用正态概率纸检验第二章第七节所列出的31名大学生简单视反应数据资料是否服从正态分布。

6.某地区有一万名初中男生,抽样得到百米赛跑运动成绩的统计量为:x = 541'',S = 50''。

(1)若提出一胩锻炼标准,按现在的情况只能有30%的人达标,

那么这个标准的运动成绩定为多少秒合适?

(2)如果开运动会,按目状况估计能有多少人达到或者突破 31''

的成绩?

(3)希望定出一个水平为“中等”的能够包括6000人的成绩范

围。计算时如果要求以样本平均数为中点,那么这个范围的上

下限的运动成绩各是多少秒?

7.某体重记录资料的样本含量为n = 15,统计量为x= 82. 5公斤,S = 0. 5千克。若其中某一数据为89. 4千克,试检验此数据是否为异常数据?

体育统计学试题

统计学模拟试题 一、名词解释。 1、总体参数:在统计学中,反映总体的一些数量特征称为总体参数 2、样本统计量:由样本所获得的一些数量特征称为样本统计量 3、随机事件:在一定的实验条件下,有可能发生也有可能不发生的事件为随 机事件 4、集中位置量数:反映一群性质相同的观察的平均水平或集中趋势的统计指标 5、频数:是将数据资料按一定顺序分成若干组,并数出各组中所含有的数据。 6、统计推断: 7、抽样误差:抽出的样本统计量之间或样本统计量与总体参数间的偏差,立要由于个体间的差异所造成。 8、相对数:相对数也称为相对指标,是两个有联系的指标的比率,它可以从数量上反映两个相互联系的事物(或现象)之间的对比关系。 9、假设检验:在实际检验过程中,主要的问题是要判定被检验的统计量之间的偏差是由抽样误差造成的,还是由于总体参数不同所造成的,要作出判断就需要对总体先建立某种假设,然后通过统计量的计算及概率判断,对所建立的假设是否成立进行检验。这类方法称为假设检验。 10、平均数:反映一群性质相同的观察值的平均水平或集中趋势的统计指标。 11、变异系数:也是反映变量离散程度的统计指标,它是以样本标准差与平均数的百分数来表示的!记作:CV 12、总体与样本: 13、离中位置量数:描述一群性质相同值的离散程度的统计指标 14、抽样:指在总体中抽取一定含量的样本。 15、频率: 16、系统误差:宏观世界是由实验对象本身的条件,或或者者仪器不准,场地品格出现故障,训练方法,手段不同所造成的,可使测试结果杨倾向性偏大或偏小。 17、结构相对数:是在分组基础上,以各个分组全计数值与总值对比的相对数。 18、a=0.05或a=0.01:指检验水准称小概率水平

体育统计学

课本 一,1,统计推断结论都存在出错的可能性,所有的统计结论总是和概率相关系的结论。2,统计分析步骤:根据研究的问题做出研究设计、、根据上述设计手机样本数据、、整理数据资料统计描述、、统计推断、、做统计结论、、结合专业作分析讨论。 3,影响抽样误差大小的因素:样本含量的大小、总体被研究标志的变异程度、抽样的组织方式、抽样方法。 4,常见的抽样方法有单纯随机抽样,机械抽样,分层随机抽样,整群随机抽样。 5,代表总体特征的统计指标称为参数 6,人们把所需要研究的同质对象的全体称为总体 7,从总体中抽出来用以推测总体的部分对象称为样本 二,1,体育统计资料的来源主要有两个方面:常规性资料、、专题性资料。 2,体育统计可分为全面调查和非全面调查,非全面调查又分为抽样调查和典型调查,。体育统计常用的是抽样调查。 3,变量按取值情况可分为离散变量和连续性变量,按性质可分为定类变量、定序变量、定距变量和定比变量。 4,收集资料时应注意的问题:第一:保证资料的完整性、有效性和可靠性;第二:保证样本的代表性。 5,连续型变量频数分布表的编制步骤如下:求全距、、、确定组数和组距、、、确定组限、、、列频数分布表并划记。 三,1,反映集中趋势的数称为集中量数。2,算数平均数是所有的观察总和除以总额说所得之商,简称为平均数或均数。算数平均数是反映同质对象观察值的平均水平与集中趋势的统计量。· 3,反映集中趋势的数称为集中量数。 4.中位数是将数依据数值大小顺序排列后,位于序列中央位置的数,用★表示。偶数,则中间两个的平均数是中位数。 5,标准差是带有与原观察值相同单位的名数。它对两种不同或相同而两个平均数相差较大的资料,都无法比较差异的大小,必须用变异系数进行比较。所谓变异系数是指标准差与平均数的百分比 6,★ 四.1在一定条件下可能发生的可能不发生的现象成为随机现象。对于随机现象的一次观察可以看作一次实验,这样的实验成为随机实验。 2如果事件A发生的可能性的大小可以用一个常数P来表示,则P称为随机事件A在该试验条件下的概率。记作P(A)=P。事件A 的概率取值范围为[0,1]。 3一般正态曲线有如下性质:(1)分布曲线位于X轴的上方,即f(x)>0;(2)分布曲线以μ和σ为正态参数;(3)x的取值范围是整个X轴;(4)曲线与X轴之间的面积为1。 4我们将μ=0,σ=1的正态分布称为标准正态分布,∷∷∷∷∷∷∷∷ 以0为均数,以1为标准差的标准正态分布记为μ~N(0,1)。 5标准正态分布下几个常用的概率:P(-1.96<μ<1.96)=0.9500 P(-2.58<μ<2.58)=0.9902;P(-3<μ<3)=0.9974。 6例题已知x~N(μ,σ2)求: P(μ-σ0为一常数,若Xi’ =m Xi,则下列结论中正确的是(X=X’/m, S=S’/m)2假设检验属于(统计推断)内容 之一3(射击成绩)不属于连续型量变4体 育统计起源于(数理统计)5决定正态分布 曲线形态的参数是(ó) 6已知某人100米成 绩X=14秒S=0.45秒;立定跳远X=221.4厘 米S=18.4厘米,则该人的(100米)成绩更 稳定 7X~N(14.5,0.52),问X落在 区间(15,+∞)的概率为(0.1587) 8整理数据时常采用(直方图)9大样本 时,总体均数的99%的置信区间为(X± 2.58Sx)10 中位数是(百分位数)的特例11 在正态曲线分布下,u±2.58ó之间的面积为 (0.9902)12等级相关系数的自由度是(n) 13方差分析中把由于各种条件的不同引起 的差异称为(条件误差)14如果要评价某 学校学生的运动水平,从各年级中随机抽取 一个班,以这个班做为年级学生的运动水平, 这样的抽样方法是(整体抽样)15若某项 田径成绩X=3.2米,S=0.20米,以X±3S为 研究范围,问3.44米在标准T分法下应得70 分16对于数据8,8,9,9,10,11,0,5,宜采用 (8.5)刻画其集中趋势17竞技体育比赛中, 宜采用(累进评分法)18运动员的年龄属 于(定距变量)19体育统计的研究对象不 具有(典型性)20正态分布曲线以X=(u) 为对称轴21(u=0,ó=1)代表标准正态分 布22多个率的假设检验,常采用(X2)检 验23样本越大,标准误(逐渐减少)24 我们采用(散点图)反映两个量变的相关趋 势25当两个项目单位相同但平均数相差太 大时,宜采用(变异系数)比较他们的离散 程度26X~N(14.5,0.52),问X落在区间(- ∞,15)的概率为(0.8413)27双侧检验的 特点是(检验两个参数是否相等,而不关心 其他差别的方向)28大样本时,总体均数 的95%的置信区间为(X±1.96Sx)29(平 均数)是百分数的特例30在正态曲线分布 下,u±3之间的面积为(0.9974)31对任意 事件A,其概率的取值范围是(0《P(A)《10) 32方差分析法中,组内方差的自由度为(b (a-1))33不属于随机事件的是(三角形的 内角和为180度)34决定正态分布曲线位 置的参数是(u)35若所给资料不服从正态 分布,宜采用(百分位数法)评分方法36 立位体前屈成绩属于(定比变量)37当总 体情况复杂,个体数目多时宜采用(分层抽 样)38标准误用来刻画(抽样误差)的大 小39检查测试数据是否有“缺、疑、误” 等错误,通常在(初审)步骤进行40X~N (14.5,0.52),问X落在区间(14,15) 的概率为(0.6826)41若变量Y与X是正 相关关系,其相关系数r的取值范围为(00为一常数,若Xi’=Xi-m,则下列结 论中正确的是(X=X’+m,S=s’)45对任意 随机事件A,其概率取值范围为(01) 46当极端数据出现时,宜采用(中位数)反 映该数列的集中趋势 47在正态分布的曲线

统计学第5-6章 正态分布、 统计量及其抽样分布知识分享

统计学第5-6章正态分布、统计量及其 抽样分布

第5-6章统计量及其抽样分布 5.1正态分布 5.1.1定义:当一个变量受到大量微小的、独立的随机因素影响时,这个变量一般服从正态分布或近似服从正态分布。 概率密度曲线图 例如:某个地区同年龄组儿童的发育特征:身高、体重、肺活量等某一条件下产品的质量 如果随机变量X的概率密度为 2 2 () 2 1 (), 2 x f x e x μ σ πσ -- =-∞<<∞ 则称X服从正态分布。 记做 2 (,) X Nμσ : ,读作:随机变量X服从均值为 μ ,方差为2 σ的正态分布 其中, μ -∞<<∞ ,是随机变量X的均值,0 σ>是是随机变量X 的标准差

5.1.2正态密度函数f(x)的一些特点: ()0 f x≥, 即整个概率密度曲线都在x轴的上方。 曲线 () f x相对于xμ =对称,并在xμ = 处达到最大值, 1 () 2 fμ πσ = 。 1 μ< 2 μ< 3 μ 曲线的陡缓程度由 σ 决定: σ 越大,曲线越平缓;σ越小,曲线越陡峭当 x 趋于无穷时,曲线以 x轴为其渐近线。 标准正态分布

当 0,1 μσ == 时, 2 2 1 () 2 x f x e π - = , x -∞<<∞ 称 (0,1) N 为标准正态分布。 标准正态分布的概率密度函数: ()x ? 标准正态分布的分布函数: ()x Φ 任何一个正态分布都可以通过线性变换转化为标准正态分布 设 2 (,) X Nμσ : ,则 (0,1) X Z N μ σ - =: 变量 2 11 (,) X Nμσ :与变量2 22 (,) Y Nμσ :相互独立,则有 22 1212 +(+,+) X Y Nμμσσ : 5.1.3 正态分布表:可以查的正态分布的概率值 ()1() x x Φ-=-Φ

体育统计学资料(1)

体育统计学 名词解释 1、回归、回归直线(第九章: 回归分析) 2、指标、因素、水平(第七章: 方差分析) 3、相关分析线性相关系数正相关负相关(相关分析) 4、随机误差系统误差抽样误差点估计区间估计假设检验第I类错误第二类错误小概率事件原理(第六章统计推断) 5、中位数众数集中位置量数离中位置量数极差四分位间距方差标准差变异系数(第三章样本特征数) 6、简单随机抽样分层抽样整群抽样(第二章统计资料的收集与整理) 7、描述性统计推断性统计体育统计总体随机样本(第一章绪论) 简答题 1、 2、 3、简述相关分析与回归分析的联系与区别(第九章回归分析)简述为什么要进行相关系数的检验(第八章相关分析)简述在什么条件下必须对平均数进行多重比较(第七章方差分析) 4、 5、简述方差分析应用的前提条件(第七章方差分析) 简述假设检验中的两类错误(第六章统计推断)

6、 7、 8、 9、简述假设检验的基本步骤(第六章统计推断) 简述假设检验的基本思想(第六章统计推断) 简述常用的几种统一变量单位的方法(第五章正态分布)正态分布曲线有哪些性质(第五章正态分布) 10、常用的抽样方法有几种(第二章统计资料的收集与整理) 11、体育统计工作的基本过程有哪三个步骤?每步工作的主要任务是什么?(第一章绪论) 12、假设检验时,当P比0.05小时,则拒绝H0,理论依据是什么?(第六章统计推断) 13、对称分布在“平均值±1.96标准差”的范围内,也包括95%的观察值吗?(第三章样本特征数) 14、试述极差、四分间距、标准差及变异系数的适用范围?(第三章样本特征数) 15、同一资料的标准差是否一定小于均数?(第三章样本特征数) 16、某年级甲班、乙班各有男生50人。从两个班各抽取10人测量其身高,并求其平均身高。如果甲班的平均身高大于乙班,能否推论甲班所有同学的平均身高大于乙班?为什么?(第一章绪论)判断题 1、两变量间的关系越密切,其相关系数r值越大.(错误)第八章相关分析 2、样本均数的标准误越小,则对总体均数的估计越精确(正确) 3、对同一参数的估计,99%置信区间比90%置信区间好。(错误)

spss教程常用的数据描述统计:频数分布表等统计学

第二节常用的数据描述统计 本节拟讲述如何通过SPSS菜单或命令获得常用的统计量、频数分布表等。 1.数据 这部分所用数据为第一章例1中学生成绩的数据,这里我们加入描述学生性别的变量“sex”和班级的变量“class”,前几个数据显示如下(图2-2),将数据保存到名为“2-6-1.sav”的文件中。 图2-2:数据输入格式示例 1.Frequencies语句 (1)操作 打开数据文件“2-6-1.sav”,单击主菜单Analyze /Descriptive Statistics / F requencies…,出现频数分布表对话框如图2-3所示。 图2-3:Frequencies定义窗口 把score变量从左边变量表列中选到右边,并请注意选中下方的Display frequency table复选框(要求

显示频数分布表)。如果您只要求得到一个频数分布表,那么就可以点OK按钮了。如果您想同时获得一些统计量,及统计图表,还需要进一步设置。 ①Statistics选项 单击Statistics按钮,打开对话框,请按图2-4自行设置。有关说明如下: (ⅰ)在定义百分位值(percentile value)的矩形框中,选择想要输出的各种分位数,SPSS提供的选项有: ●Quartiles四分位数,即显示25%、50%、75%的百分位数。 ●Cut points equal 把数据平均分为几份。如本例中要求平均分为3份。 Percentile显示用户指定的百分位数,可重复多次操作。本例中要求15%、50%、85%的百分位数。(ⅱ) 在定义输出集中趋势(Central Tendency)的矩形框中,选择想要输出的集中统计量,常用的选项有: ●Mean 算术平均数 ●Median 中数 ●Mode 众数 ●Sum 算术和 (ⅲ)在定义输出离散统计量(Dispersion)的矩形框中,选择想要输出的离散统计量,常用的选项有: ●Std. Deviation 标准差 ●Variance 方差 ●Range 全距 ●Minimum 最小值 ●Maximum 最大值 ●S.E. mean 平均数的标准误 (ⅳ)描述数据分布(Distribution)的统计量 ●Skewness 偏度,非对称分布指数。 ●Kurtosis 峰度,CASE围绕中心点的扩展程度。 另外,频数过程(Frequence)除了能够提供上面常用的统计量外,还可以对分组数据计算百分位数和中数(Values are group midpoints),即对于已经分组的数据,并且数据中的原始数据表示的是组中数的数据计算百分位数的值和中位数。

体育统计学参考资料

、总体参数:在统计学中,反映总体地一些数量特征称为总体参数 样本统计量:由样本所获得地一些数量特征称为样本统计量 随机事件:在一定地实验条件下,有可能发生也有可能不发生地事件为随机事件 集中位置量数:反映一群性质相同地观察地平均水平或集中趋势地统计指标 、频数:是将数据资料按一定顺序分成若干组,并数出各组中所含有地数据. 统计推断: 抽样误差:抽出地样本统计量与总体参数间地偏差,立要由于个体间地差异所造成. 相对数:相对数也称为相对指标,是两个有联系地指标地比率,它可以从数量上反映两个相互联系地事物(或现象)之间地对比关系. 文档来自于网络搜索 假设检验:在实际检验过程中,主要地问题是要判定被检验地统计量之间地偏差是由抽样误差造成地,还是由于总体参数不同所造成地,要作出判断就需要对总体先建立某种假设,然后通过统计量地计算及概率判断,对所建立地假设是否成立进行检验.这类方法称为假设检验. 文档来自于网络搜索 平均数:反映一群性质相同地观察值地平均水平或集中趋势地统计指标 、变异系数:也是反映变量离散程度地统计指标,它是以样本标准差与平均数地百分数来表示地!记作:、总体与样本:文档来自于网络搜索 离中位置量数:描述一群性质相同值地离散程度地统计指标、抽样:指在总体中抽取一定含量地样本 、系统误差:宏观世界是由实验对象本身地条件,或者仪器不准,场地品格出现故障,训练方法,手段不同所造成地,可使测试结果杨倾向性偏大或偏小. 文档来自于网络搜索 、结构相对数:是在分组基础上,以各个分组全计数值与总值对比地相对数. 、或:指检验水准称小概率水平、中位数:将样本地观察值按其数值大小顺序排列起来,处于中间位置地那个数值就是中位数,中位数通常用表示,它处于频数分配地中点,不受极端数值地影响. 、组距:组距指地是组与组之间地区间长度.文档来自于网络搜索 二、填空题. 、和在统计学中称为(小概率水平)、抽样误差是由于(个体间地差异)造成地. 、标准误差是反映(数据地离散程度)地指标. 、(随机变量)用来度量随机事件地可能性大小. 、(算术)平均数量是最简单最常用最有效地统计量. 、由样本所获得地数量特征称为样本统计量,反映总体地一些数量特征称为(总体参数)、标准误是反映(度量抽样误差大小)地指标. 、在资料地收集过程中,一般要求(资料地准确性)(资料地齐同性)和(资料地随机性). 、在一组观察值中,最大值与最小值之差叫(极差). 、表示集中位置地指标主要有(中位数)(众数)(平均数). 文档来自于网络搜索 单项选择题. 、以下适合描述定量资料,离散趋势地指标是()、均数、标准差、方差、极差、标准差、中位数、中位数、均数、变异系数、标准差、变异系数文档来自于网络搜索 下列关于标准差地说法中错误地是()、标准差一定大于. 、标准差和方差属于描述变异程度地同类指标、同一资料和标准差一定小于均数、标准差常用于描述正态公布资料地变异程度.文档来自于网络搜索 进行假设检验地目地是()、判断样本统计量地差异仅仅是抽样引起地还是样本与总体原本就不同、由样本统计量估计总体参数、确定发生该观察结果地概率、计算统计文档来自于网络搜索 抽样误差原因是()、观察对象不纯、资料不是正态分布、个体差异、随机方法错误

常用医学统计学方法汇总

选择合适的统计学方法 1连续性资料 1.1 两组独立样本比较 1.1.1 资料符合正态分布,且两组方差齐性,直接采用t检验。 1.1.2 资料不符合正态分布,(1)可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后的数据采用t检验;(2)采用非参数检验,如Wilcoxon检验。 1.1.3 资料方差不齐,(1)采用Satterthwate 的t’检验;(2)采用非参数检验,如Wilcoxon检验。 1.2 两组配对样本的比较 1.2.1 两组差值服从正态分布,采用配对t检验。 1.2.2 两组差值不服从正态分布,采用wilcoxon的符号配对秩和检验。 1.3 多组完全随机样本比较 1.3.1资料符合正态分布,且各组方差齐性,直接采用完全随机的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey 法,Scheffe法,SNK法等。 1.3.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Kruscal-Wallis法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用成组的Wilcoxon检验。 1.4 多组随机区组样本比较 1.4.1资料符合正态分布,且各组方差齐性,直接采用随机区组的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey 法,Scheffe法,SNK法等。 1.4.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Fridman检验法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用符号配对的Wilcoxon检验。 ****需要注意的问题: (1)一般来说,如果是大样本,比如各组例数大于50,可以不作正态性检验,直接采用t 检验或方差分析。因为统计学上有中心极限定理,假定大样本是服从正态分布的。 (2)当进行多组比较时,最容易犯的错误是仅比较其中的两组,而不顾其他组,这样作容易增大犯假阳性错误的概率。正确的做法应该是,先作总的各组间的比较,如果总的来说差别有统计学意义,然后才能作其中任意两组的比较,这些两两比较有特定的统计方法,如上面提到的LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。**绝不能对其中的两

SPSS统计分析1:正态分布检验

正态分布检验 一、正态检验的必要性[1] 当对样本是否服从正态分布存在疑虑时,应先进行正态检验;如果有充分的理论依据或根据以往积累的信息可以确认总体服从正态分布时,不必进行正态检验。 当然,在正态分布存疑的情况下,也就不能采用基于正态分布前提的参数检验方法,而应采用非参数检验。 二、图示法 1、P-P图 以样本的累计频率作为横坐标,以安装正态分布计算的相应累计概率作为纵坐标,把样本值表现为直角坐标系中的散点。如果资料服从整体分布,则样本点应围绕第一象限的对角线分布。 2、Q-Q图 以样本的分位数作为横坐标,以按照正态分布计算的相应分位点作为纵坐标,把样本表现为指教坐标系的散点。如果资料服从正态分布,则样本点应该呈一条围绕第一象限对角线的直线。 以上两种方法以Q-Q图为佳,效率较高。 3、直方图 判断方法:是否以钟形分布,同时可以选择输出正态性曲线。 4、箱式图 判断方法:观测离群值和中位数。 5、茎叶图 类似与直方图,但实质不同。 三、计算法 1、峰度(Kurtosis)和偏度(Skewness) (1)概念解释 峰度是描述总体中所有取值分布形态陡缓程度的统计量。这个统计量需要与正态分布相比较,峰度为0表示该总体数据分布与正态分布的陡缓程度相同;峰度大于0表示该总体数据分布与正态分布相比较为陡峭,为尖顶峰;峰度小于0表示该总体数据分布与正态分布相比较为平坦,为平顶峰。峰度的绝对值数值越大表示其分布形态的陡缓程度与正态分布的差异程度越大。 峰度的具体计算公式为: 注:SD就是标准差σ。峰度原始定义不减3,在SPSS中为分析方便减3后与0作比较。 偏度与峰度类似,它也是描述数据分布形态的统计量,其描述的是某总体取值分布的对称性。这个统计量同样需要与正态分布相比较,偏度为0表示其数据分布形态与正态分布的偏斜程度相同;偏度大于0表示其数据分布形态与正态分布相比为正偏或右偏,即有一条长尾巴拖在右边,数据右端有较多的极端值;偏度小于0表示其数据分布形态与正态分布相比为负偏或左偏,即有一条长尾拖在左边,数据左端有较多的极端值。偏度的绝对值数值越大表示其分布形态的偏斜程度越大。 偏度的具体计算公式为:

(完整word版)统计学三大分布与正态分布的关系

统计学三大分布与正态分布的关系 [1] 张柏林 41060045 理实1002班 摘要:本文首先将介绍 2分布,t 分布,F 分布和正态分布的定义及基本性质, 然后 用理论说明2分布,t 分布,F 分布与正态分布的关系,并且利用数学软件 MATLAB 来验证之. 1.三大分布函数[2] 1.1 2分布 2(n )分布是一种连续型随机变量的概率分布。这个分布是由别奈梅 (Benayme )赫尔默特(Helmert )、皮尔逊分别于1858年、1876年、1900年所发 现,它是由正态分布派生出来的,主要用于列联表检验。 定义:若随机变量X 1,X 2,…X n 相互独立,且都来自正态总体 N (0,,),则称 统计量 2 =x ; X ;…+X ;为服从自由度为n 的2分布,记为 2 2 ~ (n ). 2 分布的概率密度函数为 1 x e 2 x 0 J x 0 其中伽玛函数(X ) e t t x 1dt,x 0, 2 分布的密度函数图形是一个只取非负值 的偏态分布,如下图? x 2 n 2° f(x; n)

2(n2) ,X!,X2相互独立,则X! X2~ 2g n2); 性质3: n 时,2(n) 正态分布; 性质4:设2~ 2(n),对给定的实数 (0 1),称满足条件: P{ 2 2(n)} 2(、f(x)dx (n) 的点2(n)为2(n)分布的水平的上侧分位数. 简称为上侧分位数.对不同的与n,分位 数的值已经编制成表供查 分布,是由英国统计学家戈赛特在1908年“student的'笔名 布在数理统计中也占有重要的位置. 1), Y?2(n), X,Y相互独立,,则称统计量T —X VY/ n 分布,记为T~t( n). 为 性质1: E( 2(n)) n,D( 2(n)) 2n ; 性质2:若X! 2(nJ,X2

医学统计学题库完整

第一章 绪论习题 一、选择题 1.统计工作和统计研究的全过程可分为以下步骤:(D ) A. 调查、录入数据、分析资料、撰写论文 B. 实验、录入数据、分析资料、撰写论文 C. 调查或实验、整理资料、分析资料 D. 设计、收集资料、整理资料、分析资料 E. 收集资料、整理资料、分析资料 2.在统计学中,习惯上把(B )的事件称为小概率事件。 A.10.0≤P B. 05.0≤P 或01.0≤P C. 005.0≤P D.05.0≤P E. 01.0≤P 3~8 A.计数资料 B.等级资料 C.计量资料 D.名义资料 E.角度资料 3.某偏僻农村144名妇女生育情况如下:0胎5人、1胎25人、2胎70人、3胎30人、4胎14人。该资料的类型是( A )。 4.分别用两种不同成分的培养基(A 与B )培养鼠疫杆菌,重复实验单元数均为5个,记录48小时各实验单元上生长的活菌数如下,A :48、84、90、123、171;B :90、116、124、225、84。该资料的类型是(C )。 5.空腹血糖测量值,属于( C )资料。 6.用某种新疗法治疗某病患者41人,治疗结果如下:治愈8人、显效23人、好转6人、恶化3人、死亡1人。该资料的类型是(B )。 7.某血库提供6094例ABO 血型分布资料如下:O 型1823、A 型1598、B 型2032、AB 型641。该资料的类型是(D )。 8. 100名18岁男生的身高数据属于(C )。 二、问答题 1.举例说明总体与样本的概念. 答:统计学家用总体这个术语表示小异的对象全体,通常称为目标总体,而资料常来源于目标总体的一个较小总体,称为研究总体。实际中由于研究总体的个体众多,甚至无限多,因此科学的办法是从中抽取一部分具有代表性的个体,称为样本。例如,关于吸烟与肺癌的研究以英国成年男子为总体目标,1951年英国全部注册医生作为研究总体,按照实验设计随机抽取的一定量的个体则组成了研究的样本。 2.举例说明同质与变异的概念 答:同质与变异是两个相对的概念。对于总体来说,同质是指该总体的共同特征,即该总体区别于其他总体的特征;变异是指该总体部的差异,即个体的特异性。例如,某地同性别同年龄的小学生具有同质性,其身高、体重等存在变异。 3.简要阐述统计设计与统计分析的关系 答:统计设计与统计分析是科学研究中两个不可分割的重要方面。一般的,统计设计在前,然而一定的统计设计

体育统计学

1.体育统计:是运用数据统计的原理和方法对体育领域里各种随机现象规律性 尽兴研究的一门基础应用学科,属方法论学科范畴。2.体育统计工作的基本过程: 1.统计资料的搜集; 2.统计资料的整理; 3.统计资料的分析。 3.体育统计研究对象的特征:1.运动性;2.综合性;3.客观性。 4.体育统计在体育活动中的作用:1.体育统计是体育教育科研活动的基础;2.体育统计有助于训练工作的科学化;3.体育统计能帮助研究者制定研究设计; 4.体育统计能帮助研究者有效地获取文献资料。 总体:根究统计研究的具体研究目的而确定的同质对象的全体。 6.总体可分为假想总体和现存总体。现存总体又分为有限总体和无限总体。 7.有限总体:指基本研究单位的边界是明晰的,并且基本研究单位的数量是有 限的总体。8.无限总体:指基本研究单位的数量是无限多的总体。 9.样本:根据需要与可能从总体中抽取的部分研究对象所形成的子集。可分为 随机样本和肥随机样本。10.随机样本:指采用随机取样方法获得的样本。非随机样本:指研究者根据研究的需要,寻找具备一定条件的对象所形成的样本。 11.样本含量用n表示,n大于等于45为大样本;n小于45为小样本。 12.等距随机抽样:机械随机抽样是先将总体中的个体按照与研究目的无关的任 一特征进行排列,然后根据要求按一定间隔抽取个体组成样本的方法。 13. 必然事件:事先能够预言一定会发生的事件。 14.随机事件:在一定的实验条件下,有可能发生也有可能不发生的事件。

15.随机变量:在统计研究中随机事件需由数值来表示,我们把随机事件的数量 表现成为随机变量。随机变量分连续型变量和离散型变量。 16.连续型变量:在一定的范围里,变量的所有的可能取值不能一一列举出来。 17.离散型变量:变量所有的可能取值能一一列举出来。18.总体参数:反映总体的一些数量特征。19.样本统计量:样本所获得的一些数量特征。20.收集资料的方法:1.日常积累;2.全面普查;3.专题研究。21.简单随机抽样的方法 1.抽签法; 2.随机数表法22.整群抽样:是在总体中先划分群,然后以集体为抽样的单位,在按简单随机抽样取出若干群所组成样本的一种抽样方法。 23.频数整理:该方法是将数据资料按一定顺序分成若干组,并数出各组中所含 有的数据个数,制成频数分布表。24.集中位置量数:反映一群性质相同的观察值的平均水平或集中趋势的统计指标。25.中位数:将样本的观察值按其数值大小顺序排列起来,处于中间位置的那个数值就是中位数。26.众数:是样本观测值在频数分布表中频数最多的那一组的组中值。27.几何平均数:是反应集中位置量数的一种方法,它是样本观测值的连乘积,并以样本观测值的总数为次数,开方求得。28.离中位置量数:描述一群性质相同的观察值的离散程度的统计指标。29.标准差:方差能全面的反映数据的离散程度,可是由于方差的单位与原观察值的单位不一致,为了统一单位起见,将方差开方,便得到了标准差。 30.标准差,它只能在同一项目的情况下,对不能够组的数据进行离散程度的比 较。31.变异系数也是反映变量的离散程度的统计指标,它是一样本标准差与平均数的百分数来表示的,没有单位,记作CV 32.变异系数兼顾了标准差与平均数两者,故它不受单位是否相同或所

体育统计学考试重点

体育统计学考试重点 1、体育统计学:体育统计是揭示体育科研中大量随机事件现象的规律的学科。 2、体育统计的基本工作过程:1、统计调查2、统计整理 3、统计分析 3、体育统计的研究对象除了体育领域里的各种可量化的随机现象之外,还应包括非体育领域但对体育的发展有关的各种随机现象。 4、体育统计研究对象的特征:1、运动性特征2、综合型特征3、客观性特征 5、体育统计是在体育教育科研活动的基础(简答)?一、体育统计是体育教育科研活动的基础二、体育统计有助于训练工作的科学化三、体育统计能帮助研究者制定研究计划四、体育统计能帮助研究者有效的获得文献资料 6、总体:根据统计科研的具体研究目的而确定的同质对象的全体。 7、样本:根据需要与可能从总体中抽取的部分研究对象所形成的子集。 8、必然事件:在一定条件下,必然会出现的事件。 9、随机事件:在一定的条件下,有可能发生的也有可能不发生的事件。

1、总体参数:反映总体的一些数量特征。而有样本所获得的一些数量特征称为样本统计量 2、概率:某个随机事件再一次实验中发生的可能性大小的数量指标,用p(a)表示。 3、全面普查:是指对研究对象总体中所有个体进行全部的测试或观察。 4、分层抽样;:将总体中的个体按某种属性特征分成若干类型,部分或层。然后在各种类型、部分、或层中按比例进行简单随机抽样组成研究样本的方法。 5、资料审核的内容和步骤?答:内容1、准确性2、完整性3、时效性步骤1、初审2、逻辑检查3、复核 6、集中位置数的类型:中位数、众数、几何平均数、算术平均数 7、中位数:将样本的观察值按从大到小的顺序排列起来,处于中间的位置的那个数。 8、众数:是样本观察值在频数分部分布表中频数最多的那一组的组中值。 9、离中位置数的种类:全距、绝对差、标准差、方差、平均差。 1、全距;:即两极差,就是一组观察值中最大值与最小值之差。 2、相对数:相对数也呈相对指标,是两个有联系的指标的比率。即两个有联系的指标进行对比,所得到的统计指标称为相对

统计学三大分布及正态分布的关系

统计学三大分布与正态分布的关系 [1] 张柏林 41060045 理实1002班 摘要:本文首先将介绍2χ分布,t 分布,F 分布和正态分布的定义及基本性质, 然后用理论说明2χ分布,t 分布,F 分布与正态分布的关系,并且利用数学软件MATLAB 来验证之. 1.三大分布函数[2] 1.12χ分布 2()n χ分布是一种连续型随机变量的概率分布。这个分布是由别奈梅(Benayme)、赫尔默特(Helmert)、皮尔逊分别于1858年、1876年、1900年所发现,它是由正态分布派生出来的,主要用于列联表检验。 定义:若随机变量12n ,,X X …X 相互独立,且都来自正态总体01N (,) ,则称统计量222 212n =+X X χ++…X 为服从自由度为n 的2χ分布, 记为22~()n χχ. 2χ分布的概率密度函数为 122210(;),2()200n x n x e x n f x n x --?≥??=Γ???? ,2χ分布的密度函数图形是一个只取非负值的偏态分布,如下图.

卡方分布具有如下基本性质: 性质1:22(()),(())2E n n D n n χχ==; 性质2:若221122(),()X n X n χχ==,12,X X 相互独立,则21212~()X X n n χ++; 性质3:2 n χ→∞→时,( n )正态分布; 性质4:设)(~2 2n α χχ,对给定的实数),10(<<αα称满足条 件:αχχα χα ==>?+∞ ) (2 22)()}({n dx x f n P 的点)(2 n α χ为)(2n χ分布的水平α的上侧分位数. 简称为上侧α分位数. 对不同的α与n , 分位数的值已经编制成表供查 用. 2()n χ分布的上α分位数 1.2t 分布 t 分布也称为学生分布,是由英国统计学家戈赛特在1908年“student ”的笔名 首次发表的,这个分布在数理统计中也占有重要的位置. 定义:设2 ~0~X N χ(,1),Y (n ),,X Y 相互独立,,则称统计量/T Y n = 服从自由度为n 的t 分布,记为~()T t n .

统计学常用分布及其分位数

§1、4 常用得分布及其分位数 1、 卡平方分布 卡平方分布、t 分布及F 分布都就是由正态分布所导出得分布,它们与正态分布一起,就是试验统计中常用得分布。 当X 1、X 2、… 、Xn 相互独立且都服从N(0,1)时,Z=∑i i X 2 得分布称为自由度等于n 得2χ分布,记作Z ~2χ(n),它得分布 密度 p(z )=??? ????>??? ??Γ--,,00,2212122其他z e x n z n n 式中得??? ??Γ2n =u d e u u n ?∞+--012,称为Gamma 函数,且()1Γ=1, ?? ? ??Γ21=π。2χ分布就是非对称分布,具有可加性,即当Y 与Z 相互独立,且Y ~2χ(n ),Z ~2χ(m ),则Y+Z ~2χ(n+m )。 证明: 先令X 1、X 2、…、X n 、X n+1、X n+2、…、 X n+m 相互独立且都服从N(0,1),再根据2χ分布得定义以及上述随机变量得相互独立性,令 Y=X 21+X 22+…+X 2n ,Z=X 21+n +X 22+n +…+X 2m n +, Y+Z= X 21+X 22+…+X 2n + X 21+n +X 22+n +…+X 2m n +, 即可得到Y+Z ~2χ(n +m )。 2、 t 分布 若X 与Y 相互独立,且 X ~N(0,1),Y ~2χ(n ),则Z =n Y X 得分布称为自由度等于n 得t 分布,记作Z ~ t (n ),它得分布密度 P(z)=)()(221n n n ΓΓ+2121+-???? ??+n n z 。 请注意:t 分布得分布密度也就是偶函数,且当n>30时,t

体育统计学—单因素方差分析---(共六道练习题

体育统计学—单因素方差分析------(共六道练习题!) 1、单因素方差分析实例1 为探讨不同的训练方法对提高100m成绩的效果,现将64名初一男生随机分成4组,每组16人,进行4种不同方法的训练,一学期后,按统一测量方法进行测试,得到他们实验前后100m跑成绩的差数,问不同训练方法的效果是否存在显著性差异? 一组: 0.3 0.20.0 0.10.4 0.2 0.3 0.5 0.40.3 0.10.0 -0.1 0.4 0.5 0.3 二组: 0.4 0.30.1 0.20.4 0.6 0.5 0.2 0.30.4 0.60.30.5 0.2 0.1 0.5 三组: 0.2 0.00.1 0.4 -0.1 0.0 0.1 0.2 0.0 -0.1 0.1 -0.20.3 0.1 0.2 0.1 四组: 0.1 0.1 -0.1 0.2 -0.1 0.2 0.0 0.3 0.20.1 0.1 -0.10.0 0.2 0.1 -0.1 2、单因素方差分析实例2 在1990 年秋对“亚运会期间收看电视的时间”调查结果如下表所示。 问:收看电视的时间比平日减少了(第一组)、与平日无增减(第二组)、比平日增加了(第三组)的三组居民在“对亚运会的总态度得分”上有没有显著的差异?即要检验从“态度”上看,这三组居民的样本是取自同一总体还是取自不同的总体 第一组: 42 41 42 42 43 第二组: 39 40 40 41 40 第三组: 43 44 43 45 45 3、单因素方差分析实例3 某高原研究组将籍贯相同、年龄相同、身高体重接近的30名新战士随机分为三组,甲组为对照组,按常规训练,乙组为锻炼组,每天除常规训练外,接受中速长跑与健身操锻炼,丙组为药物组,除常规训练外,服用抗疲劳药物,一月后测定第一秒用力肺活量(L),结果见表。试比较三组第一秒用力肺活量有无差别。 对照组: 3.25 3.32 3.29 3.34 3.16 3.64 3.60 3.28 3.52 3.26 锻炼组: 3.66 3.64 3.48 3.64 3.48 3.20 3.62 3.56 3.44 3.82 药物组: 3.44 3.62 3.48 3.36 3.52 3.60 3.32 3.44 3.16 3.28 4、单因素方差分析实例4 随机抽取某大学三个年级男生的共15人(每个年级5人)作为测试对象,测试他们的身高、体重、肺活量,求出肺活量体重指数。看不同年级学生的肺活量体重指数是否存在显著性差异。(注:肺活量体重指数=肺活量/体重) 5、书中P 128----第六题

统计学三大分布与正态分布的差异

申请大学学士学位论文 大学 学士学位论文 统计学三大分布与正态分布的差异年级专业: 学生: 指导教师:

统计学三大分布与正态分布的差异 中文摘要 统计学是应用数学的一个分支,主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化的分析、总结,并进而进行推断和预测,为相关决策者提供依据和参考。它被广泛的应用在各门学科之上,从物理和社会科学到人文科学,甚至被用来工商业及政府的情报决策之上。而对数据的分析过程中就需要利用到数据的分布来研究分类。 在实际遇到的许多随机现象都服从或近似服从正态分布。而由正态分布构造的三大分布在实际中有广泛的应用,因为这三大分布不仅有明确的背景,而且其抽样分布的密度函数有明显表达式,研究三大分布与正态分布有助于研究实际事例,比如经济安全与金融保险领域、人口统计等。 本文讨论了三大分布与正态分布,并将它们之间的密度函数进行比较说明. 第二章介绍了正态分布的定义、性质,三大分布的定义、性质。 第三章介绍了正态分布与三大分布的密度函数,并将它们之间的密度函数进行比较关键词:正态分布;三大分布;密度函数 The Difference between the Three Statistical Distributions and the Normal Distribution Abstract Statistics is a branch of applied mathematics, the mathematical models are mainly established by the probability and statistics theory based on the collecting

相关文档
最新文档