第三章 样本特征数
第三章 试验资料的整理及其特征数 - 植保

正正正正正正 T
32
18
正正正正正
25
19
正正正 T
17
20
正
5
◎变异较大的计数资料,可按一定幅度的方法制作次数分布表。 【例如】研究水稻品种的每穗粒数,共测 200 个穗,每穗粒数的变幅在 27-83,极差达 56。 以 5 粒为一组,作次数
表 3.3 200 个稻穗每穗粒数的次数分布表
每穗粒数( y )
计量资料在分组前需要确定组数、组距、各组中值及组限,然后将全部观测值划线计数归组。 书例 p37 以表 3.4 的 140 行水稻试验的产量为例,说明整理方法。
表 3.4 140 行水稻产量(单位:克)
177 215 197 97 123 159 245 119 119 131 149 152 167 104 161 214 125 175 219 118 192 176 175 95 136 199 116 165 214 95 158 83 137 80 138 151 187 126 196 134 206 137
成的一般水平,常用来进行资料间的比较。 (一)算术平均数(arithmetic mean)
各个观察值的总和除以观察值个数所得的商,称为算术平均数
通常用μ表示总体平均数. xN
xi
i 1
x
N
N
N
设有一个含 N 个观察值的有限总体,其观察值为 x1,x2,…,xN,则该总体的算术平均数μ定义为:
+c↓
+c↓
+c↓
第二组 82.5
90
97.5
类推 ………………………………………………
5. 原始资料归组
(二)计数资料的次数分布表
体育统计学复习题库

体育统计学复习题库体育统计学复习题第⼀章绪论⼀、名词解释:1、总体:根据统计研究的具体研究⽬的⽽确定的同质对象的全体,称为总体。
2、样本:根据需要与可能从总体中抽取的部分研究对象所形成的⼦集。
3、随机事件:在⼀定实验条件下,有可能发⽣也有可能不发⽣的事件称随机事件。
4、随机变量;把随机事件的数量表现(随机事件所对应的随机变化量)。
5、统计概率:如果实验重复进⾏n次,事件A出现m次,则m与n的⽐称事件A在实验中的频率,称统计概率。
6、体育统计学:是运⽤数理统计的原理和⽅法对体育领域⾥各种随机现象的规律性进⾏研究的⼀门基础应⽤学科。
⼆、填空题:1、从性质上看,统计可分为两类:描述性统计、推断性统计。
2、体育统计⼯作基本过程分为:收集资料、整理资料、分析资料。
3、体育统计研究对象的特征是:运动性、综合性、客观性。
4、从概率的性质看,当m=n时,P(A)=1,则事件A为必然事件。
当m=0时,P(A)=0,则事件A为不可能发⽣事件。
5、某校共有400⼈,其中患近视眼60⼈,若随机抽取⼀名同学,抽取患近视眼的概率为 0.15 。
6、在⼀场篮球⽐赛中,经统计某队共投篮128次,命中41次,在该场⽐赛中每投篮⼀次命中的率为 0.32 。
7、在标有数字1~8的8个乒乓球中,随机摸取⼀个乒乓球,摸到标号为6的概率为 0.125 。
8、体育统计是体育科研活动的基础,体育统计有助于运动训练的科学化,体育统计有助于制定研究设计,体育统计有助于获取⽂献资料。
9、体育统计中,总体平均数⽤µ表⽰,总体⽅差⽤σ2表⽰,总体标准差⽤σ表⽰。
10、体育统计中,样本平均数⽤x表⽰,样本⽅差⽤ S2表⽰,样本标准差⽤ S 表⽰。
11、从概率性质看,若A、B两事件相互排斥,则有:P(A)+ P(B)= P(A+B)。
12、随机变量有两种类型:⼀是连续型变量,⼆是离散型变量。
13、⼀般认为,样本含量 n≥45 为⼤样本,样本含量 n<45 为⼩样本。
2样本数据特征初步分析

初步分析
一、整理样本数据
原始数据 -信息在被操纵或处理后并没有超出其原有的格式
两种整理原始数据的基本方法
数据阵列
频数分布
2、整理数据 --数据阵列
保留了数据的原值 ,并按数值的升序或降序显示数据。 易观察到:
数据集中包含最大观察值和最小观察值
确认在某个数据集中哪些数组具有相同的值 很容易发现各个值之间的差异
茎叶图形
例如,我们想将12个数据转换成一张茎叶图形 : 4.4 3.0 3.6 4.5 4.4 3.8 3.7 2.2 7.6 3.9 3.6 3.5
茎叶图形
2| 2 3| 0 5 6 6 7 8 9 4| 4 4 5 5| 6| 7| 6
用直观方式显示定量变量
三种最常使用的图形类型 -直方图
频数分布
定义
分布 某个变量所有可能值的集合 显示了变量的图形特点
当数据集为小型时,数据之间的变化特点很容易观察出 来 随着数据集变为中型或大型,变量的特性一般表现得越 来越不明显
频数分布
定 义
组 频数 组限 频数分布的类别 每一组包含的观察值数目 每一组的上限和下限
组宽
上限和下限之间的间距
40 30 20 10
0
140.0 150.0 身高 计数频数
160.0
170.0
180.0
190.0 200.0
用直观方式显示定量--分布曲线
图形显示了每一组的累积频 数或相对累积频数 它可以用“小于”或“大于” 来表示
100
80 60 40 20 0 140.0 150.0 160.0 身高. 累积计数频数 170.0 180.0 190.0
样本特征数

100 % 1 . 25 %
CV 2
S2 x2
100 %
0 . 18 5 .9
100 % 3 . 05 %
说明该运动员100 m成绩较稳定
第三节 百分位数
一、定义:将一组数据从小到大排成有序数列,并将其100 等分,每一 等分处即是一个百分位,第 H等分处,称第H百分位数,即PH。 二、适用条件:百分位数可以描述任何分布数据资料的特征。 三、百分位数的计算:
试比较这两项成绩的离散程度。
解:这两组数据虽然单位相同,但 X相差较大,不能用S作比较,而应计算CV。 跳远:
CV 1
S1 x1
100 %
0 . 12 5 . 69
100 % 2 . 11 %
跳高:
CV 2
S2 x2
100 %
0 . 04 1 . 72
100 % 2 . 33 %
种辅助指标,以便大体了解数据的扩散程度。 【缺点】1、由于极端值的偶然性,会影响它的可靠 性和稳定性。 2、未把观察值都考虑进去,在分析资料中有
很大的局限性。
二、方差
S
2
(x x) n 1
2
x x 离均差(每一个实测值与均数之差)
n 1
自由度(能够独立自由变化的变量个数)
【缺点】方差的单位与原观察值的单位不一致,如身 高原来的单位是 cm ,而方差的单位就成了 cm2 ,为统一单位,方差开方便得到了S。
以不同的百分位数来描述离散的程度。
复习思考题
1、何谓集中位置量数、离中位置量数?常用的统计量有哪些?
2、什么叫平均数、中位数和众数?它们各适用于描述哪类数据分布?
3、举例说明标准差与变异系数的联系与区别。 4、测得12名男运动员的纵跳成绩为(单位:㎝)72,73,63,73, 64,58,59,56,62,67,69,66,计算其 x , M d 和 S 。
统计学 第三章抽样与抽样分布

=10
= 50 X
总体分布
n= 4
x 5
n =16
x 2.5
x 50
X
抽样分布
从非正态总体中抽样
结论:
从非正态中体中抽样,所形成 的抽样分布最终也是趋近于正态分 布的。只是样本容量需要更大些。
总结:中心极限定理
设从均值为,方差为 2的一个任意总体中抽 取容量为n的样本,当n充分大时(超过30),样本 均值的抽样分布近似服从均值为μ、方差为σ2/n的
总体
样本
参数
统计量
总体与样本的指标表示法
总体参数
样本统计量
(Parameter) (Sample Statistic)
容量 平均数 比例 方差 标准差
N
n
X
x
p
2
s2
s
小练习
某药品制造商感兴趣的是用该公司开发的某 种新药能控制高血压人群血压的比例。进行了一 项包含5000个高血压病人个体的研究。他发现用 这种药后80%的个体,他们的高血压能够被控制。 假定这5000个个体在高血压人群中具有代表性的 话,回答下列问题: 1、总体是什么? 2、样本是什么? 3、识别所关心的参数 4、识别此统计量并给出它的值 5、我们知道这个参数的值么?
正态分布
一个任意分 布的总体
x
n
当样本容量足够 大时(n 30) , 样本均值的抽样 分布逐渐趋于正 态分布
x
X
总体分布
正态分布
非正态分布
大样本 小样本 大样本 小样本
正态分布
正态分布
非正态分布
三 中心极限定理的应用
中心极限定理(Central Limit theorem) 不论总体服从何种分布,从中抽取
体育统计第三章样本特征数

频数点
Excel函数
某小学二年级3班、4班80名男孩身高数据(单位:cm):
135
134
129
133
131
131
131
134
140
128
136
127
131
137
115
133
134
124
128
135
133
131
123
131
136
144
143
140
124
144
138
127
131
120
121
125
130
例: 2 6 6 6 6 6 10 = 6
Excel函数
AVERAGE 算术平均数 [统计函数]
适 用:返回一组数据的集中趋势及平均水平
公 式:
x
x
n
预 备:数据区域A2:A6中,分别输入10,7,9,27,2
结果区域A8
函数窗:AVERAGE(A2:A6)等于 11
语 法:AVERAGE(数据区域)等于 平均数
20
频数
15 10
5
0
3班、4班频数分布图 身高上限
频数点
1班、2班与3班、4班身高频数分布表
身高下限 身高上限 1、2班频数3、4班频数
115
117
1
5
118
120
3
7
121
123
8
8
124
126
10
9
127
129
20
11
130
132
19
11
133
135
第3章 平均数、标准差与变异系数

复习题
试分别写出样本平均数、方差和标准差的统计量及参数 符号. 试写出平均数、方差、标准差、几何平均数、变异系数 的计算公式. 平方和的计算公式有-----、-------和-------。 已知∑xi2=45180,平均值=67,n=10,则其方差和标准 差分别为------和------ 。 已知样本平方和为360,样本容量为10,则其标准差等 于-------。
S
x ( x ) / n
2 2
n 1
2955000 5400 / 10
2
10 1
65.828
三、标准差的特性
1、各观测值间变异大,标准差也大,反之则小。 2、各观测值加或减一个常数,其标准差值不变。 3、每观测值乘或除一个常数a,则标准差是原来的
a倍或1/a倍。
Excel计算统计量
二、几何平均数
使用(适用)条件; 定义; 计算方法; 实例。
一、几何平均数适用条件
呈倍数关系或偏态分布的资料,描述
其集中性时可用几何平均数表示。
如畜禽 、水产养殖的增长率,抗体的滴度,药 物的效价,畜禽疾病的潜伏期等,可用几何平均 数表示其平均水平。
2、几何平均数定义
n个观测值相乘之积开n次方所得的方根, 称为几何平均数,记为G。
S
x
2
(
x)
2
n
n 1
6、
测定北京肉鸭周龄(x)与体重(g , y)如下:
周龄:0 1 2 3 4 5 体重 48.5 206 535 969 1467 1975 相对数: 4.25 2.60 1.81 1.51 1.35
试求其周平均生长速度。
体育统计学复习提纲PDF.pdf

体育统计学复习提纲一、填空部分第一章绪论1、根据统计研究的具体研究目的而确定的同质对象的全体,称为总体。
总体具有三个性质,分别是、、。
2、有10个运动员,现随机抽5人进行专业素质测试,共有种不同的组合。
3、一个骰子有六个面,在一次摇动实验后,出现3点或6点朝上的概率是。
4、从概率的性质看,当m=n时,P(A)=1,则事件A为必然事件。
当m=0时,P(A)=0,则事件A为不可能发生的事件5、在一个密闭的盒子中有8个乒乓球中,其中5个白色和3个黄色的球,随机摸取2个乒乓球,刚好摸到一白一黄的概率为。
6、从概率性质看,若A、B两事件互不相容事件,则有:P(A)+ P(B)=P(A+B)。
7、体育统计中,总体平均数用表示,总体方差用表示,总体标准差用表示。
第二章统计资料的整理1、在对连续型数据进行频数整理时,要确定组距及各组组限,设置各组组限的基本原则是:、。
2、“缺、疑、误”是资料审核中的内容。
3、对正态分布总体的数据进行审查时,常用±3S法对可疑数据进行筛查,这种方法是资料审核中的过程。
4、体育统计的一个重要思想方法是以去推断的特征。
5、频数分布可用直观图形表示,常用的有和两种。
6、统计资料在收集过程中,要求做到、、。
7、资料的审核的基本内容是审核资料的准确性和完整性,一般要求分三个步骤来完成,即:、、。
第三章样本特征数1、现测试10名学生的引体向上成绩分别为:12、10、8、3、8、9、8、3、9、3。
则其众数是和。
2、绝对差是指所有样本观测值与平均数差的之和。
3、自由度是指能够独立自由变化的变量个数。
因此,对于服从正态分布,样本量分别为n1和n2的两个样本的均值是否相等进行检验时,其自由度是。
4、要从甲、乙两运动员中选取一人参加比赛,若要用统计学方法处理,应考虑:、、三个方面。
5、在体育统计中,对同一项目,不同组数据进行离散程度比较时,采用;对不同性质的项目进行离散程度比较时采用。
6、已知:某中学生运动队的立定跳远=2.6m, S1=0.2m;原地纵跳=0.85m, S2=0.08m, 成绩更稳定的项目是。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
例如:例3.6(P28)
4、算术平均数的计算
• (二)算术平均数的简捷求法 简捷求法的思想方法是先假定一个假设 均数,用A表示,它与真均数之间一般 是有偏差的,我们可以用c表示该偏差。 那么,真均数为:
Xbar=A+c 当c求得时,真均数也就求得了。
4、算术平均数的计算
• (二)算术平均数的简捷求法 • 遵循原则: • 课本P29
• 求解公式P41(3.20或3.21) • 例题3.9
二、标准差的合成计算
• 合成标准差的计算方法是,先将个样本 含量ni、变量和∑x以及变量的平方 和∑x2分别求和,然后按照标准差的 数学定义求解。
• 求解公式(课本P43,公式3.22) • 例题3.10
第四节 平均数和标准差在体育中的应用
• 平均数包括算术均数(简称均数)、几 何均数、中位数与众数。
• 当分布基本对称时用均数反映集中趋势 与平均水平;
• 当频数呈偏态分布时用中位数能较好地 反映集中趋势。
第二节 离中位置量数
一、离中位置量数的概念
• 描述一群性质相同的观察值的离散程度 指标。
二、集中位置量数的种类
• (一)全距:即两极差,就是一组观测 值中最大值与最小值之差。
编号 1 2 3 4 5
成绩 2.72 2.68 2.78 2.83 2.62
编号 6 7 8 9 10
成绩 2.81 3.09 3.00 2.94 2.89
4、算术平均数的计算
• (一)算术平均数的直接求法 当样本含量是小样本时(n<45时)可 采用算术平均数的数学定义,直接求解。
求解步骤:
第一步:列计算表,求变量的总和,即∑x 第二步:根据公式,求出样本的算术平均
方和
• 3、求标准差S
第三节 平均数与S的合成计算
一、平均数的合成计算
• 是指将多个样本均数合并成一个大 样本的均数的计算。
• (一)样本含量相同的平均数合成计算 • 求算公式:P41(3.19) • 见例题3.8 • 样本含量相等时的平均数合成计算是合
成计算中的一种特例。
• (二)样本含量不等时的平均数合成计 算
• (二)绝对差:是所有样本观测值与其 平均数的绝对差之和。
• (三)平均差:是指样本中所有观测值 与平均数绝对差距的平均数。
二、集中位置量数的种类
• (四)方差 方差是最常用、最重要的指标。 公式见课本P35,公式:3.14和3.15
• (五)标准差 将方差开方,便是标准差 见公式3.16(P35)
一、平均数和标准差在选 择参赛运动员中的应用
• 考虑三个因素: • 1、运动员的最好成绩 • 2、运动员的平均水平 • 3、运动员成绩的稳定性
• 例题3.11
• 平均数和标准差提供的统计信息,可以 为教练员合理地选择参赛队员提供重要 的参考依据。
二、变异系数在稳定性研究中的应用
• 是以样本标准差与平均数的百分数来表 示的,没有单位,记作CV。
三、标准差的计算
• (一)标准差的直接求法 当样本含量小于45 直接带入公式3.17直接计算 见例题(P36)
三、标准差的计算
• (二)标准差的简捷求法 求标准差的两个原则 见课本P37-38
三、标准差的计算
• (二)标准差的简捷求法计算步骤 • 1、制作标准差的简捷求法计算表 • 2、计算缩小两次后的新变量的总的平
• 是样本观测值的连乘积,并以样本观测 值的总数为次数,开方求得。
• 表示方法: • 求解公式 • 例3.4(课本P26-27)
4、算术平均数
• 是所有观测值的总和除以总频数所得之 商,简称为平均数或均数。是统计学中 最常用的一种集中位置量数。
• 表示方法: • 公式应用 • 例3.5(P27)
某少年组运动员10人,立定 跳远成绩(单位,米)如下, 试求均数。
中位数处于频数分配的中点,不受极 端数值的影响。
• 确定中位数关键在于找出样本观察值的 中间项位置点。
• 样本含量为奇数 • 样本含量为偶数
2、众数
• 众数是样本观测值在频数分布表中频数 最多的那一组的组中值。
• 表示方法: • 众数在大面积普查研究中使用较多。 • 举例:课本P26例3.3
3、几何平数
第三章 样本特征数
• 样本特征数主要有两种形式: • 集中位置量数 • 离中位置量数
第一节 集中位置量数
• 集中位置量数:反映一群性质相 同的观察值的平均水平或集中趋
势的统计指标。
集中位置量数的种类:
• 1、中位数 将样本的观察值按其数值大小顺序排
列起来,处于中间的那个数值就是中位 数。
表示方法:
4、算术平均数的计算
• 计算步骤 • 1、制作平均数的简捷求法计算表 • 2、求各组的组中值 • 3、确定均数A • 4、求各组的组序差d • 5、求缩小两次后的变量的和 • 6、求缩小两次后的新变量的平均数 • 7、求原始变量的平均数
• 平均数是反映同类对象观测值的平均水 平与集中趋势的统计指标。
• 数学表达式(P46,公式3.23) • 例题3.12
三、标准差±3S法在原始 数据逻辑审核中的应用
• 例题:3.13
思考题
• P48-49