9.2.2 总体百分位数的估计
![9.2.2 总体百分位数的估计](https://img.360docs.net/imgf2/1saym45m7bv9ygidwgqjnn5w3ktl3zas-21.webp)
![9.2.2 总体百分位数的估计](https://img.360docs.net/imgf2/1saym45m7bv9ygidwgqjnn5w3ktl3zas-42.webp)
9.2.2总体百分位数的估计
课标要求素养要求
结合实例,能用样本估计百分位数,理解百分位数的统计含义.在学习和应用百分位数的过程中,要把实际问题转化为数学问题,并进行计算,
对数据进行分析,发展学生的数学建模、
数学运算素养和数据分析素养.
教材知识探究
某省数学考试结果揭晓,根据规定,0.8%的同学需要补考.
问题那么如何确定需要补考的分数线呢?
提示利用百分位数计算.
1.第p百分位数的定义
第50百分位数就是中位数,中位数是百分位数的特例,百分位数是中位数的推广一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
2.计算一组n个数据的第p百分位数的步骤
第1步,按从小到大排列原始数据.
第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
3.四分位数
25%,50%,75%这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数,其中第25百分位数也称为第一四分位数或下四分位数,第75百分位数也称为第三四分位数或上四分位数.
教材拓展补遗
[微判断]
1.若一组样本数据各不相等,则其75%分位数大于25%分位数.(√)
2.若一组样本数据的10%分位数是23,则在这组数据中有10%的数据大于2
3.(×)
3.若一组样本数据的24%分位数是24,则在这组数据中至少有76%的数据大于或等于2
4.(√)
提示 2.若一组样本数据的10%分位数是23,则在这组数据中有10%的数据小于或等于23.
[微训练]
1.下列一组数据的第25百分位数是()
2.1,
3.0,3.2,3.8,3.4,
4.0,4.2,4.4,
5.3,5.6
A.3.2
B.3.0
C.4.4
D.2.5
解析把该组数据按照由小到大排列,可得:
2.1,
3.0,3.2,3.4,3.8,
4.0,4.2,4.4,
5.3,5.6,
由i=10×25%=2.5,不是整数,则第3个数据3.2,是第25百分位数.
答案 A
2.下列关于一组数据的第50百分位数的说法正确的是()
A.第50百分位数就是中位数
B.总体数据中的任意一个数小于它的可能性一定是50%
C.它一定是这组数据中的一个数据
D.它适用于总体是离散型的数据
解析由百分位数的意义可知选项B,C,D错误.
答案 A
[微思考]
1.班级人数为50的班主任老师说“90%的同学能够考取本科院校”,这里的“90%”是百分位数吗?
提示不是.是指能够考取本科院校的同学占同学总数的百分比.
2.“这次数学测试成绩的第70百分位数是85分”这句话是什么意思?
提示有70%的同学数学测试成绩小于或等于85分.
题型一百分位数的计算
【例1】从某珍珠公司生产的产品中,任意抽取12颗珍珠,得到它们的质量(单位:g)如下:
7.9,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7.8,8.3,8.0.
(1)分别求出这组数据的第25,50,95百分位数;
(2)请你找出珍珠质量较小的前15%的珍珠质量;
(3)若用第25,50,95百分位数把公司生产的珍珠划分为次品、合格品、优等品和特优品,依照这个样本的数据,给出该公司珍珠等级的划分标准.
解(1)将所有数据从小到大排列,得
7.8,7.9,8.0,8.3,8.4,8.5,8.5,8.5,8.6,8.9,9.0,9.9,
因为共有12个数据,
所以12×25%=3,12×50%=6,12×95%=11.4,
则第25百分位数是8.0+8.3
2
=8.15,
第50百分位数是8.5+8.5
2
=8.5,
第95百分位数是第12个数据为9.9.
(2)因为共有12个数据,所以12×15%=1.8,则第15百分位数是第2个数据为7.9.
即产品质量较小的前15%的产品有2个,它们的质量分别为7.8,7.9.
(3)由(1)可知样本数据的第25百分位数是8.15 g ,第50百分位数为8.5 g ,第95百分位数是9.9 g ,所以质量小于或等于8.15 g 的珍珠为次品,质量大于8.15 g 且小于或等于8.5 g 的珍珠为合格品,质量大于8.5 g 且小于或等于9.9 g 的珍珠为优等品,质量大于9.9 g 的珍珠为特优品.
规律方法 计算一组n 个数据的第p 百分位数的一般步骤:
(1)排列:按照从小到大排列原始数据;
(2)算i :计算i =n ×p %;
(3)定数:若i 不是整数,大于i 的最小整数为j ,则第p 百分位数为第j 项数据;若i 是整数,则第p 百分位数为第i 项与第(i +1)项数据的平均数.
【训练1】 如图所示是某市3月1日至3月10日的最低气温(单位:℃)的情况绘制的折线统计图,由图可知这10天最低气温的第80百分位数是( )
A.-2
B.0
C.1
D.2
解析 由折线图可知,这10天的最低气温按照从小到大的排列为:-3,-2,-1,-1,0,0,1,2,2,2,
因为共有10个数据,所以10×80%=8,是整数,则这10天最低气温的第80百
分位数是2+22=2.
答案 D
题型二 百分位数的综合应用
【探究1】第p百分位数有什么特点?
提示总体数据中的任意一个数小于或等于它的可能性是p%.
【探究2】某组数据的第p百分位数在此组数据中一定存在吗?为什么?
提示不一定.因为按照计算第p百分位数的步骤,第2步计算所得的i=n×p%如果是整数,则第p百分位数为第i项与第(i+1)项数据的平均数,若第i项与第(i+1)项数据不相等,则第p百分位数在此组数据中就不存在.
【探究3】某市为了鼓励居民节约用电,实行“阶梯式”电价,将该市每户居民的月用电量划分为三档,月用电量不超过200千瓦时的部分按0.5元/千瓦时收费,超过200千瓦时但不超过400千瓦时的部分按0.8元/千瓦时收费,超过400千瓦时的部分按1.0元/千瓦时收费.
(1)求某户居民用电费用y(单位:元)关于月用电量x(单位:千瓦时)的函数解析式;
(2)为了了解居民的用电情况,通过抽样获得了今年1月份100户居民每户的用电量,统计分析后得到如图所示的频率分布直方图.若这100户居民中,今年1月份用电费用低于260元的占80%,求a,b的值;
(3)根据(2)中求得的数据计算用电量的75%分位数.
解(1)当0≤x≤200时,y=0.5x;
当200 y=0.5×200+0.8×(x-200)=0.8x-60; 当x>400时, y=0.5×200+0.8×200+1.0×(x-400)=x-140. 所以y与x之间的函数解析式为 y =?????0.5x ,0≤x ≤200,0.8x -60,200 (2)由(1)可知,当y =260时,x =400,即用电量低于400千瓦时的占80%, 结合频率分布直方图可知 ?????0.001×100+2×100b +0.003×100=0.8,100a +0.000 5×100=0.2, 解得a =0.001 5,b =0.002 0. (3)设75%分位数为m , 因为用电量低于300千瓦时的所占比例为 (0.001+0.002+0.003)×100=60%, 用电量低于400千瓦时的占80%, 所以75%分位数m 在[300,400)内, 所以0.6+(m -300)×0.002=0.75, 解得m =375(千瓦时),即用电量的75%分位数为375千瓦时. 规律方法 由频率分布直方图求百分位数的方法 (1)要注意频率分布直方图中小矩形的面积,就是数据落在该组的频率. (2)一般采用方程的思想,设出第p 百分位数,根据其意义列出方程并求解即可. 【训练2】 某市为了了解人们对“中国梦”的伟大构想的认知程度,对不同年龄和不同职业的人举办了一次“一带一路”知识竞赛,满分100分(90分及以上为认知程度高),现从参赛者中抽取了x 人,按年龄分成5组(第一组:[20,25),第二组:[25,30),第三组:[30,35),第四组:[35,40),第五组:[40,45]),得到如图所示的频率分布直方图,已知第一组有5人. (1)求x; (2)求抽取的x人的年龄的50%分位数(结果保留整数); (3)以下是参赛的10人的成绩:90,96,97,95,92,92,98,88,96,99,求这10人成绩的20%分位数和平均数,以这两个数据为依据,评价参赛人员对“一带一路”的认知程度,并谈谈你的感想. 解(1)第一组频率为0.01×5=0.05, 所以x=5 0.05 =100. (2)由图可知年龄低于30岁的所占比例为40%,年龄低于35岁的所占比例为70%, 所以抽取的x人的年龄的50%分位数在[30,35)内,由30+5×0.50-0.40 0.70-0.40 =95 3≈32, 所以抽取的x人的年龄的50%分位数为32. (3)把参赛的10人的成绩按从小到大的顺序排列:88,90,92,92,95,96,96,97,98,99, 计算10×20%=2,所以这10人成绩的20%分位数为90+92 2 =91,这10人成绩 的平均数为 1 10(88+90+92+92+95+96+96+97+98+99)=94.3. 评价:从第20百分位数和平均数来看,参赛人员的认知程度很高. 感想:结合本题和实际,符合社会主义核心价值观即可. 一、素养落地 1.通过学习和应用百分位数,重点培养数据分析素养、数学运算和数学建模素养. 2.求一组数据的百分位数时,掌握其步骤:①按照从小到大排列原始数据;②计算i=n×p%;③若i不是整数,大于i的最小整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数. 二、素养训练 1.已知100个数据的第75百分位数是9.3,则下列说法正确的是() A.这100个数据中一定有75个数小于或等于9.3 B.把这100个数据从小到大排列后,9.3是第75个数据 C.把这100个数据从小到大排列后,9.3是第75个数据和第76个数据的平均数 D.把这100个数据从小到大排列后,9.3是第75个数据和第74个数据的平均数解析因为100×75%=75为整数,所以第75个数据和第76个数据的平均数为第75百分位数,是9.3,选C. 答案 C 2.数据7.0,8.4,8.4,8.4,8.6,8.7,9.0,9.1的第30百分位数是________. 解析因为8×30%=2.4,故30%分位数是第三项数据8.4. 答案8.4 3.一组样本数据的频率分布直方图如图所示,试估计此样本数据的第50百分位数为________. 解析样本数据低于10的比例为(0.08+0.02)×4=0.40,样本数据低于14的比例为0.40+0.09×4=0.76,所以此样本数据的第50百分位数在[10,14)内,估计此 样本数据的第50百分位数为10+0.1 0.36×4=100 9. 答案100 9 4.求下列数据的四分位数. 13,15,12,27,22,24,28,30,31,18,19,20,解把12个数据按从小到大的顺序排列可得: 12,13,15,18,19,20,22,24,27,28,30,31,计算12×25%=3,12×50%=6,12×75%=9, 所以数据的第25百分位数为15+18 2 =16.5, 第50百分位数为20+22 2 =21, 第75百分位数为27+28 2 =27.5. 基础达标 一、选择题 1.数据12,14,15,17,19,23,27,30的第70百分位数是() A.14 B.17 C.19 D.23 解析因为8×70%=5.6,故70%分位数是第六项数据23. 答案 D 2.以下数据为参加数学竞赛决赛的15人的成绩:(单位:分) 78,70,72,86,88,79,80,81,94,84,56,98,83,90,91,则这15人成绩的第80百分位数是() A.90 B.90.5 C.91 D.91.5 解析把成绩按从小到大的顺序排列为: 56,70,72,78,79,80,81,83,84,86,88,90,91,94,98, 因为15×80%=12,所以这15人成绩的第80百分位数是90+91 2 =90.5. 答案 B 3.某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间[5,40]中,其频率分布直方图如图所示.估计棉花纤维的长度的样本数据的80%分位数是() A.29 mm B.29.5 mm C.30 mm D.30.5 mm 解析棉花纤维的长度在30 mm以下的比例为 (0.01+0.01+0.04+0.06+0.05)×5=0.85=85%, 在25 mm以下的比例为85%-25%=60%, 因此,80%分位数一定位于[25,30)内, 由25+5×0.80-0.60 0.85-0.60 =29, 可以估计棉花纤维的长度的样本数据的80%分位数是29 mm. 答案 A 4.某厂10名工人在一小时内生产零件的个数分别是15,17,14,10,15,17,17,16,14,12,设该组数据的平均数为a,第50百分位数为b,则有() A.a=13.7,b=15.5 B.a=14,b=15 C.a=12,b=15.5 D.a=14.7,b=15 解析把该组数据按从小到大的顺序排列为10,12,14,14,15,15,16,17, 17,17,其平均数a=1 10×(10+12+14+14+15+15+16+17+17+17)=14.7, 因为10×50%=5,所以这10名工人一小时内生产零件的第50百分位数为b= 15+152=15. 答案 D 5.已知甲、乙两组数据(已按从小到大的顺序排列): 甲组:27,28,39,40,m ,50; 乙组:24,n ,34,43,48,52; 若这两组数据的第30百分位数、第80百分位数分别相等,则m n 等于( ) A.127 B.107 C.43 D.74 解析 因为30%×6=1.8,80%×6=4.8,所以第30百分位数为n =28,第80百 分位数为m =48,所以m n =4828=127. 答案 A 二、填空题 6.某学校组织学生参加数学测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100],则60分为成绩的第________百分位数. 解析 因为分数位于[20,40),[40,60)的频率之和为(0.005+0.01)×20=0.3,所以60分为成绩的第30百分位数. 答案 30 7.某年级120名学生在一次百米测试中,成绩全部介于13秒与18秒之间.将测试结果分成5组:[13,14),[14,15),[15,16),[16,17),[17,18],得到如图所示的频率分布直方图.如果从左到右的5个小矩形的面积之比为1∶3∶7∶6∶3,那么成绩的70%分位数约为________秒. 解析成绩的70%分位数为x,因为 1+3+7 1+3+7+6+3 =0.55, 1+3+7+6 1+3+7+6+3 =0.85, 所以x∈[16,17), 所以0.55+(x-16)×6 1+3+7+6+3 =0.70,解得x=16.5(秒). 答案16.5 8.已知30个数据的第60百分位数是8.2,这30个数据从小到大排列后第18个数据是7.8,则第19个数据是______. 解析由于30×60%=18,设第19个数据为x,则7.8+x 2 =8.2,解得x=8.6,即 第19个数据是8.6. 答案8.6 三、解答题 9.如图是某市2019年4月1日至4月7日每天最高、最低气温的折线统计图,求这7天的日最高气温的第10百分位数和日最低气温的第80百分位数. 解由折线图可知,把日最高气温按照从小到大排序,得 24,24.5,24.5,25,26,26,27, 因为共有7个数据,所以7×10%=0.7,不是整数,所以这7天日最高气温的第 10百分位数是第1个数据,为24 ℃. 把日最低气温按照从小到大排序,得 12,12,13,14,15,16,17, 因为共有7个数据,所以7×80%=5.6,不是整数,所以这7天日最低气温的第80百分位数是第6个数据,为16 ℃. 10.某网络营销部门随机抽查了某市200名网友在2019年11月11日的网购金额,所得数据如下表: 网购金额(单位:千元) 人数 频率 (0,1] 16 0.08 (1,2] 24 0.12 (2,3] x p (3,4] y q (4,5] 16 0.08 (5,6] 14 0.07 合计 200 1.00 已知网购金额不超过3千元与超过3千元的人数比恰为3∶2. (1)试确定x ,y ,p ,q 的值,并补全频率分布直方图(如图); (2)估计网购金额的25%分位数(结果保留3位有效数字). 解 (1)根据题意有:?????16+24+x +y +16+14=200,16+24+x y +16+14=32, 解得?????x =80,y =50. 所以p =0.4,q =0.25. 补全频率分布直方图如图所示: (2)由(1)可知,网购金额不高于2千元的频率为 0.08+0.12=0.2, 网购金额不高于3千元的频率为0.2+0.4=0.6, 所以网购金额的25%分位数在(2,3]内, 则网购金额的25%分位数为2+0.25-0.2 0.6-0.2×1=2.125≈2.13(千元). 能力提升 11.数据3.2,3.4,3.8,4.2,4.3,4.5,x ,6.6的第65百分位数是4.5,则实数x 的取值范围是( ) A.[4.5,+∞) B.[4.5,6.6) C.(4.5,+∞) D.(4.5,6.6] 解析 因为8×65%=5.2,所以这组数据的第65百分位数是第6项数据4.5,则x ≥4.5,故选A. 答案 A 12.某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层随机抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组: [20,30),[30,40),…,[80,90],并整理得到如下频率分布直方图: (1)估计总体400名学生中分数小于70的人数; (2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数; (3)根据该大学规定,把15%的学生划定为不及格,利用(2)中的数据,确定本次测试的及格分数线,低于及格分数线的学生需要补考. 解(1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6, 所以样本中分数小于70的频率为1-0.6=0.4. 所以估计总体400名学生中分数小于70的人数为 400×0.4=160. (2)根据题意,样本中分数不小于50的频率为 (0.01+0.02+0.04+0.02)×10=0.9, 分数在区间[40,50)内的人数为100-100×0.9-5=5. 所以总体中分数在区间[40,50)内的人数估计为 400× 5 100 =20. (3)设分数的第15百分位数为x, 分数小于50的频率为1-(0.01+0.02+0.04+0.02)×10=0.1,分数小于60的频率为0.1+0.1=0.2, 所以x∈[50,60),则0.1+(x-50)×0.01=0.15, 解得x=55,则本次考试的及格分数线为55分. 创新猜想 13.(多选题)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( ) A.甲的成绩的平均数小于乙的成绩的平均数 B.甲的成绩的平均数等于乙的成绩的平均数 C.甲的成绩的第80百分位数等于乙的成绩的第80百分位数 D.甲的成绩的极差等于乙的成绩的极差 解析 由图可得,x - 甲=4+5+6+7+85=6,x -乙=3×5+6+95=6,A 项错误,B 项正确; 甲的成绩的第80百分位数7+82=7.5,乙的成绩的第80百分位数6+92=7.5,所以 二者相等,所以C 项正确; 甲的成绩的极差为4,乙的成绩的极差也为4,D 项正确. 答案 BCD 14.(多填题)对某市“四城同创”活动中800名志愿者的年龄抽样调查统计后得到频率分布直方图(如图),但是年龄组为[25,30)的数据不慎丢失,则依据此图可得: (1)[25,30)年龄组对应小矩形的高度为________; (2)由频率分布直方图估计志愿者年龄的85%分位数为________岁. 解析(1)设[25,30)年龄组对应小矩形的高度为h,则 5×(0.01+h+0.07+0.06+0.02)=1,解得h=0.04. (2)由图可知,年龄小于35岁的频率为(0.01+0.04+0.07)×5=0.6,年龄小于40岁的频率为(0.01+0.04+0.07+0.06)×5=0.9, 所以志愿者年龄的85%分位数在[35,40)内, 因此志愿者年龄的85%分位数为35+0.85-0.6 0.9-0.6 ×5≈39(岁). 答案(1)0.04(2)39 百分位数的计算方法及示例 假设以前有m 个厂家中标,中标价分别记为12,,,m x x x L ,其中k x 表示第k 个厂家的中标价。将这m 个中标价由小到大排列,记排列后的中标价为(1)(2)()m x x x ≤≤≤L ,其中()k x 表示m 个中标价经排列之后“第k 小”的中标价(注:“第1小”即最小,“第m 小”即最大),记(0)0x =。 现欲计算p (如:75%p =)分位数p ξ,只需找到正整数 k (0,1,,1k m =-L ),使得1k k p m m +<≤,则()(1)k p k x x ξ+<≤,而且 (1)()()()()p k k k mp k x x x ξ+=--+. 例1 若某药品以往由3家中标厂家,即3m =,中标价分别为112.98x =,2 4.56x =, 365.80x =,则将以上3个中标价由小到大排列后,得 (1) 4.56x =,(2)12.98x =,(3)65.80x = 求它们的75%分位数。 解答: (1)因为2175%13k k m m +=<≤=,则75%ξ位于(2)x 和(3)x 之间; (2)则75%(375%2)(65.8012.98)12.9826.185ξ=?--+=。 从而,该药品的原有中标价的75P 为26.185。 例2 12m =,报价分别是4.3,6.5,7.8,6.2,9.6,15.9,7.6,8.1,10,12.3,11,3,求它们的75%分位数。 3 4.3 6.2 6.5 7.6 7.8 8.1 9.6 10 11 12.3 15.9 解答: (1)因为81975%1212 k k m m +=<≤=,则75%ξ位于(8)x 和(9)x 之间; (2)则75%(1275%8)(109.6)9.610ξ=?--+=。 从而,该报价的75P 为10。 例3 10m =,报价分别是3.65,3.68,3.68,3.72,3.73,3.75,3.80, 3.80,3.81,3.83,求它们的75%、50%分位数。 解答: (1)因为71875%1010 k k m m +=<≤=,则75%ξ位于(7)x 和(8)x 之间; (2)则75%(1075%7)(3.8 3.8) 3.8 3.8ξ=?--+=。 从而,该报价的75P 为3.8。 类似地,可以计算50P 。实际上,50%分位数可由下式得到 50%(1050%4)(3.73 3.72) 3.72 3.73ξ=?--+=。 精品文档 假设你的数据在A列 在B1输入=PERCENTILE(E1:E10,0.1) 得到的是第10百分位数 在B2输入=PERCENTILE(E1:E10,0.9) 得到的是第90百分位数 追问 我想用函数做,如何进行呢? 回答 不知道你的具体含义。在excel里函数与我们平常说的公式是一个概念。 推测你是要使用宏? 追问 我找到了计算百分位数的函数PERCENTILE(array,k),但是不知如何 使用。 回答 你找到的函数不就是我给出答案里的公式吗 假设你的数据在A列A1~A10 , 在B1输入=PERCENTILE(A1:A10,0.1) 得到的是第10百分位数 在B2输入=PERCENTILE(A1:A10,0.9) 得到的是第90百分位数 提问者评价 我明白了,谢谢。 什么是百分位数 统计学术语,如果将一组数据从大到小排序,并计算相应的累计百分位,则某一百分位所对应数据的值就称为这一百分位的百分位数。可表示为:一组n个观测值按数值大小排列如,处于p%位置的值称第p百分位数。 中位数是第50百分位数。 第25百分位数又称第一个四分位数(First Quartile),用Q1表示;第50百分位数又称第二个四分位数(Second Quartile),用Q2表示;第75百分位数又称第三个四分位数(Third Quartile),用Q3表示。若求得第p百分位数为小数,可完整为整数。 分位数是用于衡量数据的位置的量度,但它所衡量的,不一定是中心位置。百分位数提供了有关各数据项如何在最小值与最大值之间分布的信息。对于无大量重复的数据,第p百分位数将它分为两个部分。大约有p%的数据项的值比第p 百分位数小;而大约有(100-p)%的数据项的值比第p百分位数大。对第p百分位数,严格的定义如下。 第p百分位数是这样一个值,它使得至少有p%的数据项小于或等于这个值,精品文档 1、百分位数的计算公式: 2、百分等级的计算公式: 3、四分位差的计算方法: 4、分组资料Q1和Q3的求法: 5、分组资料标准差的计算方法 6、差异系数 7、标准分数 8、标准分数的性质当一组数据的每个数值都转化为标准分数后,则标准分数的平均数为零, 标准差为1,即 9. 当样本是随机取样时,s、Q、R,这几个差异量数的可靠性一次降低;当要求计算要容易快捷时,R、Q、s依次变得繁杂;当要求统计量进一步使用时,s远远胜过其他差异量数;在偏态分布中,Q比s更常用;当分布是截尾分布时,只有Q能正缺地指出分布的变异性10. r =0完全不相关;0 ≤r ≤0.3 微弱相关;0.3 ≤r ≤0.5低度相关; 0 .5≤r ≤0.8显著相关;0.8 ≤r ≤1 高度相关;r =1 完全相关。 11. 积差相关系数 12. 运用标准分数计算积差相关系数 13. 斯皮尔曼等级相关等级差数法 D为两变量每对数据的等级之差;N表示样本容量 14. 有相同等级时计算等级系数 15. 肯德尔和谐系数 16. 点二列相关系数17. ?相关 18. 良好估计量的标准: 无偏性有效性一致性充分性 19. t分布的特征: t分布的形状与自由度df有关:自由度越小,则平均数的标准差越大,曲线越“扁平” 自由度越大,则。。。,曲线越“瘦高” 当自由度为无穷大时,t分布曲线与标准正态分布曲线完全吻合,故标准正态分布是t分布的特例。 20. 总体分布为正态,方差未知时,样本平均数的分布为t分布 21. 当总体分布为非正态而其方差又未知时若满足n>30这一条件,样本平均数的分布近似t分布。则标准误为: 22. 卡方分布是一个正偏态分布’n越小,分布越偏斜。df很大时,接近正态分布,当df→∞时,2分布即为正态分布。2分布也是一族分布,正态分布是其中一特例。2值都是正值; 分布的和也2分布 23. 百分位数 简介 percentile 统计学术语,如果将一组数据从大到小排序,并计算相应的累计百分位,则某一百分位所对应数据的值就称为这一百分位的百分位数。可表示为:一组n个观测值按数值大小排列如,处于p%位置的值称第p百分位数。 说明一: 用99个数值或99个点,将按大小顺序排列的观测值划分为100个等分,则这99个数值或99个点就称为百分位数,分别以Pl,P2,…,P99代表第1个,第2个,…,第99个百分位数。第j个百分位数j=1,2…100。式中Lj,fj和CFj分别是第j个百分位数所在组的下限值、频数和该组以前的累积频数,Σf是观测值的数目。 百分位通常用第几百分位来表示,如第五百分位,它表示在所有测量数据中,测量值的累计频次达5%。以身高为例,身高分布的第五百分位表示有5%的人的身高小于此测量值,95%的身高大于此测量值。 百分位数则是对应于百分位的实际数值。 说明二: 中位数是第50百分位数。 第25百分位数又称第一个四分位数(First Quartile),用Q1表示;第50百分位数又称第二个四分位数(Second Quartile),用Q2表示;第75百分位数又称第三个四分位数(Third Quartile),用Q3表示。若求得第p百分位数为小数,可完整为整数。 分位数是用于衡量数据的位置的量度,但它所衡量的,不一定是中心位置。百分位数提供了有关各数据项如何在最小值与最大值之间分布的信息。对于无大量重复的数据,第p 百分位数将它分为两个部分。大约有p%的数据项的值比第p百分位数小;而大约有(100-p)%的数据项的值比第p百分位数大。对第p百分位数,严格的定义如下。 第p百分位数是这样一个值,它使得至少有p%的数据项小于或等于这个值,且至少有(100-p)%的数据项大于或等于这个值。高等院校的入学考试成绩经常以百分位数的形式报告。比如,假设某个考生在入学考试中的语文部分的原始分数为54分。相对于参加同一考试的其他学生来说,他的成绩如何并不容易知道。但是如果原始分数54分恰好对应的是第70百分位数,我们就能知道大约70%的学生的考分比他低,而约30%的学生考分比他高。 下面的步骤来说明如何计算第p百分位数。 第1步:以递增顺序排列原始数据(即从小到大排列)。 第2步:计算指数i=np% 第3步: l)若i 不是整数,将i 向上取整。大于i的毗邻整数即为第p百分位数的位置。 2) 若i是整数,则第p百分位数是第i项与第(i+l)项数据的平均值。 第5课时总体百分位数的估计 1. 数据12, 14, 15, 17, 19, 23, 27, 30的第70百分位数是() A. 14 B. 17 C. 19 D. 23 2. 参加数学竞赛决赛的15人的成绩(单位:分)如下: 78, 70, 72, 86, 88, 79, 80, 81, 94, 84, 56, 98, 83, 90, 91. 这15人成绩的第80百分位数是() A. 90 B. 90.5 C. 91 D. 91.5 3. 某厂10名工人在一小时内生产零件的个数分别是15, 17, 14, 10, 15, 17, 17, 16, 14,12.设该组数据的平均数为a, 第50百分位数为b,则有() A. a=13.7, b=15.5 B. a=14, b=15 C. a=12, b=15.5 D. a=14.7, b=15 4. 已知甲、乙两组数据按从小到大排序如下: 甲组:27, 28, 39, 40, m, 50. 乙组:24, n, 34, 43, 48, 52. 若这两组数据的第30百分位数、第80百分位数分别相等,则m n等于() A. 4 3 B. 10 7 C. 12 7 D. 7 4 5. (多选)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形图如图所示. (第5题) 下列说法中正确的有() A. 甲成绩的平均数小于乙成绩的平均数 B. 甲成绩的第25百分位数是5 C. 乙成绩的第50百分位数是6 D. 甲成绩的第80百分位数等于乙成绩的第80百分位数 6. 某中学甲、乙两名同学最近几次的数学考试成绩(单位:分)如下: 甲:95, 81, 75, 89, 71, 65, 76, 88, 94, 110, 107. 乙:83, 86, 93, 99, 88, 103, 98, 114, 98, 79, 101. 甲得分的第50百分位数为________,乙得分的第75百分位数为________. 7. 某市4月1日至4月7日每天最高、最低气温的折线图如图所示,求这7天的日最高气温的第10百分位数和日最低气温的第80百分位数. (第7题) 8. 某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间[5, 40]中,其频率分布直方图如图所示.估计棉花纤维长度的样本数据的第80百分位数是() (第8题) A. 29 B. 29.5 总体百分位数的估计 1.已知100个数据的第75百分位数是9.3,则下列说法正确的是() A.这100个数据中一定有75个数小于或等于9.3 B.把这100个数据从小到大排列后,9.3是第75个数据 C.把这100个数据从小到大排列后,9.3是第75个数据和第76个数据的平均数 D.把这100个数据从小到大排列后,9.3是第75个数据和第74个数据的平均数 2.数据8,6,5,2,7,9,12,4,12的第40百分位数是() A.5 B.6 C.7.5 D.8 3.以下数据为参加数学竞赛决赛的15人的成绩: 78,70,72,86,88,79,80,81,94,84,56,98,83,90,91, 则这15人成绩的第80百分位是() A.90 B.90.5 C.91 D.91.5 4.某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间[5,40]中,其频率分布直方图如图所示.估计棉花纤维的长度的样本数据的80%分位数是() A.28 mm B.28.5 mm C.29 mm D.29.5 mm 5.某厂10名工人在一小时内生产零件的个数分别是15,17,14,10,15,17,17,16,14,12,设该组数据的平均数为a,第50百分位数为b,则有() A.a=13.7, b=15.5 B.a=14, b=15 C.a=12, b=15.5 D.a=14.7, b=15 6.高一(1)班数学兴趣小组8名同学的数学竞赛成绩(单位:分)分别为:80,68,90,70,88,96,89,98,则该数学成绩的15%和50%分位数分别为________. 7.某学校组织学生参加数学测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100],则60分为成绩的第________百分位数. 假设你的数据在A列 在B1输入=PERCENTILE(E1:E10, 得到的是第10百分位数 在B2输入=PERCENTILE(E1:E10, 得到的是第90百分位数 追问 我想用函数做,如何进行呢 回答 不知道你的具体含义。在excel里函数与我们平常说的公式是一个概念。 推测你是要使用宏 追问 我找到了计算百分位数的函数PERCENTILE(array,k),但是不知如何使用。回答 你找到的函数不就是我给出答案里的公式吗 假设你的数据在A列A1~A10 , 在B1输入=PERCENTILE(A1:A10, 得到的是第10百分位数 在B2输入=PERCENTILE(A1:A10, 得到的是第90百分位数 提问者评价 我明白了,谢谢。 什么是百分位数 统计学术语,如果将一组数据从大到小排序,并计算相应的累计百分位,则某一百分位所对应数据的值就称为这一百分位的百分位数。可表示为:一组n个观测值按数值大小排列如,处于p%位置的值称第p百分位数。 中位数是第50百分位数。 第25百分位数又称第一个四分位数(First Quartile),用Q1表示;第50百分位数又称第二个四分位数(Second Quartile),用Q2表示;第75百分位数又称第三个四分位数(Third Quartile),用Q3表示。若求得第p百分位数为小数,可完整为整数。 分位数是用于衡量数据的位置的量度,但它所衡量的,不一定是中心位置。百分位数提供了有关各数据项如何在最小值与最大值之间分布的信息。对于无大量重复的数据,第p百分位数将它分为两个部分。大约有p%的数据项的值比第p 百分位数小;而大约有(100-p)%的数据项的值比第p百分位数大。对第p百分位数,严格的定义如下。 第p百分位数是这样一个值,它使得至少有p%的数据项小于或等于这个值,且至少有(100-p)%的数据项大于或等于这个值。 高等院校的入学考试成绩经常以百分位数的形式报告。比如,假设某个考生在入学考试中的语文部分的原始分数为54分。相对于参加同一考试的其他学生来说,他的成绩如何并不容易知道。但是如果原始分数54分恰好对应的是第70百分位数,我们就能知道大约70%的学生的考分比他低,而约30%的学生考分比他高。 上百分位数估计意思是百分位数比较大的情况,一般上百分位数应该>50%。即50%多的数据比该值小,小于50%的数据比该值大。 薪酬分位值计算方法 相信做过薪酬的HR们都知道分位值的概念吧。薪酬分位值主要反映市场的薪酬水平状态:10分位值表示有10%的数据小于此数值,反映市场的低端水平。 25分位值表示有25%的数据小于此数值,反映市场的较低端水平。 50分位值(中位值)表示有50%的数据小于此数值,反映市场的中等水平。 75分位值表示有75%的数据小于此数值,反映市场的较高端水平。 90分位值表示有90%的数据小于此数值,反映市场的高端水平。 对于分位值的概念也许大家都比较容易理解,那给出一组数据,大家都能计算出不同分位值吗?分位值的含义究竟是神马?下面数字比较多,大家静下心看,最后的函数使用实际上非常简单,关键我们需理解他的计算含义。 首先,让我们了解四分位数的概念。 四分位数实际是分位数中的一种分法,将数列等分的形式不同可以分为中位数,四分位数,十分位数、百分位数等等。我们把数据划分为4个部分,每一个部分大约包含有1/4即25%的数据项,这种划分的临界点数字即为四分位数。 第1四分位数,即第25百分位数(25分位值); 第2四分位数,即第50百分位数(50分位值); 第3四分位数,即第75百分位数(75分位值)。 给出一组数据,如何计算上述三个重要的分位值呢? 假设下面一组数据(附表1),我们求他们的25分位,50分位,75分位值 第一种方法:手工计算,我们通过计算过程来理解其中的含义。 步骤1:得出四分位间。附表中有14个数据,共13个间隔,则四分位间为13/4=3.25 步骤2:计算25分位值。第一个四分位值(即25分位值)=第(1+3.25)个数的数字,即第4个数字和第5个数字之间的0.25位置处,即:25+(36-25)*0.25=27.75. 步骤3:计算50分位值。第二个四分位值(即50分位值)=第(1+3.25*2)个数的数字,即第7个数字和第8个数字之间的0.5位置处,即:67+(74-67)*0.5=70.5. 步骤4:计算75分位值。第三个四分位值(即75分位值)=第(1+3.25*3)个数的数字,即第10个数字和第11个数字之间的0.75位置处,即:90+(114-90)*0.75=108. 按以上方法,我们也可以得出10分位值和90分位值,实际上是十分位数的意思,将附表1数据划为10个部分,每部分大约包含1/10的数据项,划分后的临界点数字即为十分位数。附表1的10分位值和90分位值计算步骤如下: 百分位数又称百分位分数(percentile),是一种相对地位量数,它是次数分布中的一个点。把一个次数分布排序后,分为100个单位,百分位数就是次数分布中相对于某个特定百分点的原始分数,它表明在次数分布中特定个案百分比低于该分数。百分位数用P 加下标m(特定百分点)表示。譬如,若P 30等于60,则其表明在该次数分布中有30%的个案低于60分。 百分位数的应用 百分位数用于描述一组数据某一百分位置的水平,多个百分位数结合应用,可全面描述一组观察值的分布特征;百分位数还可用于确定非正态分布资料的医学参考值范围。但应用百分位数时,样本含量要足够大,否则不宜取太靠近两端的百分位数。 其中,P m ——第m 百分位数; L ——P m 所在组的组实下限; U ——P m 所在组的组实上限; f ——P m 所在组的次数; F b ——小于L 的累积次数; F a ——大于U 的累积次数。 【例1】某省某年公务员考试考生分数分布如下表所示,预定取考分居前15%的考生进行面试选拔,请划定面试分数线。 分数分组 次数 向上累积次数 向下累积次数 向上累积相对次数 95~99 7 1640 7 100% 90~94 16 1633 23 99.57% 85~89 53 1617 76 98.60% 80~84 78 1564 154 95.37% 75~79 90 1486 244 90.61% 70~74 119 l396 363 85.12% 65~69 159 1277 522 77.87% 60~64 156 1118 678 68.17% 55~59 140 962 818 58.66% 50~54 145 822 963 50.12% 45~49 140 677 1103 41.28% 40~44 135 537 1238 32.74% 35~39 130 402 1368 24.51% 30~34 126 272 1494 16.59% 25~29 78 146 1572 8.90% 20~24 25 68 1597 4.15% 15~19 20 43 1617 2.62% 10~14 16 23 1633 1.40% 5~9 7 7 1640 0.43% 解:由于预定取考分居前15%的考生进行面试,即有85%的考生分数低于划定的分数线,由此可知,分数线在70~74这一组中。 【例2】对于考试成绩的统计,如果您的成绩处在95的百分位数上,则意味着95%的参加考试者得到了和您一样的考分或还要低的考分,而不是您答对了95%的试题。也许您只答对了20%,即使如此,您取得的成绩也与95%的参加考试者一样好,或者比95%的参加考试者更好[2]。 【例3】假设想为退休存够钱。可创建一个包括所有不确定变量的模型,如投资年回报率、通货膨胀、退休时的开支等,得到概率分布的结果如下图所示,如果选择平均值,钱不够的概率就会有50%。所以选第90百分位数所对应的投资数,这样钱不够的概率将只有10%[2]。 百分位数计算公式-CAL-FENGHAI.-(YICAI)-Company One1 假设你的数据在A列在B1输入=PERCENTILE(E1:E10, 得到的是第10百分位数在B2输入=PERCENTILE(E1:E10, 得到的是第90百分位数 追问 我想用函数做,如何进行呢 回答 不知道你的具体含义。在excel里函数与我们平常说的公式是一个概 念。推测你是要使用宏 追问 我找到了计算百分位数的函数PERCENTILE(array,k),但是不知如何使 用。 回答 你找到的函数不就是我给出答案里的公式吗假设你的数据在A列 A1~A10 ,在B1输入=PERCENTILE(A1:A10, 得到的是第10百分位数在B2 输入=PERCENTILE(A1:A10, 得到的是第90百分位数 提问者评价 我明白了,谢谢。 什么是百分位数统计学术语,如果将一组数据从大到小排序,并计算相应的累计百分位,则某一百分位所对应数据的值就称为这一百分位的百分位数。可表示为:一组n个观测值按数值大小排列如,处于p%位置的值称第p百分位数。中位数是第50百分位数。第25百分位数又称第一个四分位数(First Quartile),用Q1表示;第50百分位数又称第二个四分位数(Second Quartile),用Q2表示;第75百分位数又称第三个四分位数(Third Quartile),用Q3表示。若求得第p百分位数为小数,可完整为整数。分位数是用于衡量数据的位置的量度,但它所衡量的,不一定是中心位置。百分位数提供了有关各数据项如何在最小值与最大值之间分布的信息。对于无大量重复的数据,第p百分位数将它分为两个部分。大约有p%的数据项的值比第p百分位数小;而大约有(100-p)%的数据项的值比第p百分位数大。对第p百分位数,严格的定义如下。第p百分位数是这样一个值,它使得至少有p%的数据项小于或等于这个值,且至少有(100-p)%的数据项大于或等于这个值。高等院校的入学考试成绩经常以百分位数的形式报告。比如,假设某个考生在入学考试中的语文部分的原始分数为54分。相对于参加同一考试的其他学生来说,他的成绩如何并不容易知道。但是如果原始分数54分恰好对应的是第70百分位数,我们就能知道大约70%的学生的考分比他低,而约30%的学生考分比他高。上百分位数估计意思是百分位数比较大的情况,一般上百分位数应该>50%。即50%多的数据比该值小,小于50%的数据比该值大。 2 9.2.2总体百分位数的估计 课标要求素养要求 结合实例,能用样本估计百分位数,理解百分位数的统计含义.在学习和应用百分位数的过程中,要把实际问题转化为数学问题,并进行计算, 对数据进行分析,发展学生的数学建模、 数学运算素养和数据分析素养. 教材知识探究 某省数学考试结果揭晓,根据规定,0.8%的同学需要补考. 问题那么如何确定需要补考的分数线呢? 提示利用百分位数计算. 1.第p百分位数的定义 第50百分位数就是中位数,中位数是百分位数的特例,百分位数是中位数的推广一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值. 2.计算一组n个数据的第p百分位数的步骤 第1步,按从小到大排列原始数据. 第2步,计算i=n×p%. 第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数. 3.四分位数 25%,50%,75%这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数,其中第25百分位数也称为第一四分位数或下四分位数,第75百分位数也称为第三四分位数或上四分位数. 教材拓展补遗 [微判断] 1.若一组样本数据各不相等,则其75%分位数大于25%分位数.(√) 2.若一组样本数据的10%分位数是23,则在这组数据中有10%的数据大于2 3.(×) 3.若一组样本数据的24%分位数是24,则在这组数据中至少有76%的数据大于或等于2 4.(√) 提示 2.若一组样本数据的10%分位数是23,则在这组数据中有10%的数据小于或等于23. [微训练] 1.下列一组数据的第25百分位数是() 2.1, 3.0,3.2,3.8,3.4, 4.0,4.2,4.4, 5.3,5.6 A.3.2 B.3.0 C.4.4 D.2.5 解析把该组数据按照由小到大排列,可得: 2.1, 3.0,3.2,3.4,3.8, 4.0,4.2,4.4, 5.3,5.6, 由i=10×25%=2.5,不是整数,则第3个数据3.2,是第25百分位数. 答案 A 2.下列关于一组数据的第50百分位数的说法正确的是() A.第50百分位数就是中位数 B.总体数据中的任意一个数小于它的可能性一定是50% C.它一定是这组数据中的一个数据 D.它适用于总体是离散型的数据 解析由百分位数的意义可知选项B,C,D错误. 答案 A百分位数的计算方法及示例
百分位数计算公式上课讲义
百分位数的计算公式
百分位数
第5课时 总体百分位数的估计
高一数学 9.2.2总体百分位数的估计练习题
百分位数计算公式
薪酬分位值计算方法
百分位数计算
百分位数计算公式
9.2.2 总体百分位数的估计