第九章抽样统计分析的基本知识
2023年人教版高中数学第九章统计考点题型与解题方法

(名师选题)2023年人教版高中数学第九章统计考点题型与解题方法单选题1、下列抽样方法是简单随机抽样的是()A.某医院从200名医生中,挑选出50名最优秀的医生去参加抗疫活动B.从10个手机中逐个不放回地随机抽取2个进行质量检验C.从空间直角坐标系中抽取10个点作为样本D.饮料公司从仓库中的500箱饮料中一次性抽取前10箱进行质量检查答案:B分析:根据简单随机抽样的特点逐项判断可得答案.对于A,某医院从200名医生中,挑选出50名最优秀的医生去参加抗疫活动,每个人被抽到的机会不相等,故错误;对于B,从10个手机中逐个不放回地随机抽取2个进行质量检验,是简单随机抽样,故正确;对于C,从空间直角坐标系中抽取10个点作为样本,由于被抽取的样本的总体个数是无限的,所以不是简单随机抽样,故错误;对于D,饮料公司从仓库中的500箱饮料中一次性抽取前10箱进行质量检查,不是逐个抽取,所以不是简单随机抽样,故错误.故选:B.2、为了更好地支持“中小型企业”的发展,某市决定对部分企业的税收进行适当的减免,某机构调查了当地的中小型企业年收入情况,并根据所得数据画出了样本的频率分布直方图,下面三个结论:①样本数据落在区间[300,500)的频率为0.45;②如果规定年收入在500万元以内的企业才能享受减免税政策,估计有55%的当地中小型企业能享受到减免税政策;③样本的中位数为480万元.其中正确结论的个数为A.0B.1C.2D.3答案:D解析:根据直方图求出a=0.0025,求出[300,500)的频率,可判断①;求出[200,500)的频率,可判断②;根据中位数是从左到右频率为0.5的分界点,先确定在哪个区间,再求出占该区间的比例,求出中位数,判断③.由(0.001+0.0015+0,002+0.0005+2a)×100=1,a=0.0025,[300,500)的频率为(0.002+0.0025)×100=0.45,①正确;[200,500)的频率为(0.0015+0.002+0.0025)×100=0.55,②正确;[200,400)的频率为0.3,[200,500)的频率为0.55,中位数在[400,500)且占该组的4,5×100=480,③正确.故中位数为400+0.5−0.30.25故选:D.小提示:本题考查补全直方图,由直方图求频率和平均数,属于基础题3、某射击运动员6次的训练成绩分别为:88,91,89,88,86,85,则这6次成绩的第70百分位数为()A.89B.89.5C.90D.90.5答案:A分析:先将数据按从小到大的顺序排列,计算6×70%=4.2不是整数,则所求的是从小到大排列的第5位数6次考试数学成绩从小到大为:85,86,88,88,89,91,6×70%=4.2,∴这名学生6次训练成绩的第70百分位数为89 .故选:A4、数据x1,x2,x3,…,x m的平均数为x,数据y1,y2,y3,…,y n的平均数为y,则数据x1,x2,x3,…,x m,y1,y2,y3,…,y n的平均数为()A.xn +ymB.xm+ynC.nx+mym+n D.mx+nym+n答案:D分析:利用平均数的计算公式计算.由题意得:x1+x2+x3+⋯+x m=mx,y1+y2+y3+⋯+y n=ny,所以x1+x2+x3+⋯+x m+y1+y2+y3+⋯+y nm+n =mx+nym+n故选:D5、人口普查是世界各国所广泛采用的搜集人口资料的一种科学方法,是提供全国基本人口数据的主要来源.根据人口普查的基本情况,可以科学的研究制定社会、经济、科教等各项发展政策,是国家科学决策的重要基础工作,人口普查资料是制定人口政策的依据和前提.截止2020年10月10日,我国共进行了六次人口普查,下图是这六次人口普查的人数和增幅情况,下列说法正确的是()A.人口数逐次增加,第二次增幅最大B.第六次普查人数最多,第四次增幅最小C.第六次普查人数最多,第三次增幅最大D.人口数逐次增加,从第二次开始增幅减小答案:C分析:人口数由柱状图判断,增幅由折线图判断.A.人口数逐次增加,第三次增幅最大,故错误;B.第六次普查人数最多,第六次增幅最小,故错误;C.第六次普查人数最多,第三次增幅最大,故正确;D.人口数逐次增加,从第三次开始增幅减小,故错误;故选:C6、新冠肺炎疫情的发生,我国的三大产业均受到不同程度的影响,其中第三产业中的各个行业都面临着很大的营收压力.2020年7月国家统计局发布了我国上半年国内经济数据,如图所示:图1为国内三大产业比重,图2为第三产业中各行业比重.以下关于我国上半年经济数据的说法正确的是()A.第一产业的生产总值与第三产业中“租赁和商务服务业”的生产总值基本持平B.第一产业的生产总值超过第三产业中“房地产业”的生产总值C.若“住宿餐饮业”生产总值为7500亿元,则“金融业”生产总值为32500亿元D.若“金融业”生产总值为41040亿元,则第二产业生产总值为166500亿元答案:D分析:利用扇形统计图和第三产业中各行业比重统计图的数据即可求解.对于A,57%×6%=3.42%<6%,错误;对于B,57%×13%=7.41%>6%,错误;对于C,75003%×16%=4000(亿),错误;对于D,根据题意,第二产业生产总值为4104016%×57%×37%=166500亿元,正确.故选:D.7、已知一个样本容量为7的样本的平均数为5,方差为2,现样本加入新数据4,5,6,此时样本容量为10,若此时平均数为x,方差为s2,则()A.x=5,s2=2B.x=5,s2=1.6C.x=4.9,s2=1.6D.x=5.1,s2=2答案:B分析:设这10个数据分别为:x1,x2,⋯,x7,x8=4,x9=5,x10=6,进而根据题意求出x1+x2+⋯+x7和(x1−5)2+(x2−5)2+⋯+(x7−5)2,进而再根据平均数和方差的定义求得答案.设这10个数据分别为:x1,x2,⋯,x7,x8=4,x9=5,x10=6,根据题意x1+x2+⋯+x77=5⇒x1+x2+⋯+x7=35,(x1−5)2+(x2−5)2+⋯+(x7−5)27=2⇒(x1−5)2+(x2−5)2+⋯+(x7−5)2=14,所以x=x1+x2+⋯+x1010=35+4+5+610=5,s2=(x1−5)2+(x2−5)2+⋯+(x10−5)210=14+(4−5)2+(5−5)2+⋯+(6−5)210=1.6.故选:B.8、中国营养学会把走路称为“最简单、最优良的锻炼方式”,它不仅可以帮助减肥,还可以增强心肺功能、血管弹性、肌肉力量等.下图为甲、乙两人在同一星期内日步数的折线统计图:则下列结论中不正确的是()A.这一星期内甲的日步数的中位数为11600B.乙的日步数星期四比星期三增加了1倍以上C.这一星期内甲的日步数的平均值大于乙D.这一星期内甲的日步数的方差大于乙答案:B分析:对于A:直接求出中位数;对于B:求出乙的星期三和星期四步数,计算可得;对于C:分别计算出甲、乙平均数,即可判断;对于D:分别计算出甲、乙方差,即可判断;对于A:甲的步数:16000,7965,12700,2435,16800,9500,11600.从小到大排列为:2435,7965,9500,11600,12700,16000,16800.中位数是11600.故A正确;对于B:乙的星期三步数7030,星期四步数12970.因为129707030≈1.84<2,所以没有增加1倍上.故B不正确;对于C:x甲=17(16000+7965+12700+2435+16800+9500+11600)=11000,x乙=17(14200+12300+7030+12970+5340+11600+10060)=10500.所以x甲>x乙.故C正确;对于D:s甲2=17[(16000−11000)2+(7965−11000)2+(12700−11000)2+(2435−11000)2+(16800−11000)2+(9500−11000)2+(11600−11000)2]≈20958636s乙2=17[(14200−10500)2+(12300−10500)2+(7030−10500)2+(12970−10500)2+(5340−10500)2+(11600−10500)2+(10060−10500)2]≈9014429所以s甲2>s乙2.故D正确;故选:B.9、某老师为了解某班50名同学在家学习的情况,决定将本班学生依次编号为01,02,⋅⋅⋅,50.利用下面的随机数表选取10名学生调查,选取方法是从下面随机数表的第1行第2列开始由左到右依次读取两个数字,则选出来的第4名学生的编号为()7 2 5 6 0 8 1 3 0 2 5 8 3 2 4 9 8 7 0 2 4 8 1 2 9 7 2 8 0 19 8 3 1 0 4 9 2 3 1 4 9 3 5 8 2 0 9 3 6 2 4 4 8 6 9 6 9 3 87 4 8 1A.25B.24C.29D.19答案:C分析:利用随机表法从第1行第2列开始由左到右依次读取两个数字,超过50的跳过,重复的只取一个即可求解.从题中随机数表的第1行第2列开始由左到右依次读取两个数字,超过50的跳过,重复的只取一个可得:25 ,30 ,24,2 9,19,10 ,49 ,23,14,20,故选出来的第4名学生的编号为29.故选:C.10、下列调查方式较为合适的是()A.为了了解灯管的使用寿命,采用普查的方式B.为了了解我市中学生的视力状况,采用抽样调查的方式C.调查一万张面值为100元的人民币中有无假币,采用抽样调查的方式D.调查当今中学生喜欢什么体育活动,采用普查的方式答案:B分析:根据实际情况选择合适的调查方式即可判断.对A,为了了解灯管的使用寿命,应采用抽样调查的方式,故A错误;对B,为了了解我市中学生的视力状况,采用抽样调查的方式,故B正确;对C,调查一万张面值为100元的人民币中有无假币,采用抽样普查的方式,故C错误;对D,调查当今中学生喜欢什么体育活动,采用抽样普查的方式,故D错误.故选:B.11、某高中为了解学生课外知识的积累情况,随机抽取200名同学参加课外知识测试,测试共5道题,每答对一题得20分,答错得0分.已知每名同学至少能答对2道题,得分不少于60分记为及格,不少于80分记为优秀,测试成绩百分比分布图如图所示,则下列说法正确的是()A.该次课外知识测试及格率为90%B.该次课外知识测试得满分的同学有30名C.该次测试成绩的中位数大于测试成绩的平均数D.若该校共有3000名学生,则课外知识测试成绩能得优秀的同学大约有1440名答案:C分析:由百分比图知,成绩为100分、80分、60分、40分的百分比分别为12%, 48%, 32%, 8%,结合各项的描述即可判断其正误.由图知,及格率为1−8%=92%,故A错误.该测试满分同学的百分比为1−8%−32%−48%=12%,即有12%×200=24名,B错误.由图知,中位数为80分,平均数为40×8%+60×32%+80×48%+100×12%=72.8分,故C正确.由题意,3000名学生成绩能得优秀的同学有3000×(48%+12%)=1800,故D错误.故选:C12、为了了解全校240名高一学生的身高情况,从中随机抽取40名高一学生进行测量,在这个问题中,样本指的是()A.240名高一学生的身高B.抽取的40名高一学生的身高C.40名高一学生D.每名高一学生的身高答案:B分析:找出考查的对象是某校高一学生的身高,得到样本是抽取的40名高一学生的身高.总体是240名高一学生的身高情况,则个体是每个学生的身高情况,故样本是40名学生的身高情况.故选:B.小提示:本题考查的抽样相关概念的理解,注意区分总体、个体、样本、样本容量这四个概念,属于基础题. 双空题13、一组数据:7,6,3,2,8,3,5,6,9,7的中位数是___________;85%分位数是___________.答案:68分析:首先将数据从小到大排列,即可求出中位数与85%分位数;解:将数据从小到大排列为:2、3、3、5、6、6、7、7、8、9,故中位数为6,又10×85%=8.5,故这一组数据的85%为第9个数为8;所以答案是:6;8;14、设样本数据x1、x2、…、x10的均值和方差分别为1和4,若y i=x i+a(a为非零常数,i=1,2,⋯,10),则y1、y2、⋯、y10的均值和方差分别为________,_________.答案:1+a4解析:由题意得出110∑x i10i=1=1,110∑(x i−1)210i=1=4,然后利用平均数和方差的计算公式可计算出数据y1、y2、⋯、y10的均值和方差.由题意可得110∑x i10i=1=1,110∑(x i−1)210i=1=4,则y1、y2、⋯、y10的均值为y=110∑y i10i=1=110∑(x i+a)10i=1=110(∑x i10i=1+10a)=110∑x i10i=1+a=1+a,方差为s2=110∑(y i−y)210i=1=110∑[(x i+a)−(1+a)]210i=1=110∑(x i−1)210i=1=4.所以答案是:1+a;4.小提示:本题考查平均数和方差的计算,灵活利用平均数和方差公式计算是解答的关键,考查计算能力,属于基础题.15、某校高一年级三个班共有学生120名,这三个班的男女生人数如下表所示,已知在全年级中随机抽取1名学生,抽到二班女生的概率是0.2,则x=_________.现用分层抽样的方法在全年级抽取30名学生,则应在三班抽取的学生人数为________.答案: 24 9分析:由于每个个体被抽到的概率都相等,由x120=0.2,可得得x的值.先求出三班总人数为 36,用分层抽样的方法在全年级抽取30名学生,求出每个学生被抽到的概率为30120,用三班总人数乘以此概率,即得所求.由题意可得x120=0.2,解得x=24.三班总人数为120−20−20−24−20=36,用分层抽样的方法在全年级抽取30名学生,每个学生被抽到的概率为30120=14,故应从三班抽取的人数为36×14=9,所以答案是: 24; 9.小提示:本题主要考查分层抽样的定义和方法,用每层的个体数乘以每个个体被抽到的概率等于该层应抽取的个体数,属于基础题.16、下表记录了某地区一年之内的月降水量.根据上述统计表,该地区月降水量的中位数是______;80%分位数是_________.答案: 56 64分析:根据中位数和百分位数求解数据按从小到大排序得:46,48,51,53,53,56,56,56,58,64,66,71,它的中位数为56;80%×12=9.6,第10个数是64所以答案是:56,6417、要完成下列两项调查:①从某社区125户高收入家庭、280户中等收入家庭、95户低收入家庭中选出100户调查社会购买力的某项指标;②从某中学的15名艺术特长生中选出3人调查学习负担情况.宜采用的抽样方法依次为________、________.答案:分层抽样简单随机抽样解析:根据分层抽样和简单随机抽样的定义直接判断即可.解析:①各层间差距较大,宜用分层抽样;②总体较少,宜用简单随机抽样.所以答案是:分层抽样,简单随机抽样.小提示:本题考查抽样方法,旨在考查学生对概念的掌握程度,考查阅读能力.解答题18、某市为了了解人们对“中国梦”的伟大构想的认知程度,针对本市不同年龄和不同职业的人举办了一次“一带一路”知识竞赛,满分100分(95分及以上为认知程度高),结果认知程度高的有m(m>20)人,按年龄分成5组,其中第一组:[20,25),第二组:[25,30),第三组:[30,35),第四组:[35,40),第五组:[40,45],得到如图所示的频率分布直方图.(1)根据频率分布直方图,估计这m人的平均年龄和第80百分位数;(2)现从以上各组中采用分层随机抽样的方法抽取20人,担任本市的宣传使者.若第四组宣传使者的年龄的平,第五组宣传使者的年龄的平均数与方差分别为43和1,求这m人中35~45岁所有人均数与方差分别为37和52的年龄的方差.答案:(1)平均年龄32.25岁,第80百分位数为37.5;(2)10.分析:(1)直接根据频率分布直方图计算平均数和百分位数;(2)由分层抽样得第四组和第五组分别抽取4人和2人,进而设第四组、第五组的宣传使者的年龄的平均数分别为x4,x5,方差分别为s42,s52,第四组和第五组所有宣传使者的年龄平均数为z,方差为s2,进而根据方差{4×[s42+(x4−z)2]+2×[s52+(x5−z)2]},代入计算即可得答案.公式有s2=16解:(1)设这m人的平均年龄为x,则x=22.5×0.05+27.5×0.35+32.5×0.3+37.5×0.2+42.5×0.1=32.25.设第80百分位数为a,由5×0.02+(40−a)×0.04=0.2,解得a=37.5.(2)由频率分布直方图得各组人数之比为1:7:6:4:2,故各组中采用分层随机抽样的方法抽取20人,第四组和第五组分别抽取4人和2人,设第四组、第五组的宣传使者的年龄的平均数分别为x4,x5,方差分别为s42,s52,,s52=1,则x4=37,x5=43,s42=52设第四组和第五组所有宣传使者的年龄平均数为z,方差为s2.=39,则z=4x4+2x56{4×[s42+(x4−z)2]+2×[s52+(x5−z)2]}=10,s2=16因此,第四组和第五组所有宣传使者的年龄方差为10,据此,可估计这m人中年龄在35~45岁的所有人的年龄方差约为10.19、为了推进分级诊疗,实现“基层首诊、双向转诊、急慢分治、上下联动”的诊疗模式,某城市自2020年起全面推行家庭医生签约服务.已知该城市居民约为1000万,从0岁到100岁的居民年龄结构的频率分布直方图如图1所示.为了解各年龄段居民签约家庭医生的情况,现调查了1000名年满18周岁的居民,各年龄段被访者签约率如图2所示.(1)估计该城市年龄在50岁以上且已签约家庭医生的居民人数;(2)据统计,该城市被访者的签约率约为44%.为把该城市年满18周岁居民的签约率提高到55%以上,应着重提高图2中哪个年龄段的签约率?并根据已有数据陈述理由.答案:(1)195.99万;(2)应着重提高30-50这个年龄段的签约率,理由见解析.解析:(1)根据题中频率分布直方图与各年龄段被访者的签约率,分别计算50岁以上各年龄段的居民人数,再求和,即可得出结果;(2)根据题中条件,先确定年龄在18-30岁的人数,年龄在30-50岁的人数,以及年龄在50岁以上的人数,即可确定结果.(1)该城市年龄在50-60岁的签约人数为:1000×0.015×10×55.7%=83.55万;在60-70岁的签约人数为:1000×0.010×10×61.7%=61.7万;在70-80岁的签约人数为:1000×0.004×10×70.0%=28万;在80岁以上的签约人数为:1000×0.003×10×75.8%=22.74万;故该城市年龄在50岁以上且已签约家庭医生的居民人数为:83.55+61.7+28+22 .74=195.99万;(2)年龄在10-20岁的人数为:1000×0.005×10=50万;年龄在20-30岁的人数为:1000×0.018×10=180万.所以,年龄在18-30岁的人数大于180万,小于230万,签约率为30.3%;年龄在30-50岁的人数为1000×0.037×10=370万,签约率为37.1%.年龄在50岁以上的人数为:1000×0.032×10=320万,签约率超过55%,上升空间不大.故由以上数据可知这个城市在30-50岁这个年龄段的人数为370万,基数较其他年龄段是最大的,且签约率非常低,所以为把该地区满18周岁居民的签约率提高到以上,应着重提高30-50这个年龄段的签约率.20、某服装公司计划今年夏天在其下属实体店销售一男款衬衫,上市之前拟在该公司的线上旗舰店进行连续20天的试销,定价为260元/件.试销结束后统计得到该线上专营店这20天的日销售量(单位:件)的数据如图.(1)若该线上专营店试销期间每件衬衫的进价为200元,求试销期间该衬衫日销售总利润高于9500元的频率.(2)试销结束后,这款衬衫正式在实体店销售,每件衬衫定价为360元,但公司对实体店经销商不零售,只提供衬衫的整箱批发,大箱每箱有70件,批发价为160元/件;小箱每箱有60件,批发价为165元/件.某实体店决定每天批发大小相同的2箱衬衫,根据公司规定,当天没销售出的衬衫按批发价的8折转给另一家实体店.根据往年的销售经验,该实体店的销售量为线上专营店销售量的80%,以线上专营店这20天的试销量估计该实体店连续20天的销售量.以该实体店连续20天销售该款衬衫的总利润作为决策,试问该实体店每天应该批发2大箱衬衫还是2小箱衬衫?答案:(1)0.55;(2)该实体店应该每天批发2大箱衬衫.分析:(1)先利用不等式性质求得要使得日销售总利润高于9500元时日销售衬衫的件数的取值范围,然后根据频数分布图计算对应的天数,从而求得响应频率;.(2)由题可知,该实体店20天的日销售量情况为3天日销售量为48件,6天日销售量为80件,7天日销售量为128件,4天日销售量为160件.分别就选择批发2小箱时和2大箱时各种情况下的日利润列举计算,并求得相应的总利润,进行比较大小即可做出判断.解:(1)因为试销期间每件衬衫的利润为260−200=60元,≈158.3,所以要使得日销售总利润高于9500元,则日销售衬衫的件数大于950060=0.55.故所求频率为7+420(2)由题可知,该实体店20天的日销售量情况为3天日销售量为48件,6天日销售量为80件,7天日销售量为128件,4天日销售量为160件.若选择批发2小箱,则批发成本为60×2×165=19800元,当日销售量为48件时,当日利润为48×360+0.8×(120−48)×165−19800=6984元;当日销售量为80件时,当日利润为48×360+0.8×(120−80)×165−19800=14280;当日销量为128件或160件时,当日利润为120×360−19800=23400元.所以这20天销售这款衬衫的总利润为6984×3+14280×6+23400×11=364032元.若选择批发2大箱,则批发成本为70×2×160=22400元,当日销售量为48件时,当日利润为48×360+0.8×(140−48)×160−22400=6656元;当日销售量为80件时,当日利润为80×360+0.8×(140−80)×160−22400=14080元;当日销量为128件时,当日利润为128×360+0.8×(140−128)×160−22400=25216元.当日销售量为160件时,当日利润为140×360−22400=28000元.所以这20天销售这款衬衫的总利润为6656×3+14080×6+25216×7+28000×4=392960元. 因为392960>364032,所以该实体店应该每天批发2大箱衬衫.。
高考数学总复习(一轮)(人教A)教学课件第九章 统计、成对数据的统计分析第1节 随机抽样、统计图表

解析:(2)最先读到的4袋牛奶的编号是614,593,379,242,向右读得
到203,722,104,再下一个数是887,887大于850,故舍去,再下一个
数是088.
考点二
分层随机抽样
角度一
条形图和
直观描述不同类别或分组数据的
直方图
折线图
频数和频率
描述数据随时间的变化趋势
4.频率分布直方图的制作步骤
(1)求极差:极差为一组数据中 最大值
与最小值的差.
(2)决定组距与组数:当样本量不超过100时,常分成 5~12
组,
一般取等长组距,并且组距应力求“取整”.
(3)将数据分组.
(4)列频率分布表:一般分四列,即分组、 频数累计、频数、 频率 .
A.0.61
B.0.675
)
C.0.74
D.0.8
√
解析:(2)由分层抽样可得高三(1)班抽取的人数 n1=
×10=6,
+
高三(2)班抽取的人数 n2=
于是总的样本平均数 =
×10=4,
+
×+×.
=1.2,
所以总的样本方差
2
2
2
s = ×[1+(1-1.2) ]+ ×[0.35+(1.5-1.2) ]=0.8.故选 D.
容量为20的一个样本,则每个个体被抽到的概率为(
A.
B.
C取到的概率是
.故选D.
=
材料员-专业基础知识-抽样统计分析基本知识

材料员-专业基础知识-抽样统计分析基本知识[单选题]1.如果一个总体是由质量明显差异的几个部分组成,则宜采用()。
A.整群抽样B.分层随机抽样C.系统抽样D.简单随机抽样(江南博哥)正确答案:B参考解析:分层抽样试讲质量明显差异的几个部分分成若干层,使层内质量均匀,而层间差异较为明显。
[单选题]2.抽样一般程序的第一步为()。
A.制定抽样框B.制定抽样方案C.界定抽样总体D.预估样本质量正确答案:C参考解析:抽样一般程序的第一步为界定抽样总体。
[单选题]3.对于左缓坡型直方图,其可能的原因是()A.分组组数不当B.原材料发生变化,或者临时他人顶班作业C.操作中对上限控制太严D.数据收集不正常正确答案:C参考解析:左缓坡型主要是由于操作中对上限控制太严造成的。
[单选题]4.在统计工作中,可以根据产品的质量管理规程或实际()选定总体的范围。
A.工作需要B.功能需要C.特性需要D.其他需求正确答案:A参考解析:在统计工作中,可以根据产品的质量管理规程或实际工作需要选定总体的范围。
[单选题]5.分层抽样的特点是()。
A.层内差异小,层间差异大B.层间差异小,层内差异大C.层问差异小D.层间差异大正确答案:A参考解析:因为只有层间差异大,才能保证抽样的有效性,而层内差异小是要保证层内每个个体的差别不大,能够使其抽样精确度提高。
[单选题]6.简单随机抽样又称纯随机抽样,()随机抽样。
A.局部B.不完全C.完全D.其他正确答案:C参考解析:简单随机抽样也称为单纯随机抽样,是指从总体N个单位中任意抽取n个单位作为样本,使每个可能的样本被抽中的概率相等的一种抽样方式。
[单选题]7.在数理统计分析法中,用来显示在质量控制中两种质量数据之间关系的方法是:()。
A.统计调查表法B.直方图法C.控制图法D.相关图法正确答案:D参考解析:统计调查表法是利用专门设计的统计表对数据进行收集、整理和粗略分析质量状态的一种方法。
直方图法是用以描述质量分布状态的一种分析方法。
第九章抽样统计分析的基本知识演示文稿ppt

随机抽样 样本 检测 整理
二、质量数据的收集方法★
(一)全数检验 (二)随机抽样检验
(一)全数检验
全数检验是对总体中的全部个体逐一 观察、测量、计数、登记,从而获得对总 体质量水平评价结论的方法。
(二)随机抽样检验★
抽样检验是按照随机抽样的原则,从 总体中抽取部分个体组成样本,根据对样 品进行检测的结果,推断总体质量水平的 方法。
(三) 质量数据分布的规律性
以质量标准为中心的质量数据分布, 可用一个“中间高、两端低、左右对称” 的几何图形表示,即一般服从正态分布
整群抽样一般是将总体按自然存在的 状态分为若干群,并从中抽取样品群,组 成样本,然后在中选群内进行全数检验的 方法。
如对原材料质量进行检测,可按原包 装的箱、盒为群随机抽取,对中选箱、盒 做全数检验;每隔一定时间抽出一批产品 进行全数检验等。
5. 多阶段抽样
多阶段抽样又称多级抽样,是将各种 单阶段抽样方法结合使用,通过多次随机 抽样来实现的抽样方法。
标准差小说明数据分布的集中程度高, 离散程度小,均值对总体的代表性好。
标准差的平方是方差,能确切地说明数 据的离散程度和波动规律,是最常用的反映 数据变异程度的特征值。
(3) 变异系数(离散系数)
1) 总体的变异系数
Cv
2) 样本的变异系数 Rxmaxxmin
变异系数又称离散系数,是用标准差除以算术 平均数得到的相对数。它表示数据的相对离散波动 程度。变异系数小,说明分布集中程度高,离散程 度小,均值对总体(样本)的代表性好。
1. 简单随机抽样 2. 分层抽样 3. 等距抽样 4. 整群抽样 5. 多阶段抽样
1. 简单随机抽样
简单随机抽样又称纯随机抽样、完全随机 抽样,是对总体不进行任何加工,直接进行随 机抽样,获取样本的方法。
人教版高中数学必修二《第九章 统计》单元导学案及答案

人教版高中数学必修二《第九章统计》单元导学案《9.1.1简单的随机抽样》导学案【学习目标】1.体会随机抽样的必要性和重要性2.理解随机抽样的目的和基本要求;3.掌握简单随机抽样中的抽签法、随机数法的一般步骤【自主学习】知识点1 统计的基本概念1.总体:一般把所考察对象的某一数值指标的全体构成的集合看成总体.2.个体:构成总体的每一个元素作为个体.3.样本:从总体中抽出若干个个体所组成的集合叫样本.4.样本容量:样本中个体的数目叫样本容量.知识点2 简单随机抽样1.一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.2.简单随机抽样的四个特点(1)它要求被抽取样本的总体的个数有限,这样便于通过随机抽取的样本对总体进行分析.(2)它是从总体中逐个抽取,这样便于在抽样实践中进行操作.(3)它是一种不放回抽样,由于抽样实践中多采用不放回抽样,使其具有较广泛的实用性,而且由于所抽取的样本中没有被重复抽取的个体,便于进行有关的分析和计算.(4)它是一种等机会抽样,不仅每次从总体中抽取一个个体时,各个个体被抽到的机会相等,而且在整个抽样的过程中,各个个体被抽取的机会也相等,从而保证了这种抽样方法的公平性.知识点3 抽签法和随机数法1.抽签法:把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本.2.随机数法:随机抽样中,另一个经常被采用的方法是随机数法,即利用随机数表、随机数骰子或计算机产生的随机数进行抽样.3.利用随机数法抽取个体时的注意事项(1)定起点:事先应确定以表中的哪个数(哪行哪列)作为起点. (2)定方向:读数的方向(向左、向右、向上或向下都可以).(3)读数规则:读数时结合编号的特点进行读取,编号为两位数则两位两位地读取,编号为三位数则三位三位地读取,如果出现重复则跳过,直到取满所需的样本个体数.知识点4 总体平均数和加权平均数1.一般地,总体中有N 个个体,它们的变量值分别为Y 1,Y 2,…,Y N ,则称∑==++=Ni iN YN N Y Y Y Y 1211 为总体均值,又称总体平均数.2.一般地,对于f 1个x 1,f 2个x 2,…,f n 个x n ,共f 1+f 2+…+f n 个数组成的一组数据的平均数为x 1f 1+x 2f 2+…+x n f nf 1+f 2+…+f n.这个平均数叫做加权平均数,其中f 1, f 2,…, f n 叫做权,这个“权”,含有权衡所占份量的轻重之意,即f i (i =1,2,…,k )越大,表明x i 的个数越多,“权”就越大.【合作探究】探究一 简单随机抽样的判断【例1】下面的抽样是简单随机抽样吗?为什么?(1)小乐从玩具箱中的10件玩具中随意拿出一件玩,玩后放回,再拿出一件,连续拿出四件;(2)某学校从300名学生中一次性抽取20名学生调查睡眠情况.解 (1)不是简单随机抽样,因为玩具被放回了,不符合“不放回抽样”这一特点. (2)不是简单随机抽样,因为一次性抽取不符合“逐个抽取”这一特点.反思与感悟 当抽样具有:(1)总体中个体数是有限的,(2)逐个抽取,(3)不放回抽取,(4)每个个体被抽到的机会等可能时,为简单随机抽样,否则不是简单随机抽样.【练习1】下面的抽样方法是简单随机抽样的是( )A .盒子中有80个零件,从中选出5个零件进行质量检验,在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里B .某车间包装一种产品,在自动包装传送带上,每隔5分钟抽一包产品,称其重量是否合格C .某校分别从行政人员、教师、后勤人员中抽取2人,14人,4人了解对他们学校机构改革的意见D .从8台电脑中不放回地随机抽取2台进行质量检验(假设8台电脑已编好号,对编号随机抽取)答案 D解析 依据简单随机抽样的特点知,只有D 符合.探究二 简单随机抽样等可能性应用【例2】一个布袋中有10个同样质地的小球,从中不放回地依次抽取3个小球,则某一特定小球被抽到的可能性是________,第三次抽取时,剩余每个小球被抽到的可能性是________.答案310 18解析 因为简单随机抽样过程中每个个体被抽到的可能性均为n N ,所以第一个空填310.因为本题中的抽样是不放回抽样,所以第一次抽取时,每个小球被抽到的可能性为110,第二次抽取时,剩余9个小球,每个小球被抽到的可能性为19,第三次抽取时,剩余8个小球,每个小球被抽到的可能性为18.反思与感悟 简单随机抽样,每次抽取时,总体中各个个体被抽到的概率相同,在整个抽样过程中各个个体被抽到的机会也都相等.【练习2】从总体容量为N 的一批零件中,抽取一个容量为30的样本,若每个零件被抽到的可能性为0.25,则N 的值为( )A .120B .200C .150D .100答案 A解析 因为从含有N 个个体的总体中抽取一个容量为30的样本时,在每次抽取一个个体的过程中任意一个个体被抽到的可能性为1N,在整个抽样过程中每个个体被抽到的可能性为30N ,所以30N=0.25,从而有N =120.故选A.探究三 抽签法的应用【例3】某卫生单位为了支援抗震救灾,要在18名志愿者中选取6人组成医疗小组去参加救治工作,请用抽签法设计抽样方案.解 方案如下:第一步,将18名志愿者编号,号码为01,02,03,…,18. 第二步,将号码分别写在相同的纸条上,揉成团,制成号签. 第三步,将得到的号签放到一个不透明的盒子中,充分搅匀. 第四步,从盒子中依次取出6个号签,并记录上面的编号. 第五步,与所得号码对应的志愿者就是医疗小组成员.反思与感悟 一个抽样试验能否用抽签法,关键看两点:一是制签是否方便;二是个体之间差异不明显.一般地,当样本容量和总体容量较小时,可用抽签法.【练习3】从20架钢琴中抽取5架进行质量检查,请用抽签法确定这5架钢琴. 解 第一步,将20架钢琴编号,号码是01,02,…,20. 第二步,将号码分别写在相同的纸条上,揉成团,制成号签. 第三步,将得到的号签放入一个不透明的袋子中,并充分搅匀. 第四步,从袋子中逐个不放回地抽取5个号签,并记录上面的编号. 第五步,与所得号码对应的5架钢琴就是要进行质量检查的对象.探究四 随机数法的应用【例4】假设我们要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时,应如何操作?解 第一步,将800袋牛奶编号为000,001, (799)第二步,在随机数表中任选一个数作为起始数(例如选出第8行第7列的数7). 第三步,从选定的数7开始依次向右读(读数的方向也可以是向左、向上、向下等),将编号范围内的数取出,编号范围外的数去掉,直到取满60个号码为止,就得到一个容量为60的样本.【练习4】总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右一次选取两个数字,则选出来的第5个个体的编号为( )A .答案D解析:从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字中小于20的编号依次为08,02,14,07,02,01.其中第二个和第四个都是02,重复.可知对应的数值为08,02,14,07,01,则第5个个体的编号为01.探究五 总体平均数和加权平均数【例5】小林在八年级第一学期的数学书面测验成绩分别为:平时考试第一单元得84分,第二单元得76分,第三单元得92分;期中考试得82分;期末考试得90分,如果按照平时、期中、期末的权重分别为10%、30%、60%计算,那么小林该学期数学书面测验的总平均成绩应为多少分?解:x (平时单元测试平均成绩)=84+76+923=84(分).所以总平均成绩为84×10%+82×30%+90×60%10%+30%+60%=87(分).所以小林该学期数学书面测验的总平均成绩应为87分【练习5】2. “一世”又叫“一代”.东汉·王充《论衡·宜汉篇》:“且孔子所谓一世,三十年也”,清代·段玉裁《说文解字注》:“三十年为一世,按父子相继曰世”.而当代中国学者测算“一代”平均为25年.另根据国际一家研究机构的研究报告显示,全球家族企业的平均寿命其实只有26年,约占总量的28%的家族企业只能传到第二代,约占总量的14%的家族企业只能传到第三代,约占总量4%的家族企业可以传到第四代甚至更久远(为了研究方便,超过四代的可忽略不计).根据该研究机构的研究报告,可以估计该机构所认为的“一代”大约为()A. 23年B. 22年C. 21年D. 20年答案:B【分析】设“一代”为x年,根据约占总量的28%的家族企业只能传到第二代,约占总量的14%的家族企业只能传到第三代,约占总量4%的家族企业可以传到第四代,列出频率分布表,然后根据平均寿命其实只有26年,利用平均数的求法求解.【详解】设“一代”为x年,由题意得:企业寿命的频率分布表为:又因为全球家族企业的平均寿命其实只有26年,所以家族企业的平均寿命为:0.540.50.28 1.50.14 2.50.04 3.526⨯+⨯+⨯+⨯=,x x x xx≈,解得22故选:B《9.1.2分层随机抽样 9.1.3获取数据的途径》导学案【学习目标】1.理解并掌握分层随机抽样,会用分层随机抽样从总体中抽取样本2.记住分层随机抽样的特点和步骤3.利用分层随机抽样的方法解决实际问题4.了解获取数据的途径,并学会简单应用【自主学习】知识点1 分层随机抽样的概念 (1)定义一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.(2)适用范围当总体是由差异明显的几个部分组成时,往往采用分层随机抽样. (3)比例分配在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.知识点2 分层随机抽样的步骤(1)根据已掌握的信息,将总体分成若干部分.(2)根据总体中的个体数N 和样本量n 计算出抽样比k =nN.(3)根据抽样比k 计算出各层中应抽取的个体数:n N·N i (其中N i 为第i 层所包含的个体总数).(4)按步骤3所确定的数在各层中随机抽取个体,并合在一起得到容量为n 的样本.【合作探究】探究一 分层随机抽样的概念【例1-1】(1) 下列问题中,最适合用分层随机抽样抽取样本的是( ) A .从10名同学中抽取3人参加座谈会B .一次数学竞赛中,某班有10人在110分以上,40人在90~100分,12人低于90分,现从中抽取12人了解有关情况C .从1 000名工人中,抽取100名调查上班途中所用时间D .从生产流水线上,抽取样本检查产品质量(2)分层随机抽样又称类型抽样,即将相似的个体归入一类(层),然后每类抽取若干个个体构成样本,所以分层随机抽样为保证每个个体等可能抽样,必须进行( )A .每层等可能抽样B.每层可以不等可能抽样C.所有层按同一抽样比等可能抽样D.所有层抽取的个体数量相同【答案】(1)B (2)C[分析] 当总体由差异明显的几部分组成时,该样本的抽取适合用分层随机抽样,结合题中的四个选项及分层随机抽样的特点可对(1)(2)作出判断.[解析] (1)A中总体个体无明显差异且个数较少,不适合用分层随机抽样;C和D中总体个体无明显差异且个数较多,不适合用分层随机抽样;B中总体个体差异明显,适合用分层随机抽样.(2)保证每个个体等可能地被抽取是简单随机抽样和分层随机抽样的共同特征,为了保证这一点,分层随机抽样时必须在所有层都按同一抽样比等可能抽取.归纳总结:1.使用分层随机抽样的前提:,分层随机抽样的适用前提条件是总体可以分层、层与层之间有明显区别,而层内个体间差异较小.2.使用分层随机抽样应遵循的原则:(1)将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则;(2)分层随机抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比等于抽样比.【练习1】某学校有男、女学生各500名,为了解男、女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取100名学生进行调查,则宜采用的抽样方法是( )A.抽签法B.随机数法C.分层随机抽样法D.任何抽样法都可以【答案】 C解析:由于被抽取的个体属性有明显的差异,因此宜采用分层随机抽样法.探究二分层随机抽样的设计【例2】某政府机关有在编人员100人,其中副处级以上干部10人,一般干部70人,工人20人,上级机关为了了解政府机构改革的意见,要从中抽取一个容量为20的样本,试确定用何种方法抽取,请具体实施操作.[分析] 观察特征→确定抽样方法→求出比例→确定各层样本数→从各层中抽样→成样[解] 因机构改革关系到每个人的不同利益,故采用分层随机抽样方法较妥. ∵20100=15,∴105=2,705=14,205=4. ∴从副处级以上干部中抽取2人,从一般干部中抽取14人,从工人中抽取4人. 因副处级以上干部与工人数都较少,将他们分别按1~10和1~20编号,然后采用抽签法分别抽取2人和4人;对一般干部70人采用00,01,…,69编号,然后用随机数法抽取14人.这样便得到了一个容量为20的样本.归纳总结:分层随机抽样的特点1适用于总体由差异明显的几部分组成的情况.2更充分体现和反映了总体的情况.3等可能抽样,每个个体被抽到的可能性都相等.【练习2】某公司生产三种型号的轿车,产量分别是1 200辆,6 000辆和2 000辆,为检验该公司的产品质量,现用分层随机抽样的方法抽取46辆进行检验,这三种型号的轿车依次应抽取的数量为( )A .15,15,16B .6,30,10C .10,13,23D .12,16,18 【答案】 B解析:三种型号的轿车共9 200辆,抽取样本为46辆,则按469 200=1200的比例抽样,所以依次应抽取1 200×1200=6(辆),6 000×1200=30(辆),2 000×1200=10(辆). 探究三 获取数据的途径【例3】为了研究近年来我国高等教育发展状况,小明需要获取近年来我国大学生入学人数的相关数据,他获取这些数据的途径最好是( )A .通过调查获取数据B .通过试验获取数据C .通过观察获取数据D .通过查询获得数据【答案】D [因为近年来我国大学生入学人数的相关数据有所存储,所以小明获取这些数据的途径最好是通过查询获得数据.]归纳总结:【练习3】下列调查方案中,抽样方法合适、样本具有代表性的是( )A.用一本书第1页的字数估计全书的字数B.为调查某校学生对航天科技知识的了解程度,上学期间,在该校门口,每隔2分钟随机调查一位学生C.在省内选取一所城市中学,一所农村中学,向每个学生发一张卡片,上面印有一些名人的名字,要求每个学生只能在一个名字下面画“√”,以了解全省中学生最崇拜的人物是谁D.为了调查我国小学生的健康状况,共抽取了100名小学生进行调查【答案】B[A中样本缺少代表性(第1页的字数一般较少);B中抽样保证了随机性原则,样本具有代表性;对于C,城市中学与农村中学的规模往往不同,学生崇拜的人物也未必在所列的名单之中,这些都会影响数据的代表性;D中总体数量很大,而样本容量太少,不足以体现总体特征.]《9.2.1总体取值规律的估计》导学案【学习目标】1.学会用频率分布直方图表示样本数据2.能通过频率分布直方图对数据做出总体统计【自主学习】知识点1 频率分布直方图的绘制(1)求极差,即一组数据中的最大值与最小值的差.(2)决定组距与组数.组距与组数的确定没有固定的标准,一般来说,数据分组的组数与数据的个数有关,数据的个数越多,所分组数越多,当样本量不超过100时,常分为5~12组.(3)将数据分组.(4)列频率分布表,计算各小组的频率,作出频率分布表.(5)画频率分布直方图.其中横轴表示样本数据,纵轴表示频率与组距的比.知识点2 频率分布直方图的意义频率分布直方图中,各小长方形的面积表示相应各组的频率,各小长方形的面积的总和等于1.【合作探究】探究一 频率分布概念的理【答案】【例1】例1 关于频率分布直方图,下列说法正确的是( ) A .直方图中小长方形的高表示取某数的频率B .直方图中小长方形的高表示该组上的个体在样本中出现的频率C .直方图中小长方形的高表示该组上的个体在样本中出现的频数与组距的比值D .直方图中小长方形的高表示该组上的个体在样本中出现的频率与组距的比值 【答案】 D【答案】析 注意频率分布直方图和条形图的区别,在直方图中,纵轴(小长方形的高)表示频率与组距的比值,其相应组距上的频率等于该组距上的小长方形的面积.归纳总结:由频率的定义不难得出,各组数据的频率之和为1,因为各组数据的个数之和为样本容量.在列频率分布表时,可以利用这种方法检查是否有数据的丢失.【练习1】一个容量为20的样本数据,将其分组如下表:则样本在区间(-∞,50)上的频率为( ) A .0.5 B .0.25 C .0.6 D .0.7 【答案】 D【答案】析 样本在区间(-∞,50)上的频率为2+3+4+520=1420=0.7.探究二 频率分布直方图的绘制【例2】某中学从高一年级随机抽取50名学生进行智力测验,其得分如下(单位:分): 48 64 52 86 71 48 64 41 86 79 71 68 82 84 68 64 62 68 81 57 90 52 74 73 56 78 47 66 55 64 56 88 69 40 73 97 68 56 67 59 70 52 79 44 55 69 62 58 32 58 根据上面的数据,回答下列问题:(1) 这次测验成绩的最高分和最低分分别是多少?(2)将区间[30,100]平均分成7个小区间,试列出这50名学生智力测验成绩的频率分布表,进而画出频率分布直方图;(3)分析频率分布直方图,你能得出什么结论?【答案】(1)这次测验成绩的最低分是32分,最高分是97分.(2)根据题意,列出样本的频率分布表如下:(3)从频率分布直方图可以看出,这50名学生的智力测验成绩大体上呈两头小、中间大,左右基本对称,说明这50名学生中智力特别好或特别差的占极少数,而智力一般的占多数,这是一种最常见的分布.归纳总结:频率分布表和频率分布直方图之间的密切关系是显然的,它们只不过是相同的数据的两种不同的表达方式,是通过各小组数据在样本容量中所占比例大小来表示数据的分布规律,它可以让我们更清楚地看到整个样本数据的频率分布情况,并由此估计总体的分布情况.【练习2】如表所示给出了在某校500名12岁男孩中,用随机抽样得出的120人的身高(单位:cm).(1)列出样本频率分布表;(2)画出频率分布直方图;(3)估计身高小于134 cm的人数占总人数的百分比.【答案】(1)样本频率分布表如下:(2)(3)由样本频率分布表可知,身高小于134 cm的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134 cm的人数占总人数的19%.探究三频率分布直方图的应用【例3】从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:(1)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12小时的概率; (2)求频率分布直方图中的a ,b 的值;(3)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该周课外阅读时间的平均数在第几组(只需写出结论).【答案】 (1)根据频数分布表知,100名学生中一周课外阅读时间不少于12小时的学生共有6+2+2=10(名),所以样本中的学生一周课外阅读时间少于12小时的频率是1-10100=0.9.故从该校随机选取一名学生,估计其该周课外阅读时间少于12小时的概率为0.9. (2)课外阅读时间落在组[4,6)内的有17人,频率为0.17,所以a =频率组距=0.172=0.085.课外阅读时间落在组[8,10)内的有25人,频率为0.25,所以b =频率组距=0.252=0.125.(3)样本中的100名学生该周课外阅读时间的平均数在第4组.归纳总结:在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和等于1.【练习3】某学校组织学生参加数学测试,某班学生的成绩频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100],若低于60分的人数是15,则该班的学生总人数是( )A.45 B.50 C.55 D.60【答案】 B【答案】析结合频率分布直方图,得分低于60分的人数占总人数的频率为20×(0.005+0.01)=0.30,所以总人数为150.30=50,故选B.《9.2.2总体百分位数的估计》导学案【学习目标】1.理解百分位数的概念2.掌握计算百分位数的方法【自主学习】知识点1 百分位数(1)如果将一组数据从小到大排序,并计算相应的累计百分位,则某一百分位所对应数据的值就称为这一百分位的百分位数.一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.(2)第25百分位数又称第一四分位数或下四分位数;第75百分位数又称第三四分位数或上四分位数.知识点2 如何计算百分位数下面的步骤来说明如何计算第p百分位数.第1步:以递增顺序排列原始数据(即从小到大排列).第2步:计算 i =np %.第3步:①若 i 不是整数,将 i 向上取整.大于i 的比邻整数即为第p 百分位数的位置;②若i 是整数,则第p 百分位数是第i 项与第(i +1)项数据的平均值.【合作探究】探究一 百分位数的计算【例1】从某珍珠公司生产的产品中,任意抽取12颗珍珠,得到它们的质量(单位:g) 如下:7.9,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7.8,8.3,8.0. (1)分别求出这组数据的第25,75,95百分位数. (2)请你找出珍珠质量较小的前15%的珍珠质量.(3)若用第25,50,95百分位数把公司生产的珍珠划分为次品、合格品、优等品和特优品,依照这个样本的数据,给出该公司珍珠等级的划分标准.[解] (1)将所有数据从小到大排列,得7.8,7.9,8.0,8.3,8.4,8.5,8.5,8.5,8.6,8.9,9.0,9.9,因为共有12个数据,所以12×25%=3,12×75%=9,12×95%=11.4, 则第25百分位数是8.0+8.32=8.15,第75百分位数是8.6+8.92=8.75,第95百分位数是第12个数据(2)因为共有12个数据,所以12×15%=1.8,则第15百分位数是第2个数据为7.9.即产品质量较小的前15%的产品有2个,它们的质量分别为7.8,7.9.(3)由(1)可知样本数据的第25百分位数是8.15 g ,第50百分位数为8.5 g, 第95百分位数是9.9 g ,所以质量小于或等于8.15 g 的珍珠为次品,质量大于8.15 g 且小于或等于8.5 g 的珍珠为合格品,质量大于8.5 g 且小于等于9.9 g 的珍珠为优等品,质量大于9.9 g 的珍珠为特优品.【练习1】以下数据为参加数学竞赛决赛的15人的成绩: 78,70,72,86,88,79,80,81,94,84,56,98,83,90,91, 则这15人成绩的第80百分位数是( ) A .90 B .90.5 C .91 D .91.5答案B [把成绩按从小到大的顺序排列为: 56,70,72,78,79,80,81,83,84,86,88,90,91,94,98,因为15×80%=12,所以这15人成绩的第80百分位数是90+912=90.5.]探究二 百分位数的综合应用【例2】某市为了鼓励市民节约用电,实行“阶梯式”电价,将该市每户居民的月用电量划分为三档,月用电量不超过200千瓦时的部分按0.5元/千瓦时收费,超过200千瓦时但不超过400千瓦时的部分按0.8元/千瓦时收费,超过400千瓦时的部分按1.0元/千瓦时收费.(1)求某户居民用电费用y (单位:元)关于月用电量x (单位:千瓦时)的函数解析式. (2)为了了解居民的用电情况,通过抽样获得了今年1月份100户居民每户的用电量,统计分析后得到如图所示的频率分布直方图.若这100户居民中,今年1月份用电费用不超过260元的占80%,求a ,b 的值.(3)根据(2)中求得的数据计算用电量的75%分位数.[解] (1)当0≤x ≤200时,y =0.5x ;当200<x ≤400时,y =0.5×200+0.8×(x -200)=0.8x -60; 当x >400时,y =0.5×200+0.8×200+1.0×(x -400)=x -140. 所以y 与x 之间的函数解析式为 y =⎩⎪⎨⎪⎧0.5x ,0≤x ≤200,0.8x -60,200<x ≤400,x -140,x >400.(2)由(1)可知,当y =260时,x =400,即用电量不超过400千瓦时的占80%, 结合频率分布直方图可知⎩⎪⎨⎪⎧0.001×100+2×100b +0.003×100=0.8,100a +0.000 5×100=0.2,解得a =0.001 5,b =0.002 0. (3)设75%分位数为m ,。
抽样统计分析的基本知识点考题

抽样统计分析的基本知识(一)数理统计的基本概念、抽样调查的方法Z9.1.1全数检查和抽样检查的基本概念,理解总体、单位产品、批和样品、样本统计量、抽样分布、抽样检验的含义。
(P213)判断题1. (易)与全数检查相比,抽样检查的错判往往不可避免,因此供方和需方都要承担风险,因此应选择全数检查。
【答案】错误【解析】鉴于单位产品质量的波动性和样本抽取的偶然性,抽样检查的错判往往不可避免,因此供方和需方都要承担风险,但与全数检查相比,其明显的优势是经济性。
见教材第9章第1节P213。
2. (易)“不合格”是对单位产品的判定。
【答案】错误【解析】“不合格”是对质量特性的判定,“不合格品”是对单位产品的判定,单位产品的质量特性不符合规定,即为不合格。
见教材第9章第1节P214。
3. (易)样本统计量是样本的函数,是一个随机变量。
【答案】正确【解析】样本统计量是随机变量,随着抽到的样本单位不同其取值也会有变化,统计量是样本的函数,是一个随机变量。
见教材第9章第1节P214。
单选题1. (中)组成总体的基本元素称为()。
A.样本B.个体C.单位产品D.子样【答案】B【解析】在数理统计学中,总体是所研究对象的全体,个体是组成总体的基本元素,样本是从总体中随机抽取出来,被抽中的个体称为样品。
见教材第9章第1节P213。
Z9.1.2 样本数据特征值的含义,常用的数据特征值有算数平均数、中位数、极差、标准差、变异系数等,掌握其计算公式。
(P215)判断题1. (易)当样本数为偶数时,取居中两个数的平均值作为中位数。
【答案】正确【解析】样本中位数是将样本数据按数值大小有序排列后,位置居中的数值,当样本数为偶数时,取居中两个数的平均值作为中位数。
见教材第9章第1节P215。
2. (易)标准差小,说明分布集中程度低,离散程度小。
【答案】错误【解析】标准差值小,说明分布集中程度高,离散程度小,均值对总体的代表性好。
见教材第9章第1节P215。
人教A版(新教材)高中数学第二册(必修2)课件3: 第九章统计章末复习

分组
频数
频率
60.5~70.5
8
0.16
70.5~80.5
10
0.20
80.5~90.5
18
0.36
90.5~100.5 14
0.28
合计
50
1
(2)在被抽到的学生成绩中,在 85.5~95.5 分的个数是 9+7=16,占样 本的比例是1560=0.32,即获得二等奖的概率约为 32%,所以获得二等 奖的学生约有 800×32%=256(名).
(1)填充频率分布表中的空格(将答案直接填在表格内),并作出
频率分布直方图;
分组
频数 频率
60.5~70.5
0.16
70.5~80.5
10
80.5~90.5
18
0.36
90.5~100.5
合计
(2)若成绩在 85.5~95.5 分的学生为二等奖,问参赛学生中获得
二等奖的学生约有多少名?
解 (1)频率分布表如下表所示,频率分布直方图如图所示.
三、利用样本的百分位数估计总体的百分位数 [典例 3] 一家保险公司决定对推销员实行目标管理,即给推销员 确定一个具体的销售目标.确定的销售目标是否合适,直接影响 到公司的经济效益.如果目标定得过高,多数推销员完不成任务, 会使推销员失去信心;如果目标定得太低,将不利于挖掘推销员 的工作潜力.下面一组数据是部分推销员的月销售额(单位:千元).
二、利用样本的频率分布估计总体的取值规律 本章主要利用统计表、统计图分析估计总体的分布规律.要熟练掌握绘 制统计图表的方法,明确图表中有关数据的意义是正确分析问题的关键, 从图形与图表中获取有关信息并加以整理,是近年来高考命题的热点. [典例 2] 为了让学生了解更多有关“一带一路”倡议的信息,某中学举 行了一次“丝绸之路知识竞赛”,共有 800 名学生参加了这次竞赛.为 了解本次竞赛成绩情况,从中抽取了部分学生的成绩(得分均为整数,满 分为 100 分)进行统计.请你根据尚未完成的频率分布表,解答下列问题:
9.1.1简单随机抽样方法

本章知识结构框图如下: 实际问题
总体 普 查
总体数据
简单随机抽样、分层随机抽样
总体数据的特征 总体的取值规律
总体的百分位数
估计 估计
样本数据的特征 样本的取值规律
样本的百分位数
样本
总体的平均数、中位数 估计 样本的平均数、中位数
众数 总体的标准差、方差 估计 样本的标准差、方差
极差
极差
决策与建议
样本观测数据
二、本章学习任务与指导 三个任务的完成,就生成了一个统计问题完整解决的基本思路:首先要根据实际需求, 用适当的方法获取样本数据,选择适当的统计图表对样本数据进行整理和描述,在此 基础上用各种统计方法对样本数据进行分析,从样本数据中提取需要的信息,推断总 体的情况,进而解决相应的实际问题,获得结论,为人们制定决策提出建议
总体 ____调__查__对__象___的全体叫作总体
个体 组成总体的每一个_调__查__对__象__成为个体
抽样调查 根据一定目的,从总体中抽取_一__部__分___个__体__进行调查,并以此为依据对 总体的情况作出估计和推断的调查方法,成为抽样调查
样本 从总体中抽取的那部分___个__体___成为样本
二、本章学习任务与指导 从本章知识结构图中可以看出,本章有三大学习任务:面对实际问题的解决,为人们 的决策提供什么样的建议,始终是我们学习本章的第一任务,也是我们学好本章的目标 驱动任务,也就是教材9.3节内容 那么,要完成这一任务,需要我们用样本的数据特征及其分布的规律性来估计、推断 出总体的数据特征及其分布的规律,例如,总体的取值规律、百分数、集中趋势、离 散程度等等,这是学习本章的第二任务也就是教材9.2节内容 要完成第二大任务,即“用样本估计总体”,就需要我们抽取“好”的或“高质量”的 样本,这就存在一个如何抽取样本的问题,即抽样方法问题,这是学习本章的第三任务。 也就是教材9.1节内容
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(三) 质量数据分布的规律性
以质量标准为中心的质量数据分布, 可用一个“中间高、两端低、左右对称” 的几何图形表示,即一般服从正态分布
28
29
(三) 质量数据分布的规律性
正态分布曲线具有以下几个性质: 1.分布曲线对称于X=μ 2.X=μ时,曲线处于最高点;当X向左右
远离时,曲线不断地降低,整个曲线是 中间高两边低的形状; 3.若曲线与横坐标轴所组成的面积等于1, 则曲线与X=μ±σ所围成的面积为0.6825; 与 X=μ±2σ 所 围 的 面 积 为 0.9545 ; 与 X=μ±3σ所围成的面积为0.9973 。
22
五、质量数据的分布特征
(一) 质量数据的特征 (二) 质量数据波动的原因★ (三) 质量数据分布的规律性
23
(一)、质量数据的特征
➢ 个体数值的波动性 ➢ 总体(样本)分布的规律性 ➢ 质量数据的集中趋势 ➢ 质量数据的离中趋势 ➢ 反映了总体(样本)质量变化的内
在规律性
24
(二)、质量数据波动的原因★
20
17 17
3. 直方图的观察与分析
15 13
10
5
7
3 1
12
6 3 1
正常型直方图: 中间高,两侧低,左 右接近对称 横坐标—质量特性 纵坐标—频数(频率)
-6.5
-4.5
-2.5
-0.5
1.5
3.5
46
1.直方图的用途★★★
即频数分布直方图法,它是将收集到的 质量数据(>50个)进行分组整理,绘制成频 数分布直方图,用以描述质量分布状态的一 种分析方法,所以又称质量分布图法。
(2) 利用ABC分类法,确定主次因素。将累 计频率曲线按(0%-80%)、(80% -90%)、(90%-100%)分为三部 分,各曲线下面所对应的影响因素分别 为A(主)、B(次)、C(一般)三类 因素。
39
4. 排列图的应用
(1) 按不合格点的内容分类,可以分析出造 成质量问题的薄弱环节。
(2) 按生产作业分类,可以找出生产不合格 品最多的关键过程。
13
4. 整群抽样
整群抽样一般是将总体按自然存在的 状态分为若干群,并从中抽取样品群,组 成样本,然后在中选群内进行全数检验的 方法。
如对原材料质量进行检测,可按原包 装的箱、盒为群随机抽取,对中选箱、盒 做全数检验;每隔一定时间抽出一批产品 进行全数检验等。
14
5. 多阶段抽样
多阶段抽样又称多级抽样,是将各种 单阶段抽样方法结合使用,通过多次随机 抽样来实现的抽样方法。
12
3. 等距抽样
等距抽样又称机械抽样、系统抽样, 是将个体按某一特性排队编号后均分为n组 ,这时每组有K=N/n个个体,然后在第 一组内随机抽取第一件样品,以后每隔一 定距离(K号)抽选出其余样品组成样本的方 法。如在流水作业线上每生产100件产品抽 出一件产品做样品,直到抽出n件产品组成 样本。
四、质量数据的特征值★
(一)描述数据集中趋势的特征值 (二)描述数据离中趋势的特征值
17
(一)描述数据集中趋势的特征值
(1) 算术平均数(均值)
总体算术平均数
1 N
(X1 X2 X N )
1 N
N i 1
Xi
样本算术平均数
(2) 样本中位数
样本中位数是将样本数据按数值大小有序排 列后,位置居中的数值。当样本数n为奇数时, 数列居中的一位数即为中位数;当样本数n为偶 数时,取居中两个数的平均值作为中位数。
(2) 制订对策。绘制因果分析图不是目的,而 是要根据图中所反映的主要原因,制订改 进的措施和对策,限期解决问题,保证产 品质量。具体实施时,一般应编制一个对 策计划表。
44
第三节、直方图法、控制图法与相关图法
一、直方图法 二、控制图法 三、相关图法
45Leabharlann 一、直方图法1. 直方图的用途
频数
2. 直方图的绘制(P145)
分层抽样又称分类或分组抽样,是将总体 按某一特性分为若干组,然后在每组内随机抽 取样品,组成样本的方法。
由于对每组都有抽取,样品在总体中分布 均匀,更具代表性,特别适用于总体比较复杂 的情况。如研究混凝土浇筑质量时,可以按生 产班组分组、或按浇筑时间(白天、黑夜;或 季节)分组或按原材料供应商分组后,再在每 组内随机抽取个体。
120
105 A
B
C
80 率 70
90
60 %
75
50
60
40
45
30
30
20
15
10
0
0
表面 截面 平面 垂直 标高 其他
平整 尺寸 水平 度
度
度
38
3.排列图的观察与分析★★★
(1) 观察直方形,大致可看出各项目的影响 程度。排列图中的每个直方形都表示一 个质量问题或影响因素。影响程度与各 直方形的高度成正比。
48
(1) 观察直方图的形状、判断质量分布状态
对称分布 (正态分布)
折齿分布
左缓坡型
孤岛型
双峰型
绝壁型
49
折齿分布
对称分布(正态分布) 生产过程正常,质 量稳定
折齿分布 分组不当或组距确定不当
(一)全数检验 (二)随机抽样检验
8
(一)全数检验
全数检验是对总体中的全部个体逐一 观察、测量、计数、登记,从而获得对总 体质量水平评价结论的方法。
9
(二)随机抽样检验★
抽样检验是按照随机抽样的原则,从 总体中抽取部分个体组成样本,根据对样 品进行检测的结果,推断总体质量水平的 方法。
1. 简单随机抽样 2. 分层抽样 3. 等距抽样 4. 整群抽样 5. 多阶段抽样
3
一、总体、样本及统计推断工作过程
1、总体、个体 2、样本 3、统计推断工作过程
4
1、总体、个体
➢ 总体也称母体,是所研究对象的全体。N ➢ 个体,是组成总体的基本元素。 ➢ 有限总体,无限总体。 ➢ 一般把每件产品检测得到的某一质量数据
(强度、几何尺寸、重量等)即质量特性 值视为个体,产品的全部质量数据的集合 即为总体。
1、 偶然性原因 2、 系统性原因
25
1、偶然性原因
偶然性因素:具有随机发生的;是不 可避免、难以测量和控制的;或者是在经 济上不值得消除。
它们大量存在,但对质量的影响很小 ,属于允许偏差、允许位移范畴,引起的 是正常波动,一般不会因此造成废品,生 产过程正常稳定。
通常把4M1E因素的这类微小变化归 为影响质量的偶然性原因、不可避免原因 或正常原因。
实际应用中,通常按累计频率划分为A 类(0%-80%)、 B 类(80%-90%)、 C类(90%-100%)三部分,A类为主要因 素,B类为次要因素,C类为一般因素。
34
2. 排列图的作法
1) 收集整理数据 2) 排列图的绘制
35
1) 收集整理数据
按不合格点的频数按由大到小的顺序排列各检 查项目,以全部不合格点为总数,计算各项的频数和 累计频率。
5
2、样本
样本也称子样,是从总体中随机抽取出来, 并根据对其研究结果推断总体质量特征 的那部分个体。
被抽中的个体称为样品,样品的数目称样 本容量,n
6
3、统计推断工作过程
总体质量状况
生产过程 一批产品
推断 分析
样本质量特征值
是否正常 是否合格
随机抽样 样本 检测 整理
7
二、质量数据的收集方法★
10
1. 简单随机抽样
简单随机抽样又称纯随机抽样、完全随机 抽样,是对总体不进行任何加工,直接进行随 机抽样,获取样本的方法。
一般的做法是对全部个体编号,然后采用 抽签、摇号、随机数字表等方法确定中选号码, 相应的个体即为样品。
这种方法常用于总体差异不大,或对总体 了解甚少的情况。
11
2. 分层抽样
18
(二)描述数据离中趋势的特征值
(1) 极差R
R xmax xmin
(2) 标准偏差 (3) 变异系数
19
(2) 标准偏差(标准差或均方差)
N
Xi 2
1) 总体的标准偏差 i1 N
n
xi x2
2) 样本的标准偏差 S i1
(n<50)
n 1
(n≥50)
20
(2) 标准偏差(标准差或均方差)(续)
标准差小说明数据分布的集中程度高, 离散程度小,均值对总体的代表性好。
标准差的平方是方差,能确切地说明数 据的离散程度和波动规律,是最常用的反映 数据变异程度的特征值。
21
(3) 变异系数(离散系数)
1) 总体的变异系数
Cv
2) 样本的变异系数
变异系数又称离散系数,是用标准差除以算术 平均数得到的相对数。它表示数据的相对离散波动 程度。变异系数小,说明分布集中程度高,离散程 度小,均值对总体(样本)的代表性好。
30
(三) 质量数据分布的规律性
即在正常生产的情况下,质量特性 在区间(μ-σ)~(μ+σ)的产品有 68.25%;在区间(μ-2σ)~(μ+2σ)的 产品有95.45%;在区间(μ-3σ)~ (μ+3σ)的产品有99.73% 。质量特性在 μ±3σ范围以外的产品非常少,不到3‰ (0.3%)。
根据正态分布曲线的性质,可以认 为,凡是在μ±3σ范围内的质量差异都是 正常的,不可避免的,是偶然性因素作 用的结果。
通过直方图,可了解产品质量的波动情 况,掌握质量特性的分布规律,以便对质量 状况进行分析判断。同时可通过质量数据特 征值的计算,估算施工生产过程总体的不合 格品率,评价过程能力等。
47
3.直方图的观察与分析★★★