统计知识及统计案例大题部分-高考数学解题方法归纳总结专题训练

合集下载

高考数学试题汇编统计、统计案例

高考数学试题汇编统计、统计案例

第五节 统计、统计案例高考试题考点一 抽样的方法1.(2013年新课标全国卷Ⅰ,理3)为了解某地区的中小学生视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是( ) (A)简单随机抽样(B)按性别分层抽样(C)按学段分层抽样 (D)系统抽样解析:由于小学、初中、高中三个学段学生的视力情况差异较大,而男女视力情况差异不大,因此可以按学段分层抽样.故选C. 答案:C2.(2013年安徽卷,理5)某班级有50名学生,其中有30名男生和20名女生,随机询问了该班五名男生和五名女生在某次数学测验中的成绩,五名男生的成绩分别为86,94,88,92,90,五名女生的成绩分别为88,93,93,88,93.下列说法一定正确的是( ) (A)这种抽样方法是一种分层抽样 (B)这种抽样方法是一种系统抽样(C)这五名男生成绩的方差大于这五名女生成绩的方差 (D)该班男生成绩的平均数小于该班女生成绩的平均数解析:本题采用简单随机抽样方法抽取样本,故选项A 、B 错误.因为5名男生成绩和5名女生成绩的平均数,与该班男生成绩的平均数与女生成绩的平均数不一定存在准确的对应关系,所以选项D 的说法不一定成立.对于C 项,男生成绩的平均数1x =90,女生成绩的平均数2x =91,故5名男生成绩的方差21s =15[(86-90)2+(94-90)2+(88-90)2+(92-90)2+(90-90)2]=8,5名女生成绩的方差22s =15[(88-91)2+(93-91)2+(93-91)2+(88-91)2+(93-91)2]=6,故选C. 答案:C3.(2013年江西卷,理4)总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为( )(A)08 (B)07 (C)02(D)01解析:从左到右第1行的第5列和第6列数字是65,依次选取符合条件的数字分别是08,02,14,07,01,故选出来的第5个个体的编号为01. 答案:D考点二 统计图表1.(2013年福建卷,理4)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为( )(A)588 (B)480(C)450 (D)120解析:由题频率分布直方图得,该模块测试成绩不少于60分的学生人数为600×(0.030+0.025+0.015+0.010)×10=480.故选B.答案:B2.(2012年陕西卷,理6)从甲、乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示).设甲、乙两组数据的平均数分别为x甲,x乙,中位数分别为m甲,m乙,则( )(A) x甲<x乙,m甲>m乙 (B) x甲<x乙,m甲<m乙(C) x甲>x乙,m甲>m乙 (D) x甲>x乙,m甲<m乙解析:把数据从茎叶图中整理出来,甲的数据为:5,6,8,10,10,14,18,18,22,25,27,30,30,38,41,43;乙的数据为:10,12,18,20,22,23,23,27,31,32,34,34,38,42,43,48,所以x甲=116(5+6+8+10+10+14+18+18+22+25+27+30+30+38+41+43)=34516,x乙=116(10+12+18+20+22+23+23+27+31+32+34+34+38+42+43+48)=45716,显然x甲<x乙.又∵m甲=18222+=20,m乙=27312+=29,所以m甲<m乙.答案:B3.(2013年新课标全国卷Ⅱ,理19)经销商经销某种农产品,在一个销售季度内,每售出1 t该产品获利润500元,未售出的产品,每1 t亏损300元.根据历史资料,得到销售季度内市场需求量的频率分布直方图,如图所示.经销商为下一个销售季度购进了130 t该农产品.以X(单位:t,100≤X≤150)表示下一个销售季度内的市场需求量,T(单位:元)表示下一个销售季度内经销该农产品的利润.(1)将T表示为X的函数;(2)根据直方图估计利润T不少于57000元的概率;(3)在直方图的需求量分组中,以各组的区间中点值代表该组的各个值,并以需求量落入该区间的频率作为需求量取该区间中点值的概率(例如:若需求量X∈[100,110),则取X=105,且X=105的概率等于需求量落入[100,110)的频率),求T的数学期望.解:(1)当X∈[100,130)时,T=500X-300(130-X)=800X-39000,当X∈[130,150]时,T=500×130=65000,所以T=80039000,100130, 65000,130150.X XX-⎧⎨⎩≤<≤≤(2)由(1)知利润T不少于57000元当且仅当120≤X≤150.由直方图知需求量X∈[120,150]的频率为0.7,所以下一个销售季度内的利润T不少于57000元的概率的估计值为0.7.(3)依题意可得T的分布列为T45000530006100065000P0.10.20.30.4所以ET=45000×0.1+53000×0.2+61000×0.3+65000×0.4=59400.考点三样本的数字特征1.(2013年重庆卷,理4)如图所示茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为( )(A)2,5 (B)5,5(C)5,8 (D)8,8解析:由甲组数据的中位数为15,得x=5.由乙组数据的平均数为16.8,得9+30+5+y+8+24=16.8×5,即76+y=84,解得y=8.故选C.答案:C2.(2012年安徽卷,理5)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )(A)甲的成绩的平均数小于乙的成绩的平均数(B)甲的成绩的中位数等于乙的成绩的中位数(C)甲的成绩的方差小于乙的成绩的方差(D)甲的成绩的极差小于乙的成绩的极差解析:甲射击比赛中靶4,5,6,7,8环各1次,则甲成绩的中位数为6环,平均数为6环,极差为4环,方差为2平方环;乙射击比赛中靶5环3次,6环1次,9环1次,则乙成绩的中位数为5环,平均数为6环,极差为4环,方差为2.4平方环.所以甲成绩的方差比乙成绩的方差小.故选C.答案:C3.(2012年江西卷,理9)样本(x1,x2,…,x n)的平均数为x,样本(y1,y2,…,y m)的平均数为y(x≠y).若样本(x1,x2,…,x n,y1,y2,…,y m)的平均数z=αx+(1-α)y,其中0<α<12,则n,m的大小关系为( )(A)n<m (B)n>m(C)n=m (D)不能确定解析:依题意得x1+x2+…+x n=n x,y1+y2+…+y m=m y,x1+x2+…+x n+y1+y2+…+y m=(m+n)z=(m+n)αx+(m+n)(1-α) y,所以n x+m y=(m+n)αx+(m+n)(1-α)y,所以()()(),1, n m n am m n a ⎧=+⎪⎨=+-⎪⎩于是有n-m=(m+n)[α-(1-α)]=(m+n)(2α-1).因为0<α<1 2 ,所以2α-1<0.又m+n>0,所以n-m<0.即n<m.故选A.答案:A4.(2011年江苏卷,6)某老师从星期一到星期五收到的信件数分别为10,6,8,5,6,则该组数据的方差s2= .解析:由于这5个数的平均数x=15×(10+6+8+5+6)=7,因此该组数据的方差s2=15[(10-7)2+(6-7)2+(8-7)2+(5-7)2+(6-7)2]=3.2.答案:3.2考点四变量的相关性1.(2012年湖南卷,理4)设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(x i,y i)(i=1,2,…,n),用最小二乘法建立的回归方程为ˆy=0.85x-85.71,则下列结论中不正确的是( )(A)y与x具有正的线性相关关系(B)回归直线过样本点的中心(x,y)(C)若该大学某女生身高增加1 cm,则其体重约增加0.85 kg(D)若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg解析:根据线性回归方程相关知识可知选项A、B、C是正确的.而由回归方程得到的是预报变量的可能取值的平均值,不是预报变量的精确值,故选D.答案:D2.(2011年陕西卷,理9)设(x1,y1),(x2,y2),…,(x n,y n)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线(如图所示),以下结论中正确的是( )(A)x和y的相关系数为直线l的斜率(B)x和y的相关系数在0到1之间(C)当n为偶数时,分布在l两侧的样本点的个数一定相同(D)直线l过点(x,y)解析:相关系数是表示两个变量是否具有线性相关关系的量,可正可负也可为0,它的绝对值越接近1两变量相关性越强.因此A、B错,线性回归直线两侧样本点个数不一定相同,故C错.回归直线恒过样本中心(x,y).选项D正确.答案:D3.(2011年江西卷,理6)变量X和Y对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1),r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则( )(A)r2<r1<0 (B)0<r2<r1(C)r2<0<r1(D)r2=r1解析:对于变量Y与X而言,Y随X的增大而增大,故Y与X正相关,即r1>0;对于变量V与U而言,V随U的增大而减小,故V与U负相关,即r2<0.所以有r2<0<r1.故选C.答案:C4.(2011年山东卷,理7)某产品的广告费用x与销售额y的统计数据如下表:广告费用x/万元4235销售额y/万元49263954根据上表可得回归方程ˆy=b x+ˆa中的b为9.4,据此模型预报广告费用为6万元时销售额为( )(A)63.6万元(B)65.5万元(C)67.7万元(D)72.0万元解析:线性回归直线过定点(x,y),y=492639544+++=42, x=3.5,代入ˆa=y-ˆb x得ˆa=42-9.4×3.5=9.1,所以ˆy=6×9.4+9.1=65.5(万元).答案:B5.(2011年辽宁卷,理14)调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:ˆy=0.254x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加万元. 解析:由回归直线方程可知,x每增加1,ˆy增加0.254,从而家庭年收入每增加1万元,年饮食支出平均增加0.254万元.答案:0.2546.(2011年广东卷,理13)某数学老师的身高为176 cm,他爷爷、父亲和儿子的身高分别是173 cm,170 cm 和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为cm.解析:儿子和父亲的身高可列表如下:(单位:cm)父亲身高x173170176儿子身高y170176182设回归直线方程为ˆy=ˆa+ˆb x,由表中数据可求得x=173, y=176,∴ˆb=()()()31321i iiiix x y yx x==---∑∑=()223633⨯+-=1,ˆa=y-ˆb x=3,故回归直线方程为ˆy=x+3.当x=182时, ˆy=182+3=185.故预测他孙子的身高为185 cm.答案:185考点五独立性检验(2012年辽宁卷,理19)电视传媒公司为了解某地区某类体育节目的收视情况,随机抽取了100名观众进行调查.如图所示的是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图.将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”.(1)根据已知条件完成下面的2×2列联表,据此资料,你是否认为“体育迷”与性别有关?非体育迷体育迷总计男女1055总计(2)将上述调查得到的频率视为概率.现在从该地区大量电视观众中,采用随机抽样方法每次抽取1名观众,抽取3次,记被抽取的3名观众中“体育迷”的人数为X.若每次抽取的结果是相互独立的,求X的分布列、期望E(X)和方差D(X).附:χ2=()211221221n n n n nn n n n-++.P(χ2≥k)0.050.01 k 3.841 6.635解:(1)由频率分布直方图可知在抽取的100人中,“体育迷”有25人,从而2×2列联表补充如下:非体育迷体育迷总计男301545女451055总计7525100将2×2列联表中的数据代入公式计算,得χ2=()2 1003010451575254555⨯-⨯⨯⨯⨯=10033≈3.030.因为3.030<3.841,所以没有足够的把握认为“体育迷”与性别有关.(2)由频率分布直方图知抽到“体育迷”的频率为0.25,将频率视为概率,即从观众中抽取一名“体育迷”的概率为14.由题意知X ~B(3, 14),从而X 的分布列为: X 0123P27642764964164所以E(X)=np=3×14=34,D(X)=np(1-p)=3×14×34=916. 模拟试题考点一 抽样方法1.(2013北京市丰台区期末)某高中共有学生900人,其中高一年级240人,高二年级260人,为做某项调查,拟采用分层抽样法抽取容量为45的样本,则在高三年级抽取的人数是 .解析:高三的人数为400, 所以在高三抽取的人数为45900×400=20. 答案:202.(2013青岛一中调研)某班级有50名学生,现要采取系统抽样的方法在这50名学生中抽出10名学生,将这50名学生随机编号1~50号,并分组,第一组1~5号,第二组6~10号,……,第十组46~50号,若在第三组中抽得号码为12的学生,则在第八组中抽得号码为 的学生.解析:因为12=5×2+2,即第三组抽出的是第二个同学, 所以每一组都相应抽出第二个同学. 所以第8组中抽出的号码为5×7+2=37号. 答案:37考点二 统计图表1.(2013云南师大附中检测)甲、乙两名运动员在某项测试中的6次成绩的茎叶图如图所示,,分别表示甲乙两名运动员这项测试成绩的平均数,s 1,s 2分别表示甲乙两名运动员这项测试成绩的标准差,则有( )(A)1x >2x ,s 1<s 2 (B)1x =2x ,s 1=s 2 (C)1x =2x ,s 1<s 2(D)1x =2x ,s 1>s 2解析:由样本中数据可知1x =15, 2x =15, 由茎叶图得s 1<s 2, 所以选C. 答案:C2.(2013贵州省六校联考)某同学学业水平考试的9科成绩如茎叶图所示,则根据茎叶图可知该同学的平均分为 .解析:19(68+72+73+78×2+81+89×2+92)=7209=80.答案:803.(2013北京市西城区期末)为了解学生的身体状况,某校随机抽取了一批学生测量体重.经统计,这批学生的体重数据(单位:千克)全部介于45至70之间.将数据分成以下5组:第1组[45,50),第2组[50,55),第3组[55,60),第4组[60,65),第5组[65,70],得到如图所示的频率分布直方图.现采用分层抽样的方法,从第3,4,5组中随机抽取6名学生做初检.(1)求每组抽取的学生人数;(2)若从6名学生中再次随机抽取2名学生进行复检,求这2名学生不在同一组的概率.解:(1)由频率分布直方图知,第3,4,5组的学生人数之比为3∶2∶1.所以,每组抽取的人数分别为:第3组:36×6=3;第4组:26×6=2;第5组:16×6=1.所以从第3,4,5组应依次抽取3名学生,2名学生,1名学生.(2)记“从6名学生中抽取2名学生不在同一组”为事件A,则P(A)=11111131213226C C C C C CC+⋅+⋅=1115.考点三样本的数字特征1.(2012西安五校模拟)已知一组正数x1,x2,x3,x4的方差s2=14(22221234x x x x+++-16),则数据x1+2,x2+2,x3+2,x4+2的平均数为( ) (A)2 (B)3 (C)4 (D)6解析:设x1,x2,x3,x4的平均值为x,则s2=14[(x1-x)2+(x2-x)2+(x3-x)2+(x4-x)2]=14(22221234x x x x+++-42x),∴42x=16,∴x =2,∴x 1+2,x 2+2,x 3+2,x 4+2的平均数为4. 答案:C2.(2013昆明一中检测)某学校想要调查全校同学是否知道迄今为止获得过诺贝尔物理奖的6位华人的姓名,为此出了一份考卷.该卷共有6个单选题,每题答对得20分,答错、不答得零分,满分120分.阅卷完毕后,校方公布每题答对率如下:则此次调查全体同学的平均分数是 分.解析:假设全校人数有x 人,则每道试题答对人数及总分分别为所以六个题的总分为66x,所以平均分为66xx=66. 答案:66考点四 线性回归方程1.(2013青岛一中调研)某学生四次模拟考试中,其英语作文的减分情况如下表:显然所减分数y 与模拟考试次数x 之间有较好的线性相关关系,则其线性回归方程为( )(A)y=0.7x+5.25 (B)y=-0.6x+5.25 (C)y=-0.7x+6.25(D)y=-0.7x+5.25解析:由题意可知,所减分数y 与模拟考试次数x之间为负相关,所以排除A. 考试次数的平均数为x =14(1+2+3+4)=2.5, 所减分数的平均数为y =14(4.5+4+3+2.5)=3.5, 即直线应该过点(2.5,3.5),代入验证可知直线y=-0.7x+5.25成立,故选D. 答案:D2.(2012湘潭三模)某种产品的广告支出x 与销售额y(单位:百万元)之间有如下的对应关系:(1)假定x 与y 之间具有线性相关关系,求回归方程;(2)若实际销售额不少于60百万元,则广告支出应该不少于多少?参考公式: ˆb=1221ni ii nii x ynx y xnx==--∑∑,ˆa=y -ˆb x . 解:(1)∵x =15×(2+4+5+6+8)=5, y =15×(30+40+60+50+70)=50,521ii x=∑=22+42+52+62+82=145,51i ii x y=∑=2×30+4×40+5×60+6×50+8×70=1380,∴ˆb=51522155i ii ii x yx y xx==--∑∑=21380555014555-⨯⨯-⨯=6.5,ˆa=y -ˆb x =50-6.5×5=17.5. ∴回归方程为ˆy=6.5x+17.5. (2)由回归方程得ˆy ≥60,即6.5x+17.5≥60, 解得x ≥8513≈6.54. 故广告支出应该不少于6.54百万元.考点五 独立检验1.(2012枣庄模拟)下面是2×2列联表:则表中a,b 的值分别为( )(A)94,72 (B)52,50 (C)52,74 (D)74,52 解析:∵a+21=73,∴a=52, 又a+22=b,∴b=74. 答案:C2.(2012汕头期末)下列命题中假命题是( )(A)对分类变量X 与Y 的随机变量K 2的观测值k 来说,k 越小,“X 与Y 有关系”的可信程度越大(B)用相关指数R 2来刻画回归的效果时,R 2的值越大,说明模型拟合的效果越好(C)两个随机变量的相关性越强,相关系数的绝对值越接近1 (D)等高条形图可以展示2×2列联表数据的频率特征解析:K 2的观测值k 越大,“X 与Y 有关系”的可信程度越大.答案:A综合检测1.(2011汕头期末)下表提供了某厂节能降耗技术改造后在生产A 产品过程中记录的产量x(吨)与相应的生产能耗y(吨)的几组对应数据:如果根据上表提供的数据求出y 关于x 的线性回归方程为y =0.7x+0.35,那么表中t 的值为( )(A)3 (B)3.15 (C)3.5(D)4.5解析:由y=0.7x+0.35得2.54 4.54t+++=0.7×34564++++0.35,即114t+=3.5,解得t=3.答案:A2.(2011佛山联考)一个总体分为A,B两层,用分层抽样方法从总体中抽取一个容量为30的样本,已知B层中每个个体被抽到的概率都是112,则总体中的个体数为.解析:因为分层抽样为等可能抽样,故每个个体被抽到的可能性都是相等的.设总体中的个体数为n,则30n=112,∴n=360.答案:3603.(2012广州期末)在一次调研中,随机调查了某社区若干居民的年龄,将调查数据绘制成如图所示的扇形和条形统计图,则a-b= .(60以上含60)解析:设共调查了x名居民的年龄,由x·46%=230,得x=500,于是得a=100500×100%=20%,b=1-(20%+46%+22%)=12%.故a-b=8%.答案:8%。

高中数学 统计 专题总结及典例练习

高中数学 统计  专题总结及典例练习

高中数学《统计》学考复习一、课标要求:1.理解简单随机抽样的概念,会用简单随机抽样(抽签法、随机数表法)从总体中抽取样本;理解系统抽样,会用系统抽样从总体中抽取样本;理解分层抽样的概念,会用分层抽样从总体中抽取样本。

2.了解当总体中的个体取不同数值很少时,可用频率分布表或频率分布条形图估计总体分布,并会用这两种方式估计总体分布。

3.了解当总体中的个体取不同值较多,甚至无限时,可用频率分布表或频率分布直方图去估计总体分布,并会用这两种方式估计总体分布。

4. 能根据实际问题的需要合理地选取样本,从样本数据中提取最基本的数字特征,并做出合理的解释;会用样本的基本数字特征去估计总体的基本数字特征。

5. 了解相关关系、回归分析、散点图等概念,会求回归直线方程。

二、重点知识:1.2以是各个不同区间内取值的频率,相应的直方图是用图形面积的大小来表示在各个区间内取值的频率.3.频率分布将随着样本容量的增大更加接近总体分布,当样本容量无限增大且分组的组距无限缩小时,频率分布直方图就会演变成一条光滑曲线——反映总体分布的密度曲线.总体密度曲线较为直观地表达了它们之间的关系,基于频率分布与相应的总体分布的关系,由于通常我们不知道一个总体的分布,因此我们往往从总体中抽取一个样本,用样本的频率分布估计相应的总体分布.4.频率直方图中,依次连接各小长方形上端的中点,就得到一条折线,这条折线称为频率分布折线图.5.用数字估计总体特征●根据样本频率分布直方图,分别估计总体的众数、中位数和平均数1)众数:最高矩形下端中点的横坐标2)中位数:直方图面积平分线与横轴交点的横坐标3)平均数:每个小矩形的面积与小矩形底边中点的横坐标的乘积之和●分布表、频率分布直方图和折线图的主要作用是表示样本数据的分布情况,此外,我们还可以用茎叶图来表示样本数据的分布情况.A.用茎叶图表示数据的分布情况是一种好方法,茎叶图具有优点:(1)保留了原始数据,没有损失样本信息;(2)数据可以随时记录、添加或修改.B. 茎叶图中数据的茎和叶的划分,可根据样本数据的特点灵活决定.C.画出一组样本数据的茎叶图的步骤:第一步,将每个数据分为“茎”(高位)和“叶”(低位)两部分;第二步,将最小的茎和最大的茎之间的数按大小次序排成一列,写在左(右)侧;第三步,将各个数据的叶按大小次序写在茎右(左)侧.●样本的众数、中位数和平均数常用来表示样本数据的“中心值”,其中众数和中位数容易计算,不受少数几个极端值的影响,但只能表达样本数据中的少量信息. 平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响也越大.当样本数据质量比较差时,使用众数、中位数或平均数描述数据的中心位置,可能与实际情况产生较大的误差,难以反映样本数据的实际状况。

2020年高考数学一轮复习考点与题型总结:第十章统计与统计案例(附解析)

2020年高考数学一轮复习考点与题型总结:第十章统计与统计案例(附解析)

第十章统计与统计案例第一节随机抽样一、基础知识1.简单随机抽样(1)定义:一般地,设一个总体含有 N 个个体,从中逐个不放回地抽取 n 个个体作为样本 (n≤ N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.这样抽取的样本,叫做简单随机样本.(2)常用方法:抽签法和随机数法.2.分层抽样 (1)在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.(2)分层抽样的应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样.3.系统抽样 (1)定义:当总体中的个体数较多时,可以将总体分成均衡的几部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需的样本,这种抽样的方法叫做系统抽样.(2)系统抽样的步骤假设要从容量为 N 的总体中抽取容量为 n的样本.①先将总体的 N 个个体编号;②确定分段间隔 k,对编号进行分段.当N(n 是样本容量 )是整数时,取 k=N; nn当总体中的个体数不能被样本容量整除时,可先用简单随机抽样的方法从总体中剔除几个个体,使剩下的个体数能被样本容量整除,然后再按系统抽样进行.这时在整个抽样过程中每个个体被抽取的可能性仍然相等.③在第 1 段用简单随机抽样确定第一个个体编号l(l≤k);④按照一定的规则抽取样本.通常是将 l 加上间隔 k 得到第 2 个个体编号 l + k,再加 k 得到第 3 个个体编号 l + 2k,依次进行下去,直到获取整个样本.、常用结论(1)不论哪种抽样方法,总体中的每一个个体入样的概率都是相同的.(2)系统抽样一般也称为等距抽样,入样个体的编号相差分段间隔k 的整数倍.(3)分层抽样是按比例抽样,每一层入样的个体数为该层的个体数乘抽样比.(4)三种抽样方法的特点、联系及适用范围考点一简单随机抽样[典例 ] 下列抽取样本的方式属于简单随机抽样的个数有 ( )①从无限多个个体中抽取 100 个个体作为样本;②盒子里共有 80个零件,从中选出 5 个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里;③用抽签方法从 10件产品中选取 3 件进行质量检验;④某班有 56 名同学,指定个子最高的 5 名同学参加学校组织的篮球赛.A.0 个B.1个C.2个D.3 个[解析 ] ①不是简单随机抽样,因为被抽取样本的总体的个数是无限的,而不是有限的;②不是简单随机抽样,因为它是有放回抽样;③明显为简单随机抽样;④不是简单随机抽样,因为不是等可能抽样.[答案 ] B[ 解题技法 ] 应用简单随机抽样应注意的问题 (1)一个抽样试验能否用抽签法,关键看两点:一是抽签是否方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法.(2)在使用随机数法时,如遇到三位数或四位数,可从选择的随机数表中的某行某列的数字计起,每三个或四个作为一个单位,自左向右选取,有超过总体号码或出现重复号码的数字舍去.[ 题组训练 ]1.总体由编号为 01,02,⋯, 19,20 的 20 个个体组成,利用下面的随机数表选取 5 个个体,选取方法是 从随机数表第 1 行的第 5 列和第 6 列数字开始由左到右依次选取两个数字,则选出来的第 5 个个体的编号为 ()7816 6572 0802 6314 0702 4369 9728 0198 3204 9234 4935 8200 3623 4869 6938 7481B .07C .02考点二 系统抽样[典例] (1)某校为了解 1 000 名高一新生的身体生长状况,用系统抽样法 (按等距的规则 )抽取 40名同学进行检查, 将学生从 1~1 000进行编号, 现已知第 18组抽取的号码为 443,则第一组用简单随机抽样抽取的 号码为 ( )A .16B . 17C .18D .19(2) 中央电视台为了解观众对某综艺节目的意见,准备从 502 名现场观众中抽取 10%进行座谈,现用系统 抽样的方法完成这一抽样,则在进行分组时,需剔除 __________________ 个个体,抽样间隔为 ___________________________________________ .[解析 ] (1)因为从 1 000 名学生中抽取一个容量为 40的样本,所以系统抽样的分段间隔为 140000=25,设第一组随机抽取的号码为 x ,则抽取的第 18 组编号为 x +17×25=443,所以 x = 18.(2)把 502 名观众平均分成 50组,由于 502除以 50的商是 10,余数是 2,所以每组有 10 名A.08 D .01解析: 选 D 由随机数法的随机抽样的过程可知选出的 5个个体是 08,02,14,07,01,所以第 5 个个体的编 号是 01.2.利用简单随机抽样,从 n 个个体中抽取一个容量为 10 的样本.若第二次抽取时,余下的每个个体被 抽到的概率为 13,则在整个抽样过程中,每个个体被抽到的概率为()1 A.4 1 B.13 5 C.14 10 D.27解析:选C 根据题意, n -91=31,解得 n = 28.故在整个抽样过程中每个个体被抽到的概率为10= 5. 28=14.观众,还剩 2 名观众,采用系统抽样的方法抽样时,应先用简单随机抽样的方法从 502 名观众中抽取 2名观众,这 2 名观众不参加座谈;再将剩下的 500名观众编号为 1,2,3,⋯,500,并均匀分成 50段,每段含500=10个个体.所50 以需剔除 2 个个体,抽样间隔为 10.[答案 ] (1)C (2)2 10[ 变透练清 ]1. 变结论若本例 (1) 的条件不变,则编号落入区间 [501,750] 的人数为.解析:从 1 000名学生中抽取一个容量为 40的样本,系统抽样分 40组,每组140000=25 个号码,每组抽取一个,从 501 到 750 恰好是第 21 组到第 30 组,共抽取 10 人.答案: 102.(2018 ·南昌摸底调研 )某校高三 (2)班现有 64 名学生,随机编号为 0,1,2,⋯, 63,依编号顺序平均分成 8 组,组号依次为 1,2,3 ,⋯, 8.现用系统抽样方法抽取一个容量为 8 的样本,若在第 1 组中随机抽取的号码为 5,则在第 6 组中抽取的号码为.解析:由题知分组间隔为64=8,又第 1 组中抽取的号码为 5,所以第 6组中抽取的号码为5× 8+ 5= 45. 8答案: 45[ 解题技法 ] 系统抽样中所抽取编号的特点系统抽样又称等距抽样,所以依次抽取的样本对应的号码就是一个等差数列,首项就是第 1 组所抽取样本的号码,公差为间隔数,根据等差数列的通项公式就可以确定每一组内所要抽取的样本号码.[提醒 ] 系统抽样时,如果总体中的个数不能被样本容量整除时,可以先用简单随机抽样从总体中剔除几个个体,然后再按系统抽样进行.考点三分层抽样[典例] 某电视台在网上就观众对其某一节目的喜爱程度进行调查,参加调查的一共有 20 000人,其中各种态度对应的人数如下表所示:电视台为了了解观众的具体想法和意见,打算从中抽取 100 人进行详细的调查,为此要进行分层抽样,那么在分层抽样时,每类人中应抽取的人数分别为 ( )A .25,25,25,25B . 48,72,64,16C.20,40,30,10 D .24,36,32,8100 1 1[解析 ] 法一:因为抽样比为201 00000=2010,所以每类人中应抽取的人数分别为 4 800× 2100=24,750A .不全相等B .均不相等C .都相等,且为2 019D .都相等,且为140[答案 ] D[ 解题技法 ] 分层抽样问题的类型及解题思路 (1)求某层应抽个体数量:按该层所占总体的比例计算.(2)已知某层个体数量,求总体容量或反之求解:根据分层抽样就是按比例抽样,列比例式进行计算.(3)分层抽样的计算应根据抽样比构造方程求解,其中“抽样比= 样本容量=各层样本数量”总体容量 =各层个体数量 ”[ 题组训练 ]1. (2019 ·山西五校联考 )某校为了解学生的学习情况,采用分层抽样的方法从高一 人、高三 n 人中抽取 81 人进行问卷调查,若高二被抽取的人数为30,则 n = ( )A .860B . 720C .1 020答案: 85[课时跟踪检测 ]1.从 2 019 名学生中选取 50名学生参加全国数学联赛,若采用以下方法选取:先用简单随机抽样法从 2200×1 200 36, 6 400 × 1 200 32,1 600× 12008. 法二: 最喜爱、喜爱、一般、不喜欢的比例为 4 800∶7 200∶6 400∶1 600=6∶9∶8∶2, 所以每类人中应抽取的人数分别为 ×100= 6+9+ 8+224, 9 6+9+8+× 100= 36, 8 6+9+8+×100=32,26+9+8+×100=8.1 000 人、高二 1 200 D .1 040解析: 选 D 由已知条件知抽样比为 30 1 410,从而 81 1 000+1 20041,解得 n =1 040 ,故选D.2.(2018 广·州高中综合测试 )已知某地区中小学学生人数如图所示.为 参加某项社会实践活动的意向, 拟采用分层抽样的方法来进行调查. 若高 名学生,则小学与初中共需抽取的学生人数为 ____________________________________________ .20x +20 解得 x =85. 019 名学生中剔除 19 名学生,剩下的 2 000 名学生再按系统抽样的方法抽取,则每名学生入选的概率 () 了解该区学生 中 需 抽 取20 错误 ! =解析:选 C 从 N个个体中抽取 M 个个体,则每个个体被抽到的概率都等于M N,故每名学生入选的概率都相等,且为50.22.福利彩票“双色球”中红球的号码可以从01,02,03,⋯, 32,33 这 33 个两位号码中选取,小明利用如下所示的随机数表选取红色球的 6 个号码,选取方法是从第 1行第 9 列的数字开始,从左到右依次读取数据,则第四个被选中的红色球的号码为 ( )A.12 B . 33C.06 D .16解析:选 C 被选中的红色球的号码依次为 17,12,33,06,32,22,所以第四个被选中的红色球的号码为06.3.某班共有学生 52人,现根据座号,用系统抽样的方法,抽取一个容量为4的样本.已知 5 号、 18号、44 号同学在样本中,那么样本中还有一个同学的座号是 ( )A .23B . 27C.31 D .3352解析:选 C 分段间隔为542= 13,故样本中还有一个同学的座号为 18+13= 31.4.某工厂在 12 月份共生产了 3 600 双皮靴,在出厂前要检查这批产品的质量,决定采用分层抽样的方法进行抽取,若从一、二、三车间抽取的产品数分别为a,b, c,且 a,b,c 构成等差数列,则第二车间生产的产品数为 ( )A.800 双B.1 000 双C.1 200双D.1 500 双解析:选 C 因为 a,b,c 成等差数列,所以 2b=a+c,即第二车间抽取的产品数占抽样产品总数的三分之一,根据分层抽样的性质可知,第二车间生产的产品数占 12 月份生产总数的三分之一,即为 1 200 双皮靴.5.(2018 南·宁摸底联考 )已知某地区中小学生人数和近视情况分别如图甲和图乙所示.为了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取 2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为 ( )A .100,20B . 200,20C.200,10 D .100,10解析:选 B 由题图甲可知学生总人数是 10 000,样本容量为 10 000×2%=200,抽取的高中生人数是 2 000×2%=40,由题图乙可知高中生的近视率为50%,所以抽取高中生的近视人数为40× 50%=20,故选 B.6.一个总体中有 100 个个体,随机编号为 0,1,2,⋯, 99.依编号顺序平均分成 10 个小组,组号依次为 1,2,3,⋯, 10.现用系统抽样方法抽取一个容量为10 的样本,如果在第一组随机抽取的号码为m,那么在第 k组中抽取的号码个位数字与 m+k 的个位数字相同.若 m= 6,则在第 7 组中抽取的号码是()A .63B . 64C.65 D .66解析:选 A 若 m=6,则在第 7 组中抽取的号码个位数字与 13的个位数字相同,而第 7 组中的编号依次为 60,61,62,63,⋯,69,故在第 7 组中抽取的号码是 63.7.采用系统抽样方法从 960 人中抽取 32 人做问卷调查,为此将他们随机编号为 1,2,⋯,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的 32人中,编号落入区间 [1,450] 的人做问卷 A,编号落入区间(450,750]的人做问卷 B,其余的人做问卷 C.则抽到的人中,做问卷 B 的人数为()A .7 B.9C.10 D .15解析:选 C 960÷32=30,故由题意可得抽到的号码构成以9 为首项,以 30 为公差的等差数列,其通项公式为 a n=9+30(n-1)=30n-21.由 450<30n-21≤750,解得 15.7<n≤25.7.又 n为正整数,所以 16≤n≤25,故做问卷 B 的人数为 25- 16+ 1= 10.故选 C.8.某企业三月中旬生产 A,B,C 三种产品共 3 000件,根据分层抽样的结果,企业统计员制作了如下的统计表格:由于不小心,表格中 A, C产品的有关数据已被污染看不清楚,统计员记得 A 产品的样本容量比C产品的样本容量多 10,根据以上信息,可得 C 的产品数量是件.x 解析:设样本容量为 x,则 3 000×1 300=130,∴x=300.∴A 产品和 C 产品在样本中共有 300-130=170(件).设 C产品的样本容量为 y,则 y+ y+10= 170,∴ y=80.∴C 产品的数量为3300000×80=800(件).答案:8009.某企业三个分厂生产同一种电子产品,三个分厂产量分布如图所示,现在用分层抽样方法从三个分厂生产的该产品中共抽取 100 件做使用寿命的测试,则第一分厂应抽取的件数为_ ;由所得样品的测试结果计算出一、二、三分厂取出的产品的使用寿命平均值分别为 1 020 小时、 980 小时、 1 030 小时,估计这个企业所生产的该产品的平均使用寿命为小时.解析:第一分厂应抽取的件数为100×50%=50;该产品的平均使用寿命为 1 020×0.5+ 980×0.2+1030×0.3=1 015.答案: 50 1 01510.将参加冬季越野跑的 600 名选手编号为: 001,002,⋯, 600,采用系统抽样方法抽取一个容量为50 的样本,把编号分为 50 组后,在第一组的 001 到 012这 12 个编号中随机抽得的号码为 004,这600 名选手穿着三种颜色的衣服,从 001 到 301 穿红色衣服,从 302 到 496 穿白色衣服,从 497 到 600 穿黄色衣服,则抽到穿白色衣服的选手人数为.解由题意及系统抽样的定义可知,将这 600 名学生按编号依次分成 50 组,每一组各有 12 第 k(k∈N *)组抽中的号码是 4+12(k-1).令 302≤4+12(k-1)≤496,得 2556≤k≤42,因此抽到穿白色衣服的选手人数为 42- 25=17(人).答案:1711.某初级中学共有学生 2 000 名,各年级男、女生人数如下表:已知在全校学生中随机抽取 1 名,抽到初二年级女生的概率是 0.19.(1)求 x 的值;(2)现用分层抽样的方法在全校抽取 48 名学生,问应在初三年级抽取多少名?x解: (1)∵=0.19,∴ x= 380.2 000(2)初三年级人数为 y+z=2 000-(373+377+380+370)=500,现用分层抽样的方法在48 名学全校抽取生,应在初三年级抽取的人数为240800×500=12(名 ).第二节 用样本估计总体、基础知识1.频率分布直方图频率 频率(1)纵轴表示 组距,即小长方形的高= 组距;频率(2)小长方形的面积=组距× 组距 =频率;(3)各个小方形的面积总和等于 1 .2.频率分布表的画法(3)方差 s 2=n [( x 1- x )2+ (x 2- x )2+⋯+ (x n - x )2].第一步:求极差,决定组数和组距,组距=极差; 组数;第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间; 第三步:登记频数,计算频率,列出频率分布表.3.茎叶图茎叶图是统计中用来表示数据的一种图, 茎是指中间的一列数,叶就是从茎的旁 边生长出来的数.4.中位数、众数、平均数的定义(1) 中位数将一组数据按大小依次排列, 处于最中间位置的一个数据 (或最中间两个数据的平均数 位数.)叫做这组数据的中 (2) 众数 一组数据中出现次数最多的数据叫做这组数据的众数.(3)平均数一组数据的算术平均数即为这组数据的平均数, n 个数据 x 1,x 2,⋯,x n 的平均数 x 1 = n (x 1+ x 2+⋯+5. 样本的数字特征如果有 n 个数据 x 1,x 2,⋯, x n ,那么这 n个数的 1 (1) 平均数 x = n (x 1+ x 2+⋯(2) 标准差s =、常用结论1.频率分布直方图中的常见结论(1)众数的估计值为最高矩形的中点对应的横坐标.(2)平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.(3)中位数的估计值的左边和右边的小矩形的面积和是相等的.2.平均数、方差的公式推广(1)若数据 x1,x2,⋯,x n的平均数为 x,则 mx1+a,mx2+a,mx3+a,⋯,mx n+a 的平均数是 mx + a.(2)若数据 x1,x2,⋯, x n的方差为 s2,则数据 ax1+b,ax2+b,⋯, ax n+b 的方差为 a2s2.考点一茎叶图[典例 ] (2017 山·东高考 )如图所示的茎叶图记录了甲、乙两组各产量数据 (单位:件 ).若这两组数据的中位数相等,且平均值也相等,5名工人某日的则 x 和 y 的值分别为 ( )A .3,5B . 5,5C.3,7 D .5,7[解析 ] 由两组数据的中位数相等可得 65= 60+ y,解得 y= 5,又它们的平均值相等,所以1×[56+62+65+74+(70+x)]=1×(59+61+67+ 65+78),解得 x=3.55[答案 ] A[ 解题技法 ] 茎叶图的应用(1)茎叶图通常用来记录两位数的数据,可以用来分析单组数据,也可以用来比较两组数据.通过茎叶图可以确定数据的中位数,数据大致集中在哪个茎,数据是否关于该茎对称,数据分布是否均匀等.(2)给定两组数据的茎叶图,比较数字特征时,“重心”下移者平均数较大,数据集中者方差较小.[ 题组训练 ]1.在如图所示一组数据的茎叶图中,有一个数字被污染后模糊不清,数据的极差与中位数之和为 61,则被污染的数字为 ( )A.1 B.2C.3 D.4解析:选 B 由图可知该组数据的极差为48- 20=28,则该组数据的中位数为 61-28=33,易得被污染的数字为 2.2.甲、乙两名篮球运动员 5 场比赛得分的原始记录如茎叶图所示,若甲、乙两人的平均得分分别为x 甲,x 乙,则下列结论正确的是 ( )A. x 甲< x 乙;乙比甲得分稳定B. x甲> x 乙;甲比乙得分稳定C. x甲 > x 乙;乙比甲得分稳定D. x 甲< x 乙;甲比乙得分稳定2+7+8+ 16+22 8+12+18+21+ 25解析:选 A 因为 x 甲== 11, x 乙== 16.8,所以 x 甲< x 乙且乙比55甲成绩稳定.考点二频率分布直方图[典例]某城市 100 户居民的月平均用电量 (单位:千瓦时 ),以[160,180) ,[180,200) ,[200,220) ,[220,240) ,[240,260) ,[260,280) ,[280,300]分组的频率分布直方图如图.(1) 求直方图中 x 的值;(2)求月平均用电量的众数和中位数.[解] (1)由(0.002 + 0.009 5+0.011+0.012 5+x+0.005+0.002 5)×20=1,解得 x=0.0075. 即直方图中 x 的值为 0.007 5.220+ 240(2)月平均用电量的众数是= 230.∵(0.002+0.009 5+0.011)×20=0.45<0.5,(0.002+0.009 5+0.011+0.012 5)×20=0.7>0.5,∴月平均用电量的中位数在 [220,240) 内.设中位数为 a,则 0.45+0.012 5×(a-220)=0.5,解得 a= 224,即中位数为 224.[ 变透练清 ]1.某校随机抽取 20 个班,调查各班有出国意向的人数,所得数据的茎叶图如图所示.以 5 为组距将数据分组为 [0,5),[5,10),⋯,[30,35) , [35,40] ,所作的频率分布直方图是 ( )解析:选 A 以 5 为组距将数据分组为 [0,5) ,[5,10) ,⋯,[30,35) ,[35,40] ,各组的频数依次为 1,1,4,2,4,3,3,2,可知画出的频率分布直方图为选项 A 中的图.2. 变结论在本例条件下,在月平均电量为 [220,240) ,[240,260) ,[260,280) ,[280,300] 的四组用户中,用分层抽样的方法抽取 11 户居民,则月平均用电量在 [220,240) 的用户中应抽取 _____________________________________________________________________ 户.解析:月平均用电量在 [220,240) 的用户有 0.012 5 ×20×100 =25(户).同理可得月平均用电量在 [240,260) 的用户有 15 户,月平均用电量在 [260,280] 的用户有 10 户,月平均用电量在[280,300] 的用户有 5 户,故抽取比例为1125+ 15+ 101.5.答案: 53.我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年 100位居民每人的月均用水量 (单位:吨 ),将数据按照 [0,0.5),[0.5,1),⋯,[4,4.5]分成 9组,制成了如图所示的频率分布直方图.(1) 求直方图中 a 的值;(2)设该市有 30万居民,估计全市居民中月均用水量不低于 3 吨的人数,说明理由.解: (1)由频率分布直方图可知,月均用水量在 [0,0.5)的频率为 0.08×0.5=0.04.同理,在[0.5,1) ,[1.5,2) ,[2,2.5) ,[3,3.5) , [3.5,4) , [4,4.5] 6 组的频率分别为 0.08,0.21,0.25,0.06,0.04,0.02.由 1- (0.04+ 0.08+0.21+0.25+0.06+ 0.04+ 0.02) = 0.5× a+ 0.5×a,解得 a= 0.30.(2)估计全市居民中月均用水量不低于3 吨的人数为 3.6 万.理由如下:由(1)知, 100位居民中月均用水量不低于 3 吨的频率为 0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计30 万居民中月均用水量不低于3 吨的人数为300 000×0.12=36 000=3.6(万).考点三样本的数字特征考法 (一 ) 样本的数字特征与频率分布直方图交汇[典例 ] (2019 辽·宁师范大学附属中学模拟 )某校初三年级有 400 名学生,随机抽查了 40 名学生测试 1 分钟仰卧起坐的成绩 (单位:次 ),将数据整理后绘制成如图所示的频率分布直方图.用样本估计总体,下列结论正确的是 ( )A .该校初三学生1 分钟仰卧起坐的次数的中位数为 25B.该校初三学生1 分钟仰卧起坐的次数的众数为 24C.该校初三学生1 分钟仰卧起坐的次数超过 30 的人数约有 80D.该校初三学生1 分钟仰卧起坐的次数少于 20 的人数约为 8[解析 ] 第一组数据的频率为 0.02×5=0.1,第二组数据的频率为0.06×5=0.3,第三组数据的频率为0.08×5=0.4,∴中位数在第三组内,设中位数为25+x,则 x×0.08=0.5-0.1-0.3=0.1,∴ x =1.25,∴中位数为 26.25 ,故 A 错误;第三组数据所在的矩形最高,第三组数据的中间值为27.5,∴众数为27.5,故 B错误; 1 分钟仰卧起坐的次数超过 30 的频率为 0.2,∴超过 30 次的人数为 400×0.2=80,故 C 正确; 1分钟仰卧起坐的次数少于 20 的频率为 0.1,∴1 分钟仰卧起坐的次数少于 20 的人数为400×0.1= 40,故 D 错误.故选 C.[答案 ] C[ 解题技法 ]频率分布直方图与众数、中位数、平均数的关系(1)最高的小长方形底边中点的横坐标为众数;(2)中位数左边和右边的小长方形的面积和是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.考法 (二) 样本的数字特征与茎叶图交汇[典例 ] 将某选手的 9个得分去掉 1个最高分,去掉 1个最低分, 7 个剩余分数的平均分为91.现场作的 9 个分数的茎叶图后来有 1 个数据模糊,无法辨认,在图中以________________ x表示,则 7 个剩余分数的方差为.[解析 ] 由茎叶图可知去掉的两个数是 87,99,所以 87+90× 2+91× 2+94+90+x=91×7,解得 x=4.1 36故 s2=7[(87-91)2+(90-91)2×2+(91-91)2×2+(94-91)2×2]=7.[答案 ] 376[ 解题技法 ]样本的数字特征与茎叶图综合问题的注意点(1)在使用茎叶图时,一定要观察所有的样本数据,弄清楚这个图中数字的特点,不要漏掉了数据,也不要混淆茎叶图中茎与叶的含义.(2)茎叶图既可以表示两组数据,也可以表示一组数据,用它表示的数据是完整的数据,因此可以从茎叶图中看出数据的众数(数据中出现次数最多的数)、中位数(中间位置的一个数,或中间两个数的平均数)等.考法(三)样本的数字特征与优化决策问题交汇[典例 ] (2018 周·口调研)甲、乙两人在相同条件下各射击 10 次,每次中靶环数情况如图所示.(1)请填写下表(写出计算过程):(2)从下列三个不同的角度对这次测试结果进行分析:①从平均数和方差相结合看(分析谁的成绩更稳定);②从平均数和命中 9 环及 9 环以上的次数相结合看(分析谁的成绩好些);③从折线图上两人射击命中环数的走势看(分析谁更有潜力).[解 ] 由题图,知甲射击 10 次中靶环数分别为 9,5,7,8,7,6,8,6,7,7.将它们由小到大排列为 5,6,6,7,7,7,7,8,8,9.乙射击 10 次中靶环数分别为 2,4,6,8,7,7,8,9,9,10.将它们由小到大排列为 2,4,6,7,7,8,8,9,9,10.1(1) x 甲=10× (5+6×2+7×4+ 8×2+9)=7(环),1x 乙=10×(2+4+6+7× 2+8×2+9×2+10)=7(环),s2甲=110×[(5-7)2+(6- 7)2×2+(7- 7)2×4+(8-7)2×2+(9-7)2]=110×(4+2+0+2+4)=1.2,1s2乙=10×[(2-7)2+(4- 7)2+(6-7)2+(7-7)2×2+(8-7)2×2+(9-7)2×2+(10-7)2]=110×(25+9+1+0+2+8+ 9)= 5.4.填表如下:(2)①∵平均数相同, s2甲< s2乙,∴甲成绩比乙稳定.②∵平均数相同,命中 9 环及 9 环以上的次数甲比乙少,∴乙成绩比甲好些.③∵甲成绩在平均数上下波动,而乙处于上升势头,从第三次以后就没有比甲少的情况发生,∴乙更有潜力.[解题技法]利用样本的数字特征解决优化决策问题的依据(1)平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.(2)用样本估计总体就是利用样本的数字特征来描述总体的数字特征.[题组训练]1.对某商店一个月内每天的顾客人数进行统计,得到样本的茎叶图(如图所示 ),则该样本中的中位数、众数、极差分别是 ( )C .47,45,56极差为 68- 12=56,故选 A.2.甲、乙、丙、丁四人参加某运动会射击项目选拔赛,四人的平均成绩和方差如下表所示:从这四个人中选择一人参加该运动会射击项目比赛,最佳人选是 ( )A .甲 C .丙解析: 选 C 由表格中数据可知,乙、丙平均环数最高,但丙方差最小,说明成绩好,且技术稳定,选 C.3.某仪器厂从新生产的一批零件中随机抽取 40 个进行检测,如图是根据抽样检测得到的零件的质量(单位:克)绘制的频率分布直方图,样本数据按照 [80,82) ,[82,84) ,[84,86) ,[86,88) ,[88,90) ,[90,92) ,[92,94) ,[94,96]分成 8 组,将其按从左到右的顺序分别记为第一组,第二组,⋯⋯,第八组.则样本数据的中位数在 第 组.解析:由题图可得, 前四组的频率为 (0.037 5+ 0.062 5+0.075 0+ 0.100 0)× 2= 0.55,则其频数为 40×0.55 =22,且第四组的频数为 40×0.100 0×2=8,故中位数在第四组.答案: 四D .45,47,53 解析: 选 A 样本共 30 个,中位数为 45+47= 46;显然样本数据出现次数最多的为45,故众数为 45; B .乙 D .丁[课时跟踪检测]A级1.一个频数分布表 (样本容量为则估计样本在 [40,60) 内的数据30)不小心被损坏了一部分,只记得样本中数据在[20,60) 上的频率为 0.8,()A .14B . 15C.16 D .17解析:选 B 由题意,样本中数据在 [20,60) 上的频数为 30×0.8=24,所以估计样本在[40,60)内的数据个数为 24-4- 5=15.2.(2019 ·长春质检 )如图所示是某学校某年级的三个班在一学期内的六次数学测试的平均成绩y 关于测试序号 x 的函数图象,为了容易看出一个班级的成绩变化,将离散的点用虚线连接,根据图象,给出下列结论:①一班成绩始终高于年级平均水平,整体成绩比较好;②二班成绩不够稳定,波动程度较大;③三班成绩虽然多数时间低于年级平均水平,但在稳步提升.其中正确结论的个数为 ( )A.0 B.1C.2 D.3解析:选 D ①由图可知一班每次考试的平均成绩都在年级平均成绩之上,故①正确.②由图可知二班平均成绩的图象高低变化明显,可知成绩不稳定,波动程度较大,故②正确.③由图可知三班平均成绩的图象呈上升趋势,并且图象的大部分都在年级平均成绩图象的下方,故③正确.故选 D.3.(2018 ·贵阳检测)在某中学举行的环保知识竞赛中,将三个年级参赛学生的成绩进行整理后分为 5 组,绘制如图所示的频率分布直方图,图中从左到右依次为第一、第二、第三、第四、第五小组,已知第二小组的频数是 40,则成绩在 80~100 分的学生人数是()A .15 B.18C.20 D.25解析:选 A 根据频率分布直方图,得第二小组的频率是 0.04×10=0.4,∵频数是 40,∴样本容量是400.4 =100,又成绩在 80~ 100 分的频率是(0.01+0.005)×10=0.15,∴成绩在 80~100 分的学生人数是 100×0.15 = 15.故选 A.4.2017 年 4 月,泉州有四处湿地被列入福建省首批重要湿地名录,其中 A,B 两地选择一处进行实地考察.因此,他通过网站了解上周去过的人对它们的综合评分,并将评分数据记录为右图的茎叶图,记A,数据的均值分别为 x A, x B,方差分别为 s A2, s2B.若以备受好评为依据,某B两同学决定从这两个地方地综合评分则下述判断较合理的是(A .因为 x A> x B, s2A>s B2,所以应该去 A地 B.因为 x A> x B, s2A < s2B,所以应该去 A 地 C.因为 x A< x B, s2A > s2B,所以应该去B 地D .因为x A< x B,s2A<s B2,所以应该去 B 地11解析:选 B 因为 x A=×(72+86+87+89+ 92+94)≈86.67, x B=×(74+73+88+86+95+94)=。

高考数学二轮总复习专题训练十六 统计、统计案例 理

高考数学二轮总复习专题训练十六 统计、统计案例 理

高考专题训练十六 统计、统计案例班级_______ 姓名_______ 时间:45分钟 分值:75分 总得分________一、选择题:本大题共6小题,每小题5分,共30分.在每小题给出的四个选项中,选出符合题目要求的一项填在答题卡上.1.(2011·湖南)通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:K 2=n a +b c +d a +c b +d 算得,K 2=110×40×30-20×20260×50×60×50=7.8.附表:A .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”B .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”C .有99%以上的把握认为“爱好该项运动与性别有关”D .有99%以上的把握认为“爱好该项运动与性别无关”解析:∵K 2=7.8>6.635,而P (K 2≥6.635)=0.010,∴有99%以上的把握认为“爱好该运动与性别有关”.答案:C2.(2011·江西)变量X 与Y 相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U 与V 相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1),r 1表示变量Y 与X 之间的线性相关系数,r 2表示变量V 与U 之间的线性相关系数,则( )A .r 2<r 1<0B .0<r 2<r 1C .r 2<0<r 1D .r 2=r 1解析:作出x ,y 对应散点图可知y 与x 正相关, ∴r 1>0.作出U ,V 对应散点图可知U 与V 负相关, ∴r 2<0.∴r 2<0<r 1. 答案:C3.(2011·安徽“江南十校”联考)已知一组正数x 1,x 2,x 3,x 4的方差为s 2=14(x 21+x 22+x 23+x 24-16),则数据x 1+2,x 2+2,x 3+,x 4+2的平均数为( )A .2B .3C .4D .6解析:∵s 2=14(x 21+x 22+x 23+x 24-16)=14[(x 1-x )2+(x 2-x )2+(x 3-x )2+(x 4-x )2],∴2x (x 1+x 2+x 3+x 4)-4x 2=16,∴8x 2-4x 2=16,x =2,即x 1+x 2+x 3+x 4=8,∴x 1+2+x 2+2+x 3+2+x 4+24=4.故选C.答案:C4.(2011·邹城一中模拟)在2011年12月12日那天,济宁市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,5家商场的售价x 元和销售量y 件之间的一组数据如下表所示:y ^=-3.2x +a ,则a =( )A .24B .35.6C .40.5D .40解析:可解得样本中心为(10,8),代入回归方程可得a =40. 答案:D5.(2011·哈师大附中、东北师大附中、辽宁省实验中学高三第一次联合模拟)下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变; ②设有一个回归方程y ^=3-5x ,变量x 增加一个单位时,y 平均增加5个单位; ③线性回归方程y ^=b ^x +a ^必过(x ,y );④在一个2×2列联表中,由计算得K 2=13.079,则有99%的把握确认这两个变量间有关系.其中错误的个数是( ) A .0 B .1 C .2 D .3本题可以参考独立性检验临界值表:映数据的波动程度的量),①正确;回归方程中x 的系数具备直线斜率的功能,对于回归方程y ^=3-5x ,当x 增加一个单位时,y 平均减少5个单位,②错误;由线性回归方程的定义知,线性回归方程y ^=b ^x +a ^必过点(x ,y ),③正确;因为K 2=13.079>10.828,故有99%的把握确认这两个变量有关系,④正确.故选B.答案:B6.甲、乙两名运动员的5次测试成绩如下图所示设s 1,s 2分别表示甲、乙两名运动员测试成绩的标准差,x 1,x 2分别表示甲、乙两名运动员测试成绩的平均数,则有( )A.x 1=x 2,s 1<s 2B.x 1=x 2,s 1>s 2C.x 1>x 2,s 1>s 2D.x 1=x 2,s 1=s 2解析:x 1=15(17+15+22+28+28)=22,x 2=15(16+18+23+26+27)=22,s 21=15(25+49+0+36+36)=29.2,s 22=15(36+16+1+9+25)=17.4,故选B.答案:B二、填空题:本大题共4小题,每小题5分,共20分,把答案填在题中横线上. 7.(2011·天津)一支田径队有男运动员48人,女运动员36人.若用分层抽样的方法从该队的全体运动员中抽取一个容量为21的样本,则抽取男运动员的人数为________.解析:由题意知,这支田径队共有84人,从中抽取21人,抽样比为2184=14.所以从男运动员中应抽取14×48=12人.答案:128.(2011·广东)某数学老师身高176 cm ,他爷爷、父亲和儿子的身高分别为173 cm 、170 cm 和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为________cm.解析:记从爷爷起向下各代依次为1,2,3,4,5用变量x 表示,其中5代表孙子. 各代人身高为变量x ,则有计算知x =2.5,y =175.25b ^=∑4i =1x i -x y i -y ∑4i =1x i -x 2=278+218+38+81894+14+14+94=3.3,a ^=y -b ^x =175.25-3.3×2.5=167∴回归方程为y ^=3.3x +167当x =5时,y =3.3×5+167=183.5. 答案:183.59.(2011·济宁市高三模拟)为了解某班学生喜爱打篮球是否与性别有关,对该班50名学生进行了问卷调查,得到了如下的2×2列联表:附:K 2=n ad -bc 2a +bc +d a +c b +d答案:99.5%10.(2011·南京市高三第一次模拟考试)某校为了解高三男生的身体状况,检测了全部480名高三男生的体重(单位:kg),所得数据都在区间[50,75]中,其频率分布直方图如图所示.若图中从左到右的前3个小组的频率之比为1:2:3,则体重小于60 kg 的高三男生人数为________.解析:依题意得,后两个小组的频率之和等于(0.0125+0.0375)×5=0.25,因此前三个小组的频率之和等于1-0.25=0.75,前两个小组的频率之和等于1+21+2+3×34=38,所以体重小于60 kg 的高三男生人数为480×38=180.答案:180三、解答题:本大题共2小题,共25分.解答应写出文字说明、证明过程或演算步骤. 11.(12分)(2011·北京) 以下茎叶图记录了甲、乙两组各四名同学的植树棵数.乙组记录中有一个数据模糊,无法确认,在图中以X 表示.(1)如果X =8,求乙组同学植树棵数的平均数和方差;(2)如果X =9,分别从甲、乙两组中随机选取一名同学,求这两名同学的植树总棵数Y 的分布列和数学期望.(注:方差s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2],其中x 为x 1,x 2,…,x n为平均数)解:(1)当X =8时,由茎叶图可知,乙组同学的植树棵数是:8,8,9,10.所以平均数为x =8+8+9+104=354方差为s 2=14⎣⎢⎡⎦⎥⎤⎝ ⎛⎭⎪⎫8-3542+⎝ ⎛⎭⎪⎫8-3542+⎝ ⎛⎭⎪⎫9-3542+⎝ ⎛⎭⎪⎫10-3542=1116. (2)当X =9时,由茎叶图可知,甲组同学的植树棵数是:9,9,11,11;乙组同学的植树棵数是:9,8,9,10,分别从甲、乙两组中随机选取一名同学,共有4×4=16种可能的结果,这两名同学植树总棵数Y 的可能取值为17,18,19,20,21.事件“Y =17”等价于“甲组选出的同学植树9棵,乙组选出的同学植树8棵”,所以该事件有2种可能的结果,因此P (Y =17)=216=18.同理可得P (Y =18)=14;P (Y =19)=14;P (Y =20)=14;P (Y =21)=18.所以随机变量Y 的分布列为:E (Y )=17×P (Y +21×P (Y =21)=17×18+18×14+19×14+20×14+21×18=19.12.(13分)2011年3月,日本发生了9.0级地震,地震引发了海啸及核泄漏.某国际组织用分层抽样的方法从心理专家、核专家、地质专家三类专家中抽取若干人组成研究团队赴日本工作,有关数据见表1(单位:人).表1只羊进行了检测,并将有关数据整理为不完整的2×2列联表(表2).表2参考公式:①K 2=a +b c +d a +c b +d ;②χ2=11221221n 1++n 2++n +1+n +2.(1)求研究小组的总人数;(2)写出表2中A 、B 、C 、D 、E 的值,并判断有多大的把握认为羊受到高度辐射与身体不健康有关;(3)若从研究团队的心理专家和核专家中随机选2人撰写研究报告,求其中恰有1人为心理专家的概率.解:(1)依题意,726=48y =24x ,解得y =4,x =2.研究团队的总人数为2+4+6=12(人).(2)根据列联表特点得A =20,B =50,C =80,D =30,E =110. 可求得K 2=110×30×10-50×20250×60×80×30≈7.486>6.635.由临界值表知,有99%的把握认为羊受到高度辐射与身体不健康有关.(3)设研究小组中心理专家为a 1、a 2,核专家为b 1、b 2、b 3、b 4,从中随机选2人,不同的选取结果有:a 1a 2、a 1b 1、a 1b 2、a 1b 3、a 1b 4、a 2b 1、a 2b 2、a 2b 3、a 2b 4、b 1b 2、b 1b 3、b 2b 3、b 1b 4、b 2b 4、b 3b 4,共15种.其中恰好有1人来自心理专家的结果有:a 1b 1、a 1b 2、a 1b 3、a 1b 4、a 2b 1、a 2b 2、a 2b 3、a 2b 4共8种.所以恰好有1人来自心理专家的概率为P =815.。

统计与统计案例练习题及知识点总结(全面)-高考数学

统计与统计案例练习题及知识点总结(全面)-高考数学

统计与统计案例练习题与知识点总结1.为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:根据此频率分布直方图,下面结论中不正确的是()A.该地农户家庭年收入低于4.5万元的农户比率估计为6%B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%C.估计该地农户家庭年收入的平均值不超过6.5万元D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间【答案】C【分析】根据直方图的意义直接计算相应范围内的频率,即可判定ABD,以各组的中间值作为代表乘以相应的频率,然后求和即得到样本的平均数的估计值,也就是总体平均值的估计值,计算后即可判定C.【详解】因为频率直方图中的组距为1,所以各组的直方图的高度等于频率.样本频率直方图中的频率即可作为总体的相应比率的估计值.该地农户家庭年收入低于4.5万元的农户的比率估计值为0.020.040.066%+==,故A 正确;该地农户家庭年收入不低于10.5万元的农户比率估计值为0.040.0230.1010%+⨯==,故B 正确;该地农户家庭年收入介于4.5万元至8.5万元之间的比例估计值为0.100.140.2020.6464%50%++⨯==>,故D 正确;该地农户家庭年收入的平均值的估计值为30.0240.0450.1060.1470.2080.2090.10100.10110.04120.02130.02140.027.68⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯=(万元),超过6.5万元,故C 错误.综上,给出结论中不正确的是C.故选:C.【点睛】本题考查利用样本频率直方图估计总体频率和平均值,属基础题,样本的频率可作为总体的频率的估计值,样本的平均值的估计值是各组的中间值乘以其相应频率然后求和所得值,可以作为总体的平均值的估计值.注意各组的频率等于⨯频率组距组距.2.甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:一级品二级品合计甲机床15050200乙机床12080200合计270130400(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?(2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?附:22()()()()()n ad bc K a b c d a c b d -=++++()2P K k ≥0.0500.0100.001k3.8416.63510.828【答案】(1)75%;60%;(2)能.【分析】本题考查频率统计和独立性检验,属基础题,根据给出公式计算即可【详解】(1)甲机床生产的产品中的一级品的频率为15075% 200=,乙机床生产的产品中的一级品的频率为12060% 200=.(2)()22400150801205040010 6.63527013020020039K⨯-⨯==>>⨯⨯⨯,故能有99%的把握认为甲机床的产品与乙机床的产品质量有差异.1.随机抽样(1)简单随机抽样:一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.(2)分层抽样:一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.2.用样本的频率分布估计总体分布(1)在频率分布直方图中,纵轴表示频率/组距,数据落在各小组内的频率用各小长方形的面积表示.各小长方形的面积的总和等于1.(2)频率分布折线图和总体密度曲线①频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.②总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线.(3)茎叶图茎是指中间的一列数,叶是从茎的旁边生长出来的数.3.用样本的数字特征估计总体的数字特征(1)众数:一组数据中出现次数最多的数.(2)中位数:将数据从小到大排列,若有奇数个数,则最中间的数是中位数;若有偶数个数,则中间两数的平均数是中位数.(3)平均数:x=x1+x2+…+x nn,反映了一组数据的平均水平.(4)标准差:是样本数据到平均数的一种平均距离,s=1[x1-x2+x2-x2+…+x n-x2].n[(x1-x)2+(x2-x)2+…+(x n-x)2](x n是样本数据,n是样本容量,x是样本平均数).(5)方差:s2=1n4.相关关系与回归方程(1)相关关系的分类①正相关在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关.②负相关在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关.(2)线性相关关系如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.(3)回归方程①最小二乘法求回归直线,使得样本数据的点到它的距离的平方和最小的方法叫做最小二乘法.②回归方程方程y ^=b ^x +a ^是两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )的回归方程,其中a ^,b ^是待定参数.(4)回归分析①定义:对具有相关关系的两个变量进行统计分析的一种常用方法.②样本点的中心对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其中(x ,y )称为样本点的中心.③相关系数当r >0时,表明两个变量正相关;当r <0时,表明两个变量负相关.r 的绝对值越接近于1,表明两个变量的线性相关性越强.r 的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r |大于0.75时,认为两个变量有很强的线性相关性.5.独立性检验(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.(2)列联表:列出的两个分类变量的频数表,称为列联表.假设有两个分类变量X 和Y ,它们的可能取值分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(称为2×2列联表)为2×2列联表y 1y 2总计x 1a b a +b x 2c d c +d 总计a +cb +da +b +c +d构造一个随机变量K 2=n ad -bc 2a +bc +d a +cb +d,其中n =a +b +c +d 为样本容量.(3)独立性检验:利用随机变量K 2来判断“两个分类变量有关系”的方法称为独立性检验.1.如图为国家统计局2021年1月19日发布的2020年各季度社会消费品零售总额及增速,则下列说法:①各季度社会消费品零售总额增速最快的是4季度;②各季度社会消费品零售总额增速最快的是2季度;③各季度社会消费品零售总额增量最大的是4季度;④各季度社会消费品零售总额增量最大的是2季度.其中所有正确说法的序号为()A.①④B.②③C.①③D.②④2.下图是2020年我国居民消费价格月度涨跌幅度图(来源于国家统计局网站)下列说法错误的是()A.1~12月月度同比的平均值为2.55B .1~12月月度环比的平均值为负数C .1~12月月度同比整体为下降趋势D .1~12月月度环比的方差大于月度同比的方差3.已知相关变量x 和y 的散点图如图所示,若用()11ln y b k x =⋅与22y kx b =+拟合时的相关系数分别为12,r r 则比较12,r r 的大小结果为()A .12r r >B .12r r =C .12r r <D .不确定4.下列说法中错误的个数是①某校共有女生2021人,用简单随机抽样的方法先剔除21人,再按系统抽样的方法抽取为200人,则每个女生被抽到的概率为110;②由样本数据得到的回归直线方程y bx a =+$$$必经过样本中心点()x y ;③如果落在回归直线上的样本点越多,则回归直线方程的拟合效果就越好;④在一个2×2列联表中,由计算得出220.21K =,而()210.8280.001P K ≥≈,则在犯错误的概率不超过0.001的前提下认为这两个变量之间有相关关系.()A .1B .2C .3D .45.质检机构为检测一大型超市某商品的质量情况,从编号为1~120的该商品中利用系统抽样的方法抽8件进行质检,若所抽样本中含有编号67的商品,则下列编号一定被抽到的是()A .112B .53C .38D .96.2020年是全面实现小康社会目标的一年,也是全面打赢脱贫攻坚战的一年,某研究性学习小组调查了某脱贫县的甲、乙两个家庭,对他们过去6年(2014年到2019年)的家庭收入情况分别进行统计,发现他们的收入逐年增长,得到这两个家庭的年人均纯收入(单位:百元/人)茎叶图.对甲、乙两个家庭的年人均纯收入(以下分别简称“甲”“乙”)情况的判断,不正确的是()A.过去的6年,“甲”的极差小于“乙”的极差B.过去的6年,“甲”的平均值小于“乙”的平均值C.过去的6年,“甲”的中位数小于“乙”的中位数D.过去的6年,“甲”的平均增长率小于“乙”的平均增长率7.为了普及新冠肺炎知识,增强疫情防控意识,某学校从高一和高二两个年级各抽取5位同学参加新冠肺炎知识测试,得分(十分制)情况如下表所示,则下列描述正确的是()高一年级组高二年级组得分45678得分569频数11111频数311A.高一年级组数据的平均数为6分,高二年级组数据的平均数为5分B.两组数据的中位数都是6分C.高一年级组数据的极差小于高二年级组数据的极差D.高一年级组成绩的方差小于高二年级组成绩的方差8.某中学2018年的高考考生人数是2015年高考考生人数的1.5倍,为了更好地对比该校考生的升学情况,统计了该校2015年和2018年的高考情况,得到如图柱状图:则下列结论正确的是()A.与2015年相比,2018年一本达线人数减少B .与2015年相比,2018年二本达线人数增加了0.5倍C .2015年与2018年艺体达线人数相同D .与2015年相比,2018年不上线的人数有所增加9.m 个数据的平均数为a ,中位数为b ,方差为c .若将这m 个数据均扩大到原来的2倍得到一组新数据,则下列关于这组新数据的说法正确的是()A .平均数为aB .中位数为2bC D .方差为2c10.已知变量y 关于x 的回归方程为0.5bx y e -=,其一组数据如表所示:若5x =,则预测y 值可能为()x1234ye3e 4e 6e A .5e B .112e C .7e D .152e 11.给出下列说法:①回归直线ˆˆˆy bx a =+恒过样本点的中心(x y ,且至少过一个样本点;②两个变量相关性越强,则相关系数||r 就越接近1;③将一组数据的每个数据都加一个相同的常数后,方差不变;④在回归直线方程ˆ20.5yx =-中,当解释变量x 增加一个单位时,预报变量ˆy 平均减少0.5个单位.其中说法正确的是()A .①②④B .②③④C .①③④D .②④12.在一次对性别与是否说谎有关的调查中,得到如下数据,根据表中数据判断如下结论中正确的是()性别说谎不说谎总计男6713女8917总计141630A .在此次调查中有95%的把握认为是否说谎与性别有关B .在此次调查中有99%的把握认为是否说谎与性别有关C .在此次调查中有99.5%的把握认为是否说谎与性别有关D .在此次调查中没有充分证据显示说谎与性别有关13.下列四个命题中,正确的有()①两个变量间的相关系数r 越小,说明两变量间的线性相关程度越低;②命题“x ∃∈R ,使得210x x ++<”的否定是:“对x ∀∈R ,均有210x x ++>”;③命题“p g ∧为真”是命题“p q ∨为真”的必要不充分条件;④若函数322()3f x x ax bx a =+++在1x =-有极值0,则2a =,9b =或1a =,3b =.A .0B .1C .2D .314.某中学共有1000人,其中男生700人,女生300人,为了了解该校学生每周平均体育锻炼时间的情况以及经常进行体育锻炼的学生是否与性别有关(经常进行体育锻炼是指:周平均体育锻炼时间不少于4小时),现在用分层抽样的方法从中收集200位学生每周平均体育锻炼时间的样本数据(单位:小时),其频率分布直方图如图.已知在样本数据中,有40位女生的每周平均体育锻炼时间超过4小时,根据独立性检验原理()附:()()()()()22n ad bc K a c b d a d b c -=++++,其中n a b c d =+++.()20P K k ≥0.100.050.010.0050k 2.7063.8416.6357.879A .有95%的把握认为“该校学生每周平均体育锻炼时间与性别无关”B .有90%的把握认为“该校学生每周平均体育锻炼时间与性别有关”C .有90%的把握认为“该校学生每周平均体育锻炼时间与性别无关”D .有95%的把握认为“该校学生每周平均体育锻炼时间与性别有关”15.下图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的概率为()A.0.2B.0.4C.0.5D.0.616.设一组样本数据x1,x2,…,x n的方差为0.01,则数据10x1,10x2,…,10x n的方差为()A.0.01B.0.1C.1D.1017.下图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件)若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为A.5,5B.3,5C.3,7D.5,718.某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):锻炼人次[0,200](200,400](400,600]空气质量等级1(优)216252(良)510123(轻度污染)6784(中度污染)720(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?人次≤400人次>400空气质量好空气质量不好附:22()()()()()n ad bcKa b c d a c b d-=++++,P(K2≥k)0.0500.0100.001k 3.841 6.63510.82819.某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:满意不满意男顾客4010女顾客3020(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?附:22()()()()()n ad bcKa b c d a c b d-=++++.P(K2≥k)0.0500.0100.001k 3.841 6.63510.82820.为调查某地区老人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:是否需要志愿性别男女需要4030不需要160270(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?(3)根据(2)的结论,能否提供更好的调查方法来估计该地区老年人,需要志愿帮助的老年人的比例?说明理由附:1.C 【分析】根据折线统计图比较各季度社会消费品零售总额增速,可判断①②的正误;计算各季度社会消费品零售总额增量,可判断③④的正误.【详解】第1季度社会消费品零售总额增速为19.0%-,第2季度社会消费品零售总额增速为 3.9%-,第3季度社会消费品零售总额增速为0.9%,第4季度社会消费品零售总额增速为4.6%,故①正确,②错误;第2季度社会消费品零售总额增量为9.377.86 1.51-=(万亿元),第3季度社会消费品零售总额增量为10.119.370.74-=(万亿元),第4季度社会消费品零售总额增量为11.8710.11 1.76-=(万亿元).故③正确,④错误.故选:C.2.D 【分析】根据图表数据计算平均数,然后判断A 和B ;根据图表数据的变化趋势判断C 和D.【详解】同比平均数:()5.4 5.2 4.3 3.3 2.4 2.5 2.7 2.4 1.70.50.50.72.5512++++++++++-+=,环比平均数:()()()()()()1.40.8 1.20.90.80.10.60.40.20.30.60.20.02512++-+-+-+-++++-+-+=-,1-12月月度同比的平均值为2.55,选项A 正确;1~12月月度环比的平均值为0.025-,选项B 正确;观察图表可以得出,1~12月月度同比整体为下降趋势,选项C 正确;1~12月月度环比的波动小于月度同比的波动,选项D 错误.故选:D .3.C 【分析】由散点图可知,对数形式的拟合程度高,再根据负相关,比较两个相关系数大小.【详解】由散点图可知,()11ln y b k x =拟合比用22y k x b =+拟合的程度高,故12r r >;又因为此关系为负相关,1212,r r r r ∴->-<故选:C 4.B 【分析】由古典概型的特征可判断①;由回归直线方程的特征可判断②③;由独立性检验思想可判断④.【详解】①错误,古典概率中,每个个体被抽的概率都是一样的,都等于2002021;②正确由回归直线方程的特征可知回归直线方程y bx a =+$$$必经过样本中心点(),x y ;③错误,落在回归直线附近的样本点越多,则回归直线方程的拟合效果越好;④正确,当220.21K =,而()210.8280.001P K ≥≈,则在犯错误的概率不超过0.001的前提下认为这两个变量之间有相关关系所以错误个数为2.故选:B.5.A 【分析】根据系统抽样的特征,结合所给编号求出第一组抽取商品编号,即可求解.【详解】由题意知,组距为120158=,设第一组抽取编号为k ,则第n 组抽取的编号为15(1)n k -+,样本中含有编号67的商品,即15(51)67k ⨯-+=,可得7k =,因为1577112⨯+=,即第8组中抽取商品的编号为112.故选:A 6.B 【分析】对茎叶图进行数据分析,分别计算极差、平均数、中位数、及平均增长率,依次判断四个选项.【详解】对于A ,甲的极差为42366-=,乙的极差为41347-=,所以“甲”的极差小于“乙”的极差,A 正确;对于B ,甲的平均数是1230(363737384042)66⨯+++++=,乙的平均数为1228(343638394041)66⨯+++++=,所以“甲”的平均值大于“乙”的平均值,B 错误;对于C ,甲的中位数是1(3738)37.52⨯+=,乙的中位数是1(3839)38.52⨯+=,所以,“甲”的中位数小于“乙”的中位数,C 正确;对于D ,设过去6年甲的平均增长率为x ,则()636142x +=,解得:1x =-,即过去61-;1-.因为42413634<,所以“甲”的平均增长率小于“乙”的平均增长率,D 正确.故选:B.7.D 【分析】根据表中数据,依次讨论各选项即可得答案.【详解】对于A 选项,高一年级和高二年级的平均分均为6分,故A 选项错误;对于B 选项,高一年级的中位数是6,高二年级的中位数是5,故B 选项错误;对于C 选项,高一年级的极差为4,高二年级的极差为3,故高一年级组数据的极差大于高二年级组数据的极差,故C 选项错误;对于D 选项,高一年成绩的方差为()()()()()2222221465666768625S ⎡⎤=-+-+-+-+-=⎣⎦,高二年级成绩的方差为()()()222213566696 2.45S ⎡⎤=-+-+-=⎣⎦,满足,故D 选项正确;故选:D 8.D 【分析】设2015年该校参加高考的人数为S ,则2018年该校参加高考的人数为1.5S ,观察柱状统计图,找出各数据,再利用各数量间的关系列式计算得到【详解】设2015年该校参加高考的人数为S ,则2018年该校参加高考的人数为1.5S.对于选项A :2015年一本达线人数为0.28S ,2018年一本达线人数为0.24×1.5S =0.36S ,可见一本达线人数增加了,故A 错误;对于选项B :2015年二本达线人数为0.32S ,2018年二本达线人数为0.4×1.5S =0.6S ,显然2018年二本达线人数不是增加了0.5倍,故B 错误;对于选项C :2015年和2018年艺体达线率没变,但是人数是不相同的,故C 错误;对于选项D :2015年不上线人数为0.32S ,2018年不上线人数为0.28×1.5S=0.42S ,不达线人数有所增加,故D 正确.故选:D 9.B 【分析】m 个12,,,n x x x 数据的平均数为a ,中位数为b ,方差为c .若将这m 个数据均扩大到原来的2倍得到一组新数据122,2,,2n x x x ,根据平均数、中位数、方差、标准差的定义进行判断即可.【详解】m 个12,,,n x x x 数据的平均数为a ,中位数为b ,方差为c .若将这m 个数据均扩大到原来的2倍得到一组新数据122,2,,2n x x x ,则由于平均数为所有数之和除以m ,故平均数变为2a ,故A 错;中位数为这组数从小到大排列后中间的那个数或中间两数和的平均数,由于每个数都变为原来2倍,所以中位数也变为原来的2倍,即2b ,故B 对;方差描述的是这组数的波动情况,12,,,n x x x 的方差为c ,则122,2,,2n x x x 的方差为224c c =2c =,故C,D 错;故选:B 【点睛】熟悉平均数、中位数、方差、标准差的概念,特别是一组数据扩大某个倍数或增加某个数值的情况下,平均数、中位数、方差、标准差的变化.10.D 【分析】将回归方程左右同时取对数得:ln 0.5y bx =-,看作回归直线的形式,由回归直线过样本中心点可构造方程求得b ,由此得到回归方程;将5x =代入回归方程即可求得结果.【详解】由0.5bx y e-=得:ln 0.5y bx =-,346ln ln ln ln 12340.544e e e e b ++++++∴=⋅-,解得: 1.6b =,∴回归方程为 1.60.5x y e -=,若5x =,则1580.52y e e -==.故选:D.【点睛】关键点点睛:本题考查非线性回归中的预估值的求解,解题关键是能够通过对指数型回归模型左右同时取对数,将其变为线性回归的形式来进行求解.11.B 【分析】①中,根据回归直线方程的特征,可判定是不正确;②中,根据相关系数的意义,可判定是是正确的;③中,根据方差的计算公式,可判定是正确的;④中,根据回归系数的含义,可判定是正确的.【详解】对于①中,回归直线ˆˆˆy bx a =+恒过样本点的中心(x y ,但不一定过一个样本点,所以不正确;对于②中,根据相关系数的意义,可得两个变量相关性越强,则相关系数||r 就越接近1,所以是正确的;对于③中,根据方差的计算公式,可得将一组数据的每个数据都加一个相同的常数后,方差是不变的,所以是正确的;对于④中,根据回归系数的含义,可得在回归直线方程ˆ20.5yx =-中,当解释变量x 增加一个单位时,预报变量ˆy平均减少0.5个单位,所以是正确的.故选:B.【点睛】本题主要考查了统计知识的相关概念及判定,其中解答中熟记回归直线方程的特征,回归系数的含义,相关系数的意义,以及方程的计算方法是解答的关键,属于基础题.12.D 【解析】根据上表数据可求得20.027 1.323k ≈<,再结合课本上的概率附表可知在此次调查中没有充分证据显示说谎与性别有关,故选D 13.A 【分析】根据相关系数的定义可知①错误;根据特称命题(又叫存在性命题)的否定可知②错误;根据真值表即可判断“p q ∧为真”是命题“p q ∨为真”的充分不必要条件,故③错误;由条件可得,(1)0,(1)0,f f '-=-=解得a=2,b=9或a=1,b=3,经检验,当a=1,b=3时,22()3633(1)0f x x x x '=++=+≥恒成立,此时()f x 没有极值点,故④错误。

高中数学第九章统计考点题型与解题方法(带答案)

高中数学第九章统计考点题型与解题方法(带答案)

高中数学第九章统计考点题型与解题方法单选题1、某工厂一年中各月份的收入、支出情况的统计如图所示,下列说法中错误的是()A.收入最高值与收入最低值的比是3︰1B.结余最高的月份是7月C.1至2月份的收入的变化率与4至5月份的收入的变化率相同D.前6个月的平均收入为40万元答案:D分析:根据统计图对选项逐一分析,由此确定说法错误的选项.最高收入90万元,最低收入30万元,所以A正确.结余最高的为7月,结余60万元,所以B正确.根据两点连线的斜率可知,1至2月份的收入的变化率与4至5月份的收入的变化率相同,所以C正确.前6个月的平均收入为40+60+30+30+50+60=45万元,所以D选项错误.6故选:D2、在样本的频率分布直方图中,一共有n(n≥4,n∈Z)个小矩形,第4个小矩形的面积等于其余(n−1)个,则第4个小矩形对应的频率为()小矩形面积和的37A.0.3B.0.4C.0.5D.0.7答案:A(1−x),解方程可分析:设第4个小矩形对应的频率为x,然后根据频率分布直方图的性质和题意可得x=37得结果设第4个小矩形对应的频率为x,则其余(n−1)个小矩形对应的频率为1−x,(1−x),解得x=0.3.所以x=37故选:A.3、下列调查中,适合普查的是()A.一批手机电池的使用寿命B.中国公民保护环境的意识C.你所在学校的男女同学的人数D.了解全国人民对建设高铁的意见答案:C分析:根据抽样调查和普查的特点即可判断.由题调查一批手机电池的使用寿命,中国公民保护环境的意识,了解全国人民对建设高铁的意见适合用抽样调查,调查所在学校的男女同学的人数适合普查.故选:C.4、m个数据的平均数为a,中位数为b,方差为c.若将这m个数据均扩大到原来的2倍得到一组新数据,则下列关于这组新数据的说法正确的是()A.平均数为a B.中位数为2b C.标准差为√2c D.方差为2c答案:B分析:m个x1,x2,⋯,x n数据的平均数为a,中位数为b,方差为c.若将这m个数据均扩大到原来的2倍得到一组新数据2x1,2x2,⋯,2x n,根据平均数、中位数、方差、标准差的定义进行判断即可.m个x1,x2,⋯,x n数据的平均数为a,中位数为b,方差为c.若将这m个数据均扩大到原来的2倍得到一组新数据2x1,2x2,⋯,2x n,则由于平均数为所有数之和除以m,故平均数变为2a,故A错;中位数为这组数从小到大排列后中间的那个数或中间两数和的平均数,由于每个数都变为原来2倍,所以中位数也变为原来的2倍,即2b,故B对;方差描述的是这组数的波动情况,x1,x2,⋯,x n的方差为c,则2x1,2x2,⋯,2x n的方差为22c=4c,标准差为√22c=2c,故C,D错;故选:B小提示:熟悉平均数、中位数、方差、标准差的概念,特别是一组数据扩大某个倍数或增加某个数值的情况下,平均数、中位数、方差、标准差的变化.5、抽样统计甲射击运动员10次的训练成绩分别为86,85,88,86,90,89,88,87,85,92,则这10次成绩的80%分位数为()A.88.5B.89C.91D.89.5答案:D分析:将数据从小到大排列,计算10×80%=8,得到答案.甲射击运动员10次的训练成绩从小到大分别为:85,85,86,86,87,88,88,89,90,92.10×80%=8,这10次成绩的80%分位数为:89+90=89.5.2故选:D.6、某汽车制造厂分别从A,B两类轮胎中各随机抽取了6个进行测试,下面列出了每一个轮胎行驶的最远里程(单位:103km).A类轮胎:94,96,99,99,105,107.B类轮胎:95,95,98,99,104,109.根据以上数据,下列说法正确的是()A.A类轮胎行驶的最远里程的众数小于B类轮胎行驶的最远里程的众数B.A类轮胎行驶的最远里程的极差等于B类轮胎行驶的最远里程的极差C.A类轮胎行驶的最远里程的平均数大于B类轮胎行驶的最远里程的平均数D.A类轮胎的性能更加稳定答案:D分析:根据众数、极差、平均数和方差的定义以及计算公式即可求解.解:对A:A类轮胎行驶的最远里程的众数为99,B类轮胎行驶的最远里程的众数为95,选项A错误;对B:A类轮胎行驶的最远里程的极差为13,B类轮胎行驶的最远里程的极差为14,选项B错误.对C :A 类轮胎行驶的最远里程的平均数为100+−6−4−1−1+5+76=100,B 类轮胎行驶的最远里程的平均数为100+−5−5−2−1+4+96=100,选项C 错误.对D :A 类轮胎行驶的最远里程的方差为(94−100)2+(96−100)2+(99−100)2×2+(105−100)2+(107−100)26=643,B 类轮胎行驶的最远里程的方差为(95−100)2×2+(98−100)2+(99−100)2+(104−100)2+(109−100)26=763>643,故A 类轮胎的性能更加稳定,选项D 正确. 故选:D.7、关于圆周率π,数学发展史上出现过许多很有创意的求法,如著名的浦丰实验和查理斯实验.受其启发,我们也可以通过设计下面的实验来估计π的值:先请全校m 名同学每人随机写下一个都小于1的正实数对(x,y );再统计两数能与1构成钝角三角形三边的数对(x,y )的个数a ;最后再根据统计数a 估计π的值,那么可以估计π的值约为( ) A .4am B .a+2mC .a+2m mD .4a+2m m答案:D解析:由试验结果知m 对0~1之间的均匀随机数x,y ,满足{0<x <10<y <1,面积为1,再计算构成钝角三角形三边的数对(x,y),满足条件的面积,由几何概型概率计算公式,得出所取的点在圆内的概率是圆的面积比正方形的面积,即可估计π的值.解:根据题意知,m 名同学取m 对都小于1的正实数对(x,y ),即{0<x <10<y <1,对应区域为边长为1的正方形,其面积为1,若两个正实数x,y 能与1构成钝角三角形三边,则有{x 2+y 2<1x +y >10<x <10<y <1,其面积S =π4−12;则有am=π4−12,解得π=4a+2m m故选:D .小提示:本题考查线性规划可行域问题及随机模拟法求圆周率的几何概型应用问题. 线性规划可行域是一个封闭的图形,可以直接解出可行域的面积;求解与面积有关的几何概型时,关键是弄清某事件对应的面积,必要时可根据题意构造两个变量,把变量看成点的坐标,找到试验全部结果构成的平面图形,以便求解.8、数据x1,x2,x3,…,x m的平均数为x,数据y1,y2,y3,…,y n的平均数为y,则数据x1,x2,x3,…,x m,y1,y2,y3,…,y n的平均数为()A.xn +ymB.xm+ynC.nx+mym+n D.mx+nym+n答案:D分析:利用平均数的计算公式计算.由题意得:x1+x2+x3+⋯+x m=mx,y1+y2+y3+⋯+y n=ny,所以x1+x2+x3+⋯+x m+y1+y2+y3+⋯+y nm+n =mx+nym+n故选:D多选题9、2020年突如其来的新冠肺炎疫情对房地产市场造成明显的冲击,如图为某市2020年国庆节7天假期的楼房认购量与成交量的折线图,某同学根据折线图对这7天的认购量(单位:套)与成交量(单位:套)作出如下判断,则判断正确的是()A.日成交量的中位数是16B.日成交量超过平均成交量的只有1天C.10月7日认购量量的增长率大于10月7日成交量的增长率D.日认购量的方差大于日成交量的方差答案:BD解析:根据拆线图判断各数据特征后判断各选项.由拆线图日成交量的中位数是26,A错;日成交量均值为13+8+32+16+26+38+1667≈42.7,大于均值的只有一天,B正确;10月7日认购量量的增长率为y1=276−112112≈1.464,成交量的增长率为y2=166−3838≈3.368,显然C错;日认购量的均值为223+105+91+107+100+112+2767≈144.857,由各数据与均值的差可以看出日认购量的方差大于日成交量的方差,D正确.故选:BD.小提示:关键点点睛:本题考查统计图表,考查拆线图的识别.解题关键是由拆线图得出各数据,然后求得各数据特征.如中位数,均值,增长率,方差,解题中还要善于估值,如本题中的方差,从而大致比较出大小.10、如图是国家统计局发布的2020年12月至2021年12月的全国居民消费价格涨跌幅,其中同比=本期数−去年同期数去年同期数×100%,环比=本期数−上期数上期数×100%.则下列说法正确的是()A.2020年12月至2021年12月全国居民消费价格环比的极差为1.5% B.2020年12月至2021年12月全国居民消费价格同比的中位数为0.9% C.这13个月中,2021年6月全国居民消费价格最低D.2021年比2020年全国居民消费平均价格增长大于1.0%答案:AB分析:计算出2020年12月至2021年12月全国居民消费价格环比的极差,可判断A选项;利用中位数的定义可判断B选项;根据涨幅可判断C选项;利用平均数公式可判断D选项.2020年12月至2021年12月全国居民消费价格环比的最大值为1.0%,最小值为−0.5%,所以其极差为1.5%,A项正确;2020年12月至2021年12月全国居民消费价格同比(单位:%)从小到大依次为−0.3、−0.2、0.2、0.4、0.7、0.8、0.9、1.0、1.1、1.3、1.5、1.5、2.3,其中位数为0.9%,B项正确;从环比来看,假设2020年全国居民消费平均价格为1,经计算可得2020年12月全国居民消费平均价格,C 项错误;2021年比2020年全国居民消费价格平均增长为1 12(−0.3−0.2+0.4+0.9+1.3+1.1+1.0+0.8+0.7+1.5+2.3+1.5)=1112<1.0,D项错误.故选:AB.11、如图所示的两个扇形统计图分别统计了某地2010年和2020年小学生参加课外兴趣班的情况,已知2020年当地小学生参加课外兴趣班的总人数是2010年当地小学生参加课外兴趣班的总人数的4倍,则下列说法正确的是()A.2020年参加音乐兴趣班的小学生人数是2010年参加音乐兴趣班的小学生人数的4倍B.这10年间,参加编程兴趣班的小学生人数变化最大C.2020年参加美术兴趣班的小学生人数少于2010年参加美术兴趣班的小学生人数D.相对于2010年,2020年参加不同课外兴趣班的小学生人数更平均答案:ABD分析:设2010年参加课外兴趣班的小学生总人数为a,则2020年参加课外兴趣班的小学生总人数是4a,根据扇形统计图中的比例计算,并逐项检验,即可得到结果.设2010年参加课外兴趣班的小学生总人数为a,则2020年参加课外兴趣班的小学生总人数是4a;由统计图可知,2010年参加音乐兴趣班的小学生人数是a×21%=0.21a,2020年参加音乐兴趣班的小学生人数是4a×21%=0.84a,故A正确.这10年间参加编程兴趣班的小学生人数变化量为4a×32%−a×5%=1.23a,这10年间参加语言表演的小学生人数变化量为4a×20%−a×14%=0.66a,这10年间参加音乐的小学生人数变化量为4a×21%−a×21%=0.63a,这10年间参加美术的小学生人数变化量为4a×27%−a×60%=0.48a,所以这10年间参加编程兴趣班的小学生人数变化量最大,故B正确.2020年参加美术兴趣班的小学生人数为4a×27%=1.08a,2010年参加美术兴趣班的小学生人数为a×60%=0.6a,1.08a>0.6a,故C不正确,根据扇形统计图中的比例分布,可知D正确.故选:ABD12、某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15℃,B点表示四月的平均最低气温约为5℃.下面叙述正确的有()A.各月的平均最低气温都在0℃以上B.七月的平均温差比一月的平均温差大C.三月和十一月的平均最高气温基本相同D.平均最高气温高于20℃的月份有5个答案:ABC分析:根据雷达图提供的数据判断各选项可得.对于选项A,由图易知各月的平均最低气温都在0℃以上,A正确;对于选项B,七月的平均最高气温点与平均最低气温点间的距离大于一月的平均最高气温点与平均最低气温点间的距离,所以七月的平均温差比一月的平均温差大,B正确;对于选项C,三月和十一月的平均最高气温均为10℃,所以C正确;对于选项D,平均最高气温高于20℃的月份有七月、八月,共2个月份,故D错误.故选:ABC.13、PM2.5是衡量空气质量的重要指标,下图是某地7月1日到10日的PM2.5日均值(单位:ug/m3)的折线图,则下列关于这10天中PM2.5日均值的说法正确的是A.众数为30B.中位数是31C.平均数小于中位数D.后4天的方差小于前4天的方差答案:AD分析:根据折线图,由众数,中位数,平均数,方差等概念及公式,逐项判断,即可得出结果.众数即是出现次数最多的数字,由折线图可得,众数为30,即A正确;中位数即是处在中间位置的数字,将折线图中数字由小到大依次排序,得到:17,25,30,30,31,32,34,38,42,126;处在中间位置的数字是:31,32,因此中位数为31.5,即B错;由折线图可得,平均数为:17+25+30+30+31+32+34+38+42+12610=40.5>31.5,故C错;前4天的平均数为:38+25+17+304=27.5,后4天的平均数为42+31+32+304=33.75前4天方差为:s12=(38−27.5)2+(25−27.5)2+(17−27.5)2+(30−27.5)24=58.25,后4天方差为:s22=(42−33.75)2+(31−33.75)2+(32−33.75)2+(30−33.75)24=23.1875,所以后4天的方差小于前4天的方差,故D正确.故选:AD.小提示:本题主要考查由折线图计算众数、中位数、平均数、方差等,属于基础题型.填空题14、某次数学考试中20个人的成绩如下:101,103,107,110,112,113,116,123,124,125,125,125,126,128,134,135,137,139,144,148,若这组数据的众数为a,中位数为b,极差为c,则a+b+ c=___________.答案:297分析:根据众数、中位数和极差的定义逐个求解再求和即可由题意,a=125,b=125,c=148−101=47,故a+b+c=125+125+47=297所以答案是:29715、某学校组织学生参加数学测试,成绩的频率分布直方图如下,数据的分组依次是[20,40),[40,60),[60,80),[80,100],则可估计这次数学测试成绩的第40百分位数是_________.答案:65分析:利用百分位数的定义求解.解:成绩在[20,60)的频率是(0.005+0.01)×20=0.3,成绩在[20,80)的频率为0.3+0.02×20=0.7,所以第40百分位数一定在[60,80)内,×20=65,所以这次数学测试成绩的第40百分位数是60+0.4−0.30.4所以答案是:6516、若一组数据x1,x2,x3,⋯,x n的平均数是30,另一组数据x1+y1,x2+y2,x3+y3,⋯,x n+y n的平均数是70,则第三组数据4y1+1,4y2+1,4y3+1,⋯,4y n+1的平均数是___________.答案:161分析:根据数据平均数计算公式可得.数据x1+y1,x2+y2,x3+y3,⋯,x n+y n共有n个,其平均数为1 n ∑(x i+y i)ni=1=1n∑x ini=1+1n∑y ini=1=30+y=70.因此y=40故数据4y1+1,4y2+1,4y3+1,⋯,4y n+1的平均数是4×40+1=161.所以答案是:161解答题17、某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:s12和s22.(1)求x,y,s12,s22;(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果y−x≥2√s12+s2210,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).答案:(1)x=10,y=10.3,s12=0.036,s22=0.04;(2)新设备生产产品的该项指标的均值较旧设备有显著提高.分析:(1)根据平均数和方差的计算方法,计算出平均数和方差.(2)根据题目所给判断依据,结合(1)的结论进行判断.(1)x=9.8+10.3+10+10.2+9.9+9.8+10+10.1+10.2+9.710=10,y=10.1+10.4+10.1+10+10.1+10.3+10.6+10.5+10.4+10.510=10.3,s12=0.22+0.32+0+0.22+0.12+0.22+0+0.12+0.22+0.3210=0.036,s22=0.22+0.12+0.22+0.32+0.22+0+0.32+0.22+0.12+0.2210=0.04.(2)依题意,y−x=0.3=2×0.15=2√0.152=2√0.0225,2√0.036+0.0410=2√0.0076,y−x≥2√s12+s2210,所以新设备生产产品的该项指标的均值较旧设备有显著提高.18、“一带一路”是“丝绸之路经济带”和“21世纪海上丝绸之路”的简称.某市为了了解人们对“一带一路”的认知程度,对不同年龄和不同职业的人举办了一次“一带一路”知识竞赛,满分为100分(90分及以上为认知程度高).现从参赛者中抽取了x人,按年龄分成5组,第一组:[20,25),第二组:[25,30),第三组:[30,35),第四组:[35,40),第五组:[40,45],得到如图所示的频率分布直方图,已知第一组有6人.(1)求x;(2)求抽取的x人的年龄的中位数(结果保留整数);(3)从该市大学生、军人、医务人员、工人、个体户五种人中用分层抽样的方法依次抽取6人,42人,36人,24人,12人,分别记为1~5组,从这5个按年龄分的组和5个按职业分的组中每组各选派1人参加知识竞赛,分别代表相应组的成绩,年龄组中1~5组的成绩分别为93,96,97,94,90,职业组中1~5组的成绩分别为93,98,94,95,90.①分别求5个年龄组和5个职业组成绩的平均数和方差;②以上述数据为依据,评价5个年龄组和5个职业组对“一带一路”的认知程度,并谈谈你的感想.答案:(1)总体是该中学高三年级400名学生的视力;样本是所抽取的50名学生的视力.(2)答案见解析.分析:(1)根据总体与样本的定义直接写出;(2)根据抽签法与随机数法的抽样过程写出即可.解:(1)总体是该中学高三年级400名学生的视力;样本是所抽取的50名学生的视力.(2)选择①.利用抽签法步骤如下,第一步:将这50名学生编号,编号为1,2,3, (50)第二步:将50个号码分别写在纸条上,并揉成团,制成号签.第三步:将得到的号签放在一个不透明的容器中,搅拌均匀.第四步:从容器中逐一抽取6个号签,并记录上面的号码.对应上面6个号码的学生就是抽取的学生.选择②.利用随机数法步骤如下,第一步:将这50名学生编号,编号为01,02,03, (50)第二步:用计算机产生1~50范围内的整数随机数,把产生的随机数作为抽中的编号.第三步:重复第二步的过程,直到抽足6个号码.对应上面6个号码的学生就是抽取的学生.=0.05,即可求解.解析:(1)根据频率分布直方图求出第一组的频率,再由6x(2)设中位数为a,根据0.01×5+0.07×5+(a-30)×0.06=0.5,求解即可.(3)①求出平均数,再根据方差的式子即可求解;②比较平均数与方差即可得出结论.=0.05,∴x=120.(1)根据频率分布直方图得第一组的频率为0.01×5=0.05,∴6x(2)设中位数为a,则0.01×5+0.07×5+(a-30)×0.06=0.5,∴a=95≈32,则中位数为32.3(3)①5个年龄组成绩的平均数为x1=1×(93+96+97+94+90)=94,5×[(-1)2+22+32+02+(-4)2]=6.方差为s12=15×(93+98+94+95+90)=94,5个职业组成绩的平均数为x2=15×[(-1)2+42+02+12+(-4)2]=6.8.方差为s22=15②从平均数来看两组的认知程度相同,从方差来看年龄组的认知程度更稳定(感想合理即可).当今,青少年视力水平的下降已引起全社会的关注.为了了解某中学高三年级400名学生的视力情况,从中抽取了50名学生进行视力检测.(1)在这个问题中,总体、样本各是什么?(2)在①抽签法,②随机数法这两个条件中任选一个填入下面的横线上,并解答.为深入了解这50名学生的视力情况,从中随机抽取6人,请写出利用___9___抽取该样本的过程.。

(典型题)高考数学二轮复习知识点总结统计与统计案例.docx

(典型题)高考数学二轮复习知识点总结统计与统计案例.docx

统计与统计案例1.该部分常考内容:样本数字特征的计算、各种统计图表、线性回归方程、独立性检验等; 有时也会在知识交汇点处命题,如概率与统计交汇等.2.从考查形式上来看,大部分为选择题、填空题,重在考查基础知识、基本技能,有时在知识交汇点处命题,也会出现解答题, 都属于屮低档题.1.随机抽样(1)简单随机抽样特点为从总体中逐个抽取,适用范围:总体中的个体较少.(2)系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取,适用范围:总体中的个体数较多.(3)分层抽样特点是将总体分成儿层,分层进行抽取,适用范围:总体由差异明显的儿部分组成.2.常用的统计图表(1)频率分布直方图、频率①小长方形的面积=组距X 忒=频率;②各小长方形的面积之和等于1;—频率1③小长方形的高=猛,所有小长方形的高的和为丽.(2)茎叶图在样本数据较少时,用茎叶图表示数据的效果较好.3.用样本的数字特征估计总体的数字特征(1)众数、中位数、平均数一一一(2)方差:『=_[(/]—X )2+(A2—x )2------ (乙一x}2}.n标准崔X\— X 2+ X2— X 2 F X n — X 2]. 4. 变量的相关性与最小二乘法(1) 相关关系的概念、正相关和负相关、相关系数.(2) 最小二乘法:对于给定的一组样本数据(xi, yi ),(丸,乃),…,(尢,%),通过求0=工(yi —a —bx )'最小时,得到线性回归方程尸=加+日的方法叫做最小二乘法. /=15. 独立性检验对于取值分别是3,屈和5, y 』的分类变量尤和『,其样本频数列联表是:71Y2 总计ab a+b X2C d c+d 总计a+cb+dn则心宀 U+c W (•其中心++十为样本容量)•考点一抽样方法.例1. (2012・山东)采用系统抽样方法从960人屮抽取32人做问卷调查,为此将他们随机 编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到 的32人中,编号落入区间[1,450]的人做问卷编号落入区间[451, 750]的人做问卷B, 英余的人做问卷C 则抽到的人中,做问卷〃的人数为()9,39,69, 939.落入区间[451,750]的有459,489,729,这些数构成首项为459,公差为30的等差数列,设有刀项,显然有729 = 459+(/7—1)X30,解得刀=10.所以做 问卷〃的有10人.I 冋=f ■在系统抽样的过程屮,要注意分段间隔,需要抽取儿个个体,样本就需要分 成儿个组,则分段间隔即点N 为样本容量),首先确定在第一组中抽取的个体的号码 n数,再从后面的每组屮按规则抽取每个个体.解决此类题目的关键是深刻理解各种抽样 方法的特点和适用范围.但无论哪种抽样方法,每一个个体被抽到的概率都是相等的, 都等于样本容量和总体容量的比值.A. 7B. 9 答案CC. 10D. 15解析由系统抽样的特点知:抽取号码的间隔为96032= 30,抽取的号码依次为因(1) (2013 •江西)总体由编号为01,02, 19,20的20个个体组成,利用下而的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()A. 08(2)某单位200名职工的年龄分布悄况如图所示,现要从中抽取40名职工作样本.用系统抽样法,将全体职工随机按1〜200编号,并按编号顺序平均分为40组仃〜5号,6〜10号,196〜200号).若第5组抽出的号码为22,则第8组抽出的号码应是.若用分层抽样方法,则40岁以下年龄段应抽収人.答案(1)D (2)37 20解析(1)从第1行第5列、第6列组成的数65开始由左到右依次选出的数为:08, 02, 14,07,01,所以第5个个体编号为01.(2)由分组可「知,抽号的间隔为5,又因为第5组抽出的号码为22,即第〃组抽取的号码为5/7—3,所以第8组抽出的号码为37;40岁以下年龄段的职工数为200X0. 5 = 100,40则应抽取的人数为丽X 100 = 20人.考点二用样本估计总体.例2. (1) (2013・四川)某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示,以组距为「5将数据分组成[0, 5), [5, 10),…,[30, 35), [35, 40] 时,所作的频率分布直方图是()(2) (2013 •江苏)抽样统计甲、乙两位射击运动员的5次训练成绩(单位:坏),结果如下:则成绩较为稳定(方差较小)的那位运动员成绩的方差为_________ .答案(1)A (2)2解析(1)由于频率分布直方图的组距为5,去掉C、D,又[0, 5), [5,10)两组各一人,去掉B,应选A.— 1(2) 一卩==(87 + 91+90 + 89+93)=90,□—— 1x乙==(89 + 90 + 91+88 + 92) =90,b品=占[(87 — 90)?+(91-90)1 2+ (90-90)2+ (89-90)2+ (93-.90)2] =4,5s2=g[(89 —90尸+ (90-90)2+ (91-90)2+ (88-90)2+ (92-90)2] =2.5(1)反映样本数据分布的主要方式有:频率分布表、频率分布直方图、茎叶图.关于频率分布直方图要明确每个小矩形的面积即为对应的频率,其高低能够描述频率的大小, 高考中常常考查频率分布直方图的基本知识,同时考查借助频率分布直方图估计总体的概率分布和总体的特征数,具体问题中要能够根据公式求解数据的均值、众数和中位数、方差等.(2)由样本数据估计总体时,样本方差越小,数据越稳定,波动越小.在“2012魅力新安江”青少年才艺表演评比活动中,参赛选手成绩的茎叶图和频率分布直方图都受到不同程度的破坏,可见部分如图,据此回答以下问题:(2, 4), (2, 5), (2, 6), (3, 4), (3,5), (3, 6), (4, 5), (4, 6), (5, 6),共15 个,其中至少有一个在1 求参赛总人数和频率分布直方图中[80, 90)之间的矩形的高,并完成直方图;2 若要从分数在[80,100]之间任取两份进行分析,在抽取的结果中,求至少有一份分数在[90, 100]之间的概率.解(1)由茎叶图知,分数在[50, 60)之间的频数为2.由频率分布直方图知,分数在[50, 60)之间的频率为0. 008X10 = 0.0&2所以参赛总人数为両=25 (人).分数在[80, 90)之间的人数为25 — 2 — 7—10 — 2=4(人),4分数在[80,90)Z间的频率为亦=0・16,得频率分布直方图中[80, 90)间矩形的高为晋=0. 016.完成直方图,如图.(2)将[80, 90)之间的4个分数编号为1, 2, 3,4;[90, 100]之间的2个分数编号为5和6.则在[80,100]之间任取两份的基本事件为(1,2), (1,3), (1,4), (1,5), (1,6), (2, 3),[90,100]之间的基本事件为(1,5), (1,6), (2,5), (2, 6), (3, 5), (3, 6), (4, 5), (4, 6), (5, 6),共9 个.9 3故至少有一份分数在[90, 100] Z间的概率考点三统计案例.例3. (2013 •重庆)从某居民区随机抽取10个家庭,获得第,个家庭的月收入农(单位:千10 10 10 10元)与月储蓄匕(单位:千元)的数据资料,算得为上=80,为y,=20,为乂匕=1.84,为¥ /=1 /=12=1 2=1 7=720.(1)求家庭的月储蓄y对月收入/的线性回归方程y=bx+a,(2)判断变量龙与y之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.n _ _^XiYi—n x yi= I _ _____ _______ ___ 附:线性回归方程y= bx+ a中,b= ----------------- , a= y ~b x ,其中x , y为n __匸2 22^x~n x7=1样本平均值,线性回归方程也可写为y=bx+a.__ | n80解⑴由题意知〃=io, / =-yx=—=8, 刀「10又人=工£一〃^ 2=720-10X82 = 80,2 = 1厶》・=1>必一刀x y =184-10X8X2 = 24, /=i由此得力3,a=~-b T=2-0. 3X8=-0. 4,故所求线性回归方程为y=0. 3^-0. 4.(2)由于变量y的值随x值的增加而增加(方=0. 3>0),故/与F 之间是正相关.(3)将x=l 代入回归方程可以预测该家庭的月储蓄为y=0. 3X7-0. 4 = 1. 7(千元). (1)对具有线性相关关系的两个变量.可以用最小二乘法求线性回归方程,求方是关键,X XL X //— y ^Xiy —n x y■ /=1 J=1 其中b= ----------------------- = ---------------n __ n _ V 1 2 P 2 2 , Xi — x 2^Xi —n x /= i /= i⑵在利用统计•变量航进行独立性检验时,应该注意数值的准确代入和正确汁算, 最后把计算的结杲与有关临界值相比较.(1)通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:附表:参照附表,得到的正确结论是()A. 在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”B. 在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”C. 有99%以上的把握认为“爱好该项运动与性別有关”D. 有99%以上的把握认为“爱好该项运动与性别无关”⑵已知x 、y 取值如下表:从所得的散点图分析可知:y 与x 线性相关,且y=0. 95^+a,则日等于()A. 1.30B. 1.45C. 1.65 0. 1.80EX60X50X60X50〜7.&答案(1)C (2)B解析(1)根据独立性检验的定义,由斤(塔)~7.8>6.635可知我们有99%以上的把握认为“爱好该项运动与性别有关”,故选C.—1(2)依题意得,x =^*X (0+1+4 + 5 + 6+8) =4,6—— 1y =-(1. 3 + 1. 8+5. 6 + 6. 1+7. 4 + 9. 3) =5. 25;又直线y=0.95/+自必过样本点中心(匸,~),即点(4, 5. 25),于是有5. 25 = 0. 95X4+日,由此解得曰=1.45.1.用样本估计总体(1)在频率分布直方图中,各小长方形的面积表示相应的频率,各小长方形的面积的和为1.(2)众数、屮位数及平均数的异同众数、屮位数及平均数都是描述一组数据集屮趋势的量,平均数是最重要的量.(3)当总体的个体数较少时,可直接分析总体取值的频率分布规律而得到总体分布;当总体容量很大时,通常从总体中抽取一个样本,分析它的频率分布,以此估计总体分布.—1 “①总体期望的估计,计算样本平均值X②总体方差(标准差)的估计:方差=2若](尢一% )2,标准差=7方差,方差(标准差)较小者较稳定.2.线性回归方程y =b x+a过样本点中心(匚,丁),这为求线性回归方程带来很多方便.3.独立性检验⑴作出2X2列联表.(2)计算随机变量#(疋)的值.(3)查临界值,检验作答.1.经问卷调查,某班学生对摄影分别持“喜欢”、“不喜欢”和“一般”三种态度,其中持“一般”态度的学生比持“不喜欢”的学生多12人,按分层抽样的方法(抽样过程中不需要剔除个体)从全班选出部分学生进行关于摄影的座谈.若抽样得出的9位同学屮有5位持“喜欢”态度的同学,1位持“不喜欢”态度的同学和3位持“一般”态度的同学,则全班持“喜欢”态度的同学人数为 ()A. 6B. 18C. 30D. 54答案C解析 由题意设全班学生为/人,持“喜欢”、“不喜欢”和“一般”态度的学生分别 占全班人数的害、*、所以%(|-|)=12,解得%=54,所以全班持“喜欢”态度的人 数为54X :=30.故选C.2. 某校从参加高三年级期中考试的学生中随机抽取60名学生,将其数学成绩(均为整数) 分成六段[40,50), [50,60),…,[90,100]后得到如图的频率分布直方图,请你根据频 率分布直方图中的信息,估计出本次考试数学成绩的平均分为 _______________ .答案71解析 由频率分布直方图得每一组的频率依次为0. 1, 0. 15, 0. 15, 0. 3, 0. 25, 0. 05,又由 频率分布直方图,得每一组数据的中点值依次为45, 55, 65, 75, 85, 95.所以本次考试数学成绩的平均分为匚=45X0. 1 +55X0. 15 + 65X0. 15 + 75X0.3 +85X0. 25+95X0. 05 = 71.故填71.随机抽取某川学甲、乙两班各10名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图如图.(1) 根据茎叶图判断哪个班的平均身高较高; (2) 计算甲班的样本方差;(3) 现从乙班这10名同学中随机抽取两名身高不低于173 cm的同学,求身高为176 cm 的同学被抽屮的概率.解(1)由茎叶图可知:甲班身高集中于160 cm 〜179 cm 之间,而乙班身高集中于170cm 〜180 cm 之间,因此乙班平均身高高于甲班,其中 — 158+162 + 163+168+168+170+171 + 179+179+182 x 甲== 170, —159+162 + 165+168 + 170+173 + 176+178+179+18110= 171. 1.(2)甲班的样本方差为±[(158 — 170)2+(]62_i70)2+ (163- 170)2+ (168~170)2 + (168-170)2+ (170-170)2+(171-170)2+ (179-170)2+ (179-170)2+ (182-170)2]甲班2 18 9 9 10 17 8 83 216 815 3. 10 乙班10 3 6 8 9 2 5 8 9= 57. 2.(3)设身高为176 cm 的同学被抽中的事件为/L从乙班10名同学中抽取两名身高不低于173 cm 的同学有:(181,173)、(181,176)、(181,178)、(181,179)、(179,173)、(179,176)、(179,178)、(178, 173)、(178,176)、 (176,173),共10个基本事件,而事件含有4个基本事件,(推荐时间:60分钟)一、选择题1. 要完成下列两项调查:①从某肉联厂的火腿肠生产线上抽取L 000根火腿肠进行“瘦 肉精”检测;②从某屮学的15名艺术特长生屮选出3人调查学习负担情况.适合采用 的抽样方法依次为()A. ①用分层抽样,②用简单随机抽样B. ①用系统抽样,②用简单随机抽样C. ①②都用系统抽样D. ①②都用简单随机抽样答案B解析 ①屮总体容量较大,且火腿肠Z 间没有明显差异,故适合采用系统抽样;②屮总 体容量偏小,故适合采用简单随机抽样.2. (2012・四川)交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况, 对甲、乙、丙、丁四个社区做分层抽样调查.假设四个社区驾驶员的总人数为M 其屮 甲社区有驾驶员96人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为 12, 21,25, 43,则这四个社区驾驶员的总人数艸为()A. 101B. 808C. 1 212D. 2 012答案B12解析由题意知抽样比为花,而四个社区一共抽取的驾驶员人数为12 + 21+25+43 = 101,故有||=¥,解得/V=808.3. (2013 •福建)某校从高一年级学生中随机抽取部分学生.,将他们的模块测试成绩分成6 组:[40,50), [50, 60), [60,70), [70, 80), [80, 90), [90,100]加以统计,得到如图 所示的频率分布直・・・P(A)=£2方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为()A. 588B. 480C. 450D. 120答案B解析少于60分的学生人数600X (0. 05 + 0. 15) = 120(人),・・・不少于60分的学生人数为480人.4.甲、乙两位运动员在5场比赛的得分情况如茎叶图所示,记甲、乙两人的平均得分分别为匚甲,匚乙,则下列判断正确的是()A.匚甲>7乙;甲比乙成绩稳定甲〉匚乙;乙比甲成绩稳定C. "7甲<7乙;甲比乙成绩稳定乙比甲成绩稳定答案D解析由茎叶图可知—17+16 + 28 + 30 + 34*,1,= 5 斗5,—15 + 28+26 + 28 + 33x乙= z =26,oX甲〈X乙.又昴=g[「(17—25尸+ (16-25)2+ (28-25)2+ (30-25)2+ (34-25)2] =52,s:=£[(15-26)2+ (28-26)2+ (26~26)2+ (28-26)2+ (33-26)2] =35. 6,・・・乙比甲成绩稳定.5.一个样本容量为10的样本数据,它们组成一个公差不为0的等差数列{/},若心=8,且越,彷成等比数列,则此样本的平均数和中位数分别是( )A. 13, 12B. 13, 13C. 12, 13D. 13, 14答案B解析设等差数列{/}的公差为〃(件0), $3=8,血戲=£=64, (8 — 2小(8+4小=64, (4 — / (2 +小=& 2〃一扌=0 ,又,故d = 2 ,故样本数据为+ 12 + 14 4,6, & 10, 12, 14, 16, 18,20,22,样本的平均数为------- ----- =13,中位数为一= 13,故选B.6.2011年6月,台湾爆出了食品添加有毒塑化剂的案件,令世人震惊.我国某研究所为此开发了一种用来检测塑化剂的新试剂,把500组添加了该试剂的食品与另外500组未添加该试剂的食品作比较,提出假设弘:“这种试剂不能起到检测出塑化剂的作用”,并计算出635)=0. 01.对此,四名同学做出了以下的判断:P:有99%的把握认为“这种试剂能起到检测出塑化的作用”;q:随意抽出一组食品,它有99%的可能性添加了塑化剂;z、:这种试剂能检测出塑化剂的有效率为99%;s:这种试剂能检测出塑化剂的有效率为1%.则下列命题中为真命题的是()A. p/\qB.絲pf\qC.(綁门/\繍g)/\ (八/s)D・(pV 1^) A (^J s)答案D解析提出假设拄“这种试剂不能起到检测出塑化剂的作用”,并计算出戶(於26. 635)=0.01,因此,在一定程度上说明假设不合理,我们就有99%的把握拒绝假设.由题设可知命题刀,厂为真命题,q, s为假命题,依据复合命题的真值表可知D 为真命题.二、填空题7.(2013 •湖北)从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示.(1) ________________________ 直方图屮x的值为;(2) ___________________________________________________ 在这些用户中,用电量落在区间[100, 250)内的户数为__________________________________ .答案(1)0.004 4 (2) 70解析(1)(0.002 4+0. 003 6 + 0. 006 0+x+0. 002 4 + 0. 001 2) X50 = l,・・」= 0.004 4.(2)(0. 003 6 + 0. 004 4+0. 006 0)X50X100=70.8.下表提供了某厂节能减排技术改造后在生产/产品过程屮记录的,产量*吨)与相应的生产能耗y(吨)的几组对应数据:根据上表提供的数据,求出F 关于x 的线性回归方程为y=0.7%+0.35,那么表中广的 值为 . 答案3解析二•样本点屮心为(4.5,耳勺, ・・・斗二=0. 7X4. 5+0. 35,解得 t='3.9. 某校高三考生参加某高校自主招生面试时,五位评委给分如下:9. 0 9. 18.9 9.2 8.8则五位评委给分的方差为 ________ . 答案0.02解析评委给分的平均数为|x (9. 0 + 9. 1 + & 9 + 9. 2 + & 8) =9. 0, □方差为[(9. 0-9. 0)2+ (9. 1 -9. 0)2+ (8. 9-9. 0)2+(9. 2-9. 0)2+ (8. 8-9. 0)2]=50. 1匕~=0. 02. 510. 某校开展“爱我海西、爱我家乡•”摄影比赛,9位评委为参赛作品 A给出的分数如茎叶图所示.记分员在去掉一个最高分和一个最低分 后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中 的x)无法看清,若 记分员计算无误,则数字x 应该是 __________ . 答案1"4, •严+ 刖 + 92 + 9吁92 + 9++90 = 9], •I /=1・三、解答题11. (2013 •陕西)有7位歌手(1至7号)参加一场歌唱比赛,由500名大众评委现场投票决定歌手名次,根据年龄将大众评委分为五组,各组的人数如下:(1)为了调查评委对7位歌手的支持情况,现用分层抽样方法从各组中抽取若干评委, 其中从〃组中抽取了 6人.请将其余各组抽取的人数填入下表.解析 当心时,叭叭吗畀92 + 91 + 9、字切,(2)在(1)中,若力,〃两组被抽到的评委中各有2人支持1号歌手,现从这两组被抽到的评委屮分别任选1人,求这2人都支持1号歌手的概率.解(1)由题设知,分层抽样的抽取比例为6%,所以各组抽取的人数如下表:b\,厶}屮各抽取1人的所有结果为:由以上树状图知所有结果共18种,其中2人都支持1号歌手的冇Si b\,日厶,,观厶4 9共4种,故所求概率7°=—=^.12.(2012 •辽宁)电视传媒公司为了解某地区观众对某类体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名.下面是根据调查结果绘制的观众日均收看该体育节目时I'可的频率分布直方图:将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷” 有10名女性.(1)根据己知条件完成下面的2X2列联表,并据此资料你是否认为“体育迷”与性别有关?(2)将日均收看该体育节目不低于50分钟的观众称为“超级体育迷”,已知“超级体育迷”中有2名女性,若从“超级体育迷”中任意选取2人,求至少有1名女性观众的概率.0. 050.01 k3. 8416. 635解 ⑴由频率分布直方图可知,在抽収的100人中「体育迷”有25人,从而完成2X2 列联表如下:非体育迷体育迷 合计男 30 15 45 女 45 10 55 合计7525100将2X2列联表中的数据代入公式计算,得100=33 心3. 030.因为3. 030<3. 841,所以我们没有理由认为“体育迷”与性别有关.(2)由频率分布直方图可知,“超级体育迷”为5人,从而一切可能结果所组成的基本 事件空间为 Q={@1,戲),仙,3:i) ,(0,辺3),(0,方J , (21, &) , (^2, bl),(臼2, &),(日3, b\),(臼3,Z>2), (bi, &)},其中么表不男性,7 = 1, 2, 3,伤表不女性,j — 1, 2. Q 由10个基本事件组成,而且这些基本事件的出现是等可能的.用ZI 表示“任选2人中,至少有1人是女性”这一事件,则A= {(<<?], Z?l) , (&, bz),(日2, 5),(日2,血),@3, bl) , (t?3, bz) , (Z?l, bl)},事件/7rti 7个基本事件组成,因而P (A )=—附:75X25X45X55。

高考数学统计与统计案例专题知识汇总解析

高考数学统计与统计案例专题知识汇总解析

上一页
返回导航
下一页
第二部分 专题四 概率与统计
13
解析:根据题意可得每 5 人中抽取一人,所以第九组抽取的号码为(9-5)×5+23 =43,根据分层抽样,40~50 岁年龄段应抽取:40×30%=12 人. 答案:43 12
上一页
返回导航
下一页
第二部分 专题四 概率与统计
14
考点 2 “双图”“五数”估计总体(综合型) [知识整合]
上一页
返回导航
下一页
第二部分 专题四 概率与统计
12
3.200 名职工年龄分布如图所示,从中随机抽取 40 名职工作样本,采用系统抽样 方法,按 1~200 编号分为 40 组,分别为 1~5,6~10,…,196~200,第 5 组抽 取号码为 23,第 9 组抽取号码为________;若采用分层抽样,40~50 岁年龄段应 抽取________人.
企业数
2
24
53
14
7
(1)分别估计这类企业中产值增长率不低于 40%的企业比例、产值负增长的企业比例;
(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间
的中点值为代表).(精确到 0.01)
附: 74≈8.602.
上一页
返回导航
下一页
第二部分 专题四 概率与统计
17
【解】 (1)根据产值增长率频数分布表得,所调查的 100 个企业中产值增长率不低 于 40%的企业频率为141+007=0.21. 产值负增长的企业频率为1200=0.02. 用样本频率分布估计总体分布得这类企业中产值增长率不低于 40%的企业比例为 21%,产值负增长的企业比例为 2%. (2) y =1100(-0.10×2+0.10×24+0.30×53+0.50×14+0.70×7)=0.30,
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

专题19 统计知识及统计案例大题部分【训练目标】1、理解简单随机抽样每个个体被抽取的概率相等,掌握简单随机抽样,系统抽样,分层抽样的方法和本质;2、掌握频率分布直方图的画法和性质,能够根据频率分布直方图计算平均数、中位数、众数和方差;3、能根据茎叶图计算平均数、中位数、众数和方差;4、能看懂条形图,扇形统计图,雷达图,折线统计图等常见的统计图表;5、熟记平均数,方差的计算公式及性质,理解平均数,中位数,众数,方差的实际意义;6、能根据数据和公式求线性回归方程,把握线性回归方程的核心即一定经过样本中心点(),x y;7、理解相关系数,残差等概念及相应的含义,并能正确的使用公式求解;8、会根据数据列22⨯列联表,掌握利用2κ公式进行独立性检验的方法;【温馨小提示】此类问题在高考中属于必考题,一般在大题或者小题中出现,所占分值比重较大,题目容易,但是阅读量大,需要学生能够快速准确的把握题目的核心,同时计算量也偏大,另外要求学生多加训练,解出各种统计的题型,知晓解题方法。

【名校试题荟萃】1、如图,从参加环保知识竞赛的学生中抽出名,将其成绩(均为整数)整理后画出的频率分布直方图如下:观察图形,回答下列问题:(1)这一组的频数、频率分别是多少?(2)估计这次环保知识竞赛成绩的平均数、众数、中位数;(不要求写过程)(3)从成绩是分以上(包括分)的学生中选两人,求他们在同一分数段的概率.【答案】(1)4 (2)68.5、75、70 (3).⨯=,设为,(3)记“取出的2人在同一分数段”为事件,因为之间的人数为400.14之间有人,设为,从这6人中选出2人,有,,,,共15个基本事件,其中事件A包括,,,,共7个基本事件,则.2、2018年为我国改革开放40周年,某事业单位共有职工600人,其年龄与人数分布表如下:年龄段[)45,55[)55,5922,35[)35,45[)人数(单位:人)180 180 160 80约定:此单位45岁—59岁为中年人,其余为青年人,现按照分层抽样抽取30人作为全市庆祝晚会的观众.(1)抽出的青年观众与中年观众分别为多少人?(2)若所抽取出的青年观众与中年观众中分别有12人和5人不热衷关心民生大事,其余人热衷关心民生大事.完成下列2×2列联表,并回答能否有90%的把握认为年龄层与热衷关心民生大事有关?热衷关心民生大事不热衷关心民生大事总计青年12中年 5总计30(3)若从热衷关心民生大事的青年观众(其中1人擅长歌舞,3人擅长乐器)中,随机抽取2人上台表演节目,则抽出的2人能胜任才艺表演的概率是多少?【答案】(1)18,12 (2)否(3)2 5【解析】(1)根据分层抽样可知抽出的青年观众为18人,中年观众12人;(2)2×2列联表如下:热衷关心民生大事不热衷关心民生大事总计青年 6 12 18中年7 5 12总计13 17 30,∴没有90%的把握认为年龄层与热衷关心民生大事有关;3、随着网络的发展,人们可以在网络上购物、玩游戏、聊天、导航等,所以人们对上网流量的需求越来越大。

某电信运营商推出一款新的“流量包”套餐.为了调查不同年龄的人是否愿意选择此款“流量包”套餐,随机抽取个用户按年龄分组进行访谈,统计结果如下表.(1)若在第组愿意选择此款“流量包”套餐的人中,用分层抽样的方法抽取人,则各组应分别抽取多少人;(2)若从第组的被调查者访谈人中随机选取人进行追踪调查,求人中至少有人愿意选择此款“流量包”套餐的概率;(3)按以上统计数据填写下面列联表,并判断以岁为分界点,能否在犯错误不超过的前提下认为是否愿意选择此款“流量包”套餐与人的年龄有关.参考公式:,其中.【答案】(1)各组分别为人,人,人(2)(3)在犯错误不超过的前提下认为是否愿意选择此款“流量包”套餐与人的年龄有关.【解析】(1)因为,,,所以第组愿意选择此款“流量包”套餐的人中,用分层抽样的方法抽取人,各组分别为人,人,人.(3)列联表:∴,∴在犯错误不超过的前提下认为是否愿意选择此款“流量包”套餐与人的年龄有关.4、某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局与医院抄录了至月份每月日的昼夜温差情况与因患感冒而就诊的人数,得到如下资料.该兴趣小组确定的研究方案是:先从这六组数据中选取组,用剩下的组数据求线性回归方程,再用被选取的组数据进行检验.日期月日月日月日月日月日月日昼夜温差()就诊人数(个)(1)若选取的是月与月的两组数据,请根据至月份的数据,求出关于的线性回归方程;(2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过人,则认为得到的线性回归方程是理想的,试问该小组所得线性回归方程是否理想.(参考公式:)【答案】(1);(2)该小组所得线性回归方程是理想的.5、2018年月以来南昌市遭受连日大暴雨天气,某网站就“民众是否支持加大修建城市地下排水设施的资金投入”进行投票.按照南昌暴雨前后两个时间收集有效投票,暴雨后的投票收集了份,暴雨前的投票也收集了份,所得统计结果如下表:支持不支持总计南昌暴雨后南昌暴雨前总计已知工作人员从所有投票中任取一个,取到“不支持投入”的投票的概率为.(1)求列表中数据的值;(2)能够有多大把握认为南昌暴雨对民众是否赞成加大对修建城市地下排水设施的投入有关系?参考临界值表:0.15 0.100.05 0.025 0.010 0.005 0.0012.072 2.7063.841 5.024 6.635 7.879 10.828参考公式:(其中为样本容量).【答案】(1),,,,(2)有把握认为南昌暴雨对民众是否赞成加大对修建城市地下排水设施的投入有关系.6、在“新零售”模式的背景下,某大型零售公司为推广线下分店,计划在S 市的A 区开设分店,为了确定在该区开设分店的个数,该公司对在该市其他区开设的分店的数据作了初步处理后得到下列表格.记x 表示在各区开设分店的个数,y 表示这x 个分店的年收入之和.x (个)2 3 4 5 6 y (百万元)2.5344.56(1)该公司已经过初步判断,可用线性回归模型拟合y 与x 的关系,求y 关于x 的线性回归方程∧∧∧+=a x b y ;(2)假设该公司在A 区获得的总年利润z (单位:百万元)与y x ,之间的关系,请结合(1)中的线性回归方程,估算该公司应在A 区开设多少个分店时,才能使A区平均每个分店的年利润最大?(参考公式【答案】 (1)(2)4=x 【解析】 (1)代入数据得:,,,∴.(2)由题意,可知总收入的预报值∧z 与之间的关系为:,设该区每个分店的平均利润为t ,则xzt =,故t 的预报值与之间的关系为,则当4=x 时,∧t 取到最大值。

7、随着移动互联网的发展,与餐饮美食相关的手机应用软件层出不穷.现从使用A 和B 两款订餐软件的商家中分别随机抽取50个商家,对它们的“平均送达时间”进行统计,得到频率分布直方图如下:(1)试估计使用A 款订餐软件的50个商家的“平均送达时间”的众数及平均数; (2)根据以上抽样调查数据,将频率视为概率,回答下列问题:①能否认为使用B 款订餐软件“平均送达时间”不超过40分钟的商家达到75%? ②如果你要从A 和B 两款订餐软件中选择一款订餐,你会选择哪款?说明理由. 【答案】(1)55,40 (2)75%,B8、为了解某地区某种农产品的年产量x (单位:吨)对价格y (单位:千元/吨)和年利润z 的影响,对近五年该农产品的年产量和价格统计如下表:x 1 2 3 4 5 y7.06.55.53.82.2(1)求y 关于x 的线性回归方程y ^=b ^x +a ^;(2)若每吨该农产品的成本为2千元,假设该农产品可全部卖出,预测当年产量为多少时,年利润z 取到最大值?(保留两位小数)参考公式:b ^=∑i =1nx i -x-y i -y-∑i =1nx i -x-2=∑i =1nx i y i -n x -y-∑i =1nx 2i -n x -2,a ^=y --b ^x -【答案】(1)y ^=-1.23x +8.69 (2)2.72(2)年利润z =x (-1.23x +8.69)-2x =-1.23x 2+6.69x =-1.23⎝ ⎛⎭⎪⎫x -6.692.462+1.23×⎝ ⎛⎭⎪⎫6.692.462 即当x =6.692.46≈2.72时,年利润z 最大.9、下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.(1)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明;(2)建立y 关于t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.参考数据:∑i =17y i =9.32,∑i =17t i y i =40.17,∑i =17y i -y2=0.55,7≈2.646.参考公式:相关系数r =∑i =1nt i -ty i -y∑i =1nt i -t2∑i =1n y i -y2,回归方程y ^=a ^+b ^t 中斜率和截距的最小二乘估计公式分别为b ^=∑i =1nt i -ty i -y∑i =1nt i -t2,a ^=y -b ^t .【答案】(1)见解析 (2)1.82(2)由y =9.327≈1.331及(1)得 b ^=∑i =17t i -ty i -y∑i =17t i -t2=2.8928≈0.103,a ^=y -b ^ t ≈1.331-0.103×4≈0.92. 所以y 关于t 的回归方程为y ^=0.92+0.10t .将2016年对应的t =9代入回归方程得y ^=0.92+0.10×9=1.82. 所以预测2016年我国生活垃圾无害化处理量约为1.82亿吨.10、某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t )和年利润z (单位:千元)的影响.对近8年的年宣传费x i 和年销售量y i (i =1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.x y w∑i =18(x i -x )2∑i =18(w i -w )2∑i =18(x i -x )(y i -y ) ∑i =18(w i -w )(y i-y ) 46.6 563 6.8 289.8 1.61 469108.8表中w i =x i ,w =18∑i =18w i .(1)根据散点图判断,y =a +bx 与y =c +d x 哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程.(3)已知这种产品的年利润z 与x ,y 的关系为z =0.2y -x .根据(2)的结果回答下列问题: ①年宣传费x =49时,年销售量及年利润的预报值是多少? ②年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v =α+βu 的斜率和截距的最小二乘估计分别为β^=∑i =1nu i -uv i -v∑i =1nu i -u2,α^=v -β^u .【答案】(1)详见解析 (2)46.24 【解析】(1)由散点图可以判断,y =c +d x 适宜作为年销售量y 关于年宣传费x 的回归方程类型.(2)令w =x ,先建立y 关于w 的线性回归方程.由于d ^=∑i =18w i -wy i -y∑i =18w i -w2=108.81.6=68, c ^=y -d ^w =563-68×6.8=100.6,所以y 关于w 的线性回归方程y ^=100.6+68w , 因此y 关于x 的回归方程为y ^=100.6+68x .11、某品牌手机厂商推出新款的旗舰机型,并在某地区跟踪调查得到这款手机上市时间(x 个月)和市场占有率(y %)的几组相关对应数据:x 1 2 3 4 5 y0.020.050.10.150.18(1)根据上表中的数据,用最小二乘法求出y 关于x 的线性回归方程;(2)根据上述回归方程,分析该款旗舰机型市场占有率的变化趋势,并预测自上市起经过多少个月,该款旗舰机型市场占有率能超过0.5%(精确到月).附:b ^=∑i =1nx i y i -n x -·y-∑i =1nx 2i -n x -2,a ^=y --b ^x -. 【答案】(1)y ^=0.042x -0.026 (2)13(2)由(1)中的回归方程可知,上市时间与市场占有率正相关,即上市时间每增加1个月,市场占有率约增加0.042个百分点.由y ^=0.042x -0.026>0.5,解得x ≥13, 故预计上市13个月时,该款旗舰机型市场占有率能超过0.5%.12、某市春节期间7家超市的广告费支出x i (万元)和销售额y i (万元)数据如下:超市 ABCDEFG广告费支出x i 1 2 4 6 11 13 19 销售额y i19324044525354(1)若用线性回归模型拟合y 与x 的关系,求y 关于x 的线性回归方程;(2)用对数回归模型拟合y 与x 的关系,可得回归方程y ^=12ln x +22,经计算得出线性回归模型和对数模型的R 2分别约为0.75和0.97,请用R 2说明选择哪个回归模型更合适,并用此模型预测A 超市广告费支出为8万元时的销售额.参数数据及公式:x -=8,y -=42,∑7i =1x i y i =2 794,∑7i =1x 2i =708,b ^=错误!,错误!=错误!-错误!错误!,ln2≈0.7.【答案】(1)y ^=1.7x +28.4. (2)47.2【解析】(1)∵x-=8,y-=42,∑7i=1x i y i=2 794,∑7i=1x2i=708.∴b^=错误!=错误!=1.7,因此a^=y--b^x-=42-1.7×8=28.4.所以,y关于x的线性回归方程是y^=1.7x+28.4.(2)∵0.75<0.97,∴对数回归模型更合适.当x=8时,y^=12ln 8+22=36ln 2+22=36×0.7+22=47.2(万元).∴广告费支出8万元时,预测A超市销售额为47.2万元.13、为了监控某种零件的一条生产线的生产过程,检验员每隔30 min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸:抽取次序12345678零件尺寸9.9510.129.969.9610.019.929.9810.04抽取次序910111213141516零件尺寸10.269.9110.1310.029.2210.0410.059.95经计算得x-=116∑16i=1x i=9.97,s=错误!=错误!≈0.212,错误!≈18.439,错误!(x i-错误!)(i-8.5)=-2.78,其中x i为抽取的第i个零件的尺寸,i=1,2, (16)(1)求(x i,i)(i=1,2,…,16)的相关系数r,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若|r|<0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小).(2)一天内抽检零件中,如果出现了尺寸在(x--3s,x-+3s)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.①从这一天抽检的结果看,是否需对当天的生产过程进行检查?②在(x--3s,x-+3s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)附:样本(x i,y i)(i=1,2,…,n)的相关系数r=错误!,错误!≈0.09.【答案】(1)见解析(2)0.09【解析】(1)由样本数据得(x i,i)(i=1,2,…,16)的相关系数r=错误!≈错误!≈-0.18.由于|r|<0.25,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小.剔除第13个数据,剩下数据的样本方差为1(1 591.134-9.222-15×10.022)≈0.008,15这条生产线当天生产的零件尺寸的标准差的估计值为0.008≈0.09.。

相关文档
最新文档