用样本估计总体练习题含答案

合集下载

高一数学用样本估计总体试题

高一数学用样本估计总体试题

高一数学用样本估计总体试题1.一个样本的方差是.【答案】5【解析】由样本可得,所以平均数为4;所以样本的方差为.【考点】样本数值特征.2.在一次选拔运动员中,测得7名选手的身高(单位:cm)的茎叶图为:,记录的平均身高为177 cm,有一名候选人的身高记录不清楚,其末位数记为x,那么x的值为.【答案】8【解析】由茎叶图可知:7名选手的身高分别为170、173、170+x、178、179、180、181,所以由此可得,所以x=8.【考点】茎叶图.3.在一次选拔运动员中,测得7名选手的身高(单位:cm)的茎叶图为:,记录的平均身高为177 cm,有一名候选人的身高记录不清楚,其末位数记为x,那么x的值为.【答案】8【解析】由茎叶图可知:7名选手的身高分别为170、173、170+x、178、179、180、181,所以由此可得,所以x=8.【考点】茎叶图.4.设的平均数是,标准差是,则另一组数的平均数和标准差分别是_________.【答案】,.【解析】另一组数的平均数为:,标准差为:,所以则另一组数的平均数和标准差分别是,.【考点】统计中的期望与方差.5.为了了解某校今年准备报考飞行员的学生的体重情况,将所得的数据整理后,画出了频率分布直方图(如图),已知图中从左到右的前3个小组的频率之比为1∶2∶3,第1小组的频数为6,则报考飞行员的学生人数是()A.36B.40C.48D.50【答案】C【解析】设报考飞行员的人数为,根据前3个小组的频率之比为,可设前三小组的频率分别为;由题意可知所求频率和为1,即,解得,则,解得.故选C.【考点】频率分布直方图.6.200辆汽车通过某一段公路时的时速的频率分布直方图如右图所示,则时速在[60,70)的汽车大约()A.30辆B.40辆C.60辆D.80辆【答案】D【解析】时速在[60,70)的频率为,故汽车大约有辆.【考点】频率分布直方图的应用.7.某同学使用计算器求30个数据的平均数时,错将其中一个数据105输人为15,那么由此求出的平均数与实际平均数的差是( ).A.3.5B.-3C.3D.-0.5【答案】B【解析】数据相差了,平均数相差,故求出的平均数与实际平均数相差.【考点】平均数.8.某教师出了一份三道题的测试卷,每道题1分,全班得3分、2分、1分和0分的学生所占比例分别为30%、50%、10%和10%,则全班学生的平均分为分.【答案】2【解析】设班级总人数为n人,得3分的是人,得2分的是人,得1分的是人,得0分的是人,故班级平均分.【考点】数据的平均数公式及数据的基本处理能力.9.若样本的频率分布直方图中一共有个小矩形,中间一个小矩形的面积等于其余个小矩形面积和的,且样本容量为160,则中间一组的频数是()A.32B.20C.40D.25【答案】A【解析】设中间一个小矩形的面积为,其余个小矩形的面积之和为,依题意有,求解得到,所以中间一组的频率为,中间一组的频数为,故选A.【考点】频率分布直方图.10.200辆汽车通过某一段公路时,时速的频率分布直方图如右图所示,则时速在[50,70)的汽车大约有().A.60辆 B.80辆C.70辆D.140辆【答案】D【解析】需根据直方图中求出各个矩形的面积,即为各组频率,再由总数乘以频率即得各组频数.解:由直方图可知,时速在[50,60]的频率为0.03×10=0.3 时速在[60,70]的频率为0.04×10=0.4 所以时速在[50,70]的汽车大约有200×(0.3+0.4)=140辆.故答案为D.【考点】直方图点评:本题考查频率分布直方图的相关知识.直方图中的各个矩形的面积代表了频率,所以各个矩形面积之和为1.11.某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:,,,,.(1)求图中的值;(2)根据频率分布直方图,估计这100名学生语文成绩的平均分;(3)若这100名学生语文成绩某些分数段的人数()与数学成绩相应分数段的人数()之比如下表所示,求数学成绩在之外的人数.分数段【答案】(1).(2)73.(3)10【解析】(1)依题意得,,解得.(2)这100名学生语文成绩的平均分为:(分).(3)数学成绩在的人数为:,数学成绩在的人数为:,数学成绩在的人数为:,数学成绩在的人数为:.所以数学成绩在之外的人数为:.【考点】本题考查了频率分布直方图的运用点评:注意频率分布直方图中用小长方形面积的大小来表示在各个区间内取值的频率,所以在求频率时,通过已知求出所要区间的面积即可12.为了让学生了解更多“社会法律”知识,某中学举行了一次“社会法律知识竞赛”,共有800名学生参加了这次竞赛. 为了解本次竞赛成绩情况,从中抽取了部分学生的成绩(得分均为整数,满分为100分)进行统计.请你根据尚未完成并有局部污损的频率分布表,解答下列问题:(1)若用系统抽样的方法抽取50个样本,现将所有学生随机地编号为000,001,002,…,799,试写出第二组第一位学生的编号;(2)填充频率分布表的空格①②③④并作出频率分布直方图;(3)若成绩在85.5~95.5分的学生为二等奖,问参赛学生中获得二等奖的学生约为多少人?【答案】(1)016 ;(2) 1 8 2 0.28 3 14 4 0.20;(3)256.【解析】(1)编号为016- -2分(2) 1 8 2 0.28 3 14 4 0.20- 每空1分2分在被抽到的学生中获二奖的人数是9+7=16人, 1分占样本的比例是, 1分所以获二等奖的人数估计为800×32%=256人. 1分答:获二等奖的大约有256人. 1分【考点】系统抽样;频率分布表;频率分布直方图。

高一数学用样本估计总体试题答案及解析

高一数学用样本估计总体试题答案及解析

高一数学用样本估计总体试题答案及解析1.从某小学随机抽取100名学生,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取20人参加一项活动,则从身高在[120,130内的学生中选取的人数应为.【答案】10【解析】由频率分布直方图可得:;则[120,130),[130,140),[140,150]三组人数所占的比例为,则在[120,130内选取的人数应为.【考点】频率分布直方图.2.设的平均数是,标准差是,则另一组数的平均数和标准差分别是_________.【答案】,.【解析】另一组数的平均数为:,标准差为:,所以则另一组数的平均数和标准差分别是,.【考点】统计中的期望与方差.3.200辆汽车通过某一段公路时的时速的频率分布直方图如右图所示,则时速在[60,70)的汽车大约( )A.30辆B.40辆C.60辆D.80辆【答案】D【解析】时速在[60,70)的频率为,故汽车大约有辆.【考点】频率分布直方图的应用.4.某校五四演讲比赛中,七位评委为一选手打出的分数如下:90 86 90 97 93 94 93去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为()A.B.C.D.【答案】B【解析】由题意知,去掉一个最高分和一个最低分后,所剩数据的平均数为;方差为故选B.【考点】样本平均数和方差的计算.5.统计某校800名学生的数学期末成绩,得到频率分布直方图如图所示,若考试采用100分制,并规定不低于60分为及格,则及格率为.【答案】0.8【解析】由图形可知及格率为,答案为0.8.【考点】频率分布直方图6.甲、乙、丙、丁四人参加某运动会射击项目选拔赛,四人的平均成绩和方差如下表所示:甲乙丙丁从这四个人中选择一人参加该运动会射击项目比赛,最佳人选是( ).A.甲B.乙C.丙D.丁【答案】C.【解析】分析表格可知,乙与丙的平均环数最多,又丙的方差比乙小说明丙成绩发挥的较为稳定,所以最佳人选为丙.【考点】数据的平均数与方差的意义.7.一次选拔运动中,测得7名选手的身高(单位:cm)分布茎叶图如图,记录的平均身高为177cm,有一名候选人的身高记录不清楚,其末位数记为x,那么x的值为( )A.5B.6C.7D.8【答案】D【解析】由图可知7名同学的身高分别为180、181、170、173、,178、179而7名同学的平均身高为177,所以有得=178,所以【考点】茎叶图8.由正整数组成的一组数据,其平均数和中位数都是,且标准差等于,则这组数据为 .(从小到大排列)【答案】【解析】由已知不妨假设,则,又因为标准差等于,所以,且都是正整数,观察分析可知这组数据只可为:1,1,3,3.【考点】1.平均数与中位数;2.标准差;3.方程组思想.9.某路段属于限速路段,规定通过该路段的汽车时速不得超过70km/h,否则视为违规扣分,某天有1000辆汽车经过了该路段,经过雷达测速得到这些汽车运行时速的频率分布直方图,如下图所示,则违规扣分的汽车大约为辆.【答案】120.【解析】易求得70-80这组的频率为1-0.05-0.18-0.38-0.27=0.12,则违规扣分的汽车大约为辆.【考点】频率分布直方图中每组对应的长方形面积为,总面积为1,频数=频率样本容量.10.对某市“四城同创”活动中800名志愿者的年龄抽样调查统计后得到频率分布直方图(如图),但是年龄组为[25,30)的数据不慎丢失,则依据此图可得:(1)[25,30)年龄组对应小矩形的高度为________;(2)据此估计该市“四城同创”活动中志愿者年龄在[25,35)的人数为________.【答案】0.04;440【解析】由频率分布直方图得:,解得;志愿者年龄在[25,35)的人数为.【考点】概率与统计.11.将某选手的7个得分去掉1个最高分,去掉1个最低分,剩余5个得分的平均分为91,现场做的7个得分的茎叶图(如图)后来有一个数据模糊,无法辨认,在图中用表示,则x的值为( )A.0B.4C.5D.7【答案】A【解析】如果是最高得分的话,,所以是最大值,那么,解得,故选A.【考点】茎叶图12.某老师从星期一到星期五收到的信件数分别为10,6,8,5,6,则该组数据的方差______.【答案】3.2【解析】由平均数及方差的定义可得;.【考点】样本数据的数字特征:平均值与方差.13.在育民中学举行的电脑知识竞赛中,将九年级两个班参赛的学生成绩(得分均为整数)进行整理后分成五组,绘制如图所示的频率分布直方图.已知图中从左到右的第一、第三、第四、第五小组的频率分别是0.30,0.15,0.10,0.05,第二小组的频数是40.(1)求第二小组的频率,并补全这个频率分布直方图;(2)求这两个班参赛的学生人数是多少;(3)这两个班参赛学生的成绩的中位数应落在第几小组内.【答案】(1)第二小组的频率为,补全的频率分布直方图详见解析;(2)100人;(3)九年级两个班参赛学生的成绩的中位数应落在第二小组内.【解析】(1)先从所给的直方图中得出第一、三、四、五小组的频率,然后用1减去第一、三、四、五小组的频率和得到第二小组的频率,接着由确定第二小组的小长方形的高,从而可补全频率分布直方图;(2)用第二小组的频数除以该组的频率,即可计算出九年两个班参赛学生的总人数;(3)要确定中位数所在的小组,只需先确定各小组的频数,从第一小组开始累加,当和达到总人数的一半时的组就是中位数所在的小组.试题解析:(1)∵各小组的频率之和为1.00,第一、三、四、五小组的频率分别是0.30,0.15,0.10,0.05∴第二小组的频率为:∴落在59.5~69.5的第二小组的小长方形的高,则补全的频率分布直方图如图所示(2)设九年级两个班参赛的学生人数为人∵第二小组的频数为40人,频率为0.40∴,解得所以这两个班参赛的学生人数为100人(3)因为0.3×100=30,0.4×100=40,0.15×100=15,0.10×100=10,0.05×100=5即第一、第二、第三、第四、第五小组的频数分别为30,40,15,10,5所以九年级两个班参赛学生的成绩的中位数应落在第二小组内【考点】1.频率分布直方图;2.转化与运算能力.14.在样本的频率分布直方图中, 共有9个小长方形, 若第一个长方形的面积为0.02, 前五个与后五个长方形的面积分别成等差数列且公差互为相反数,若样本容量为160, 则中间一组(即第五组)的频数为()A.12B.24C.36D.48【答案】C【解析】设公差为d,那么9个小长方形的面积分别为0.02,0.02+d,0.02+2d,0.02+3d,0.02+4d,0.02+3d,0.02+2d,0.02+d,0.02,而9个小长方形的面积和为 1,可得0.18+16d=1 可以求得d=∴中间一组的频数为:160×(0.02+4d)=36.故答案为:36.故选C。

5_1_4_用样本估计总体练习(原卷版)

5_1_4_用样本估计总体练习(原卷版)

5.1.4用样本估计总体【基础练习】一、单选题1.从某小区抽取100户居民进行月用电量调查,发现其月用电量都在50至350度之间,频率分布直方图如图所示,则这100户居民月用电量的中位数大约为()A.150B.177.8C.183.3D.2002.如图,这是某校高三年级甲、乙两班在上学期的5次数学测试的班级平均分的茎叶图,则下列说法不正确的是()A.甲班的数学成绩平均分的平均水平高于乙班B.甲班的数学成绩的平均分比乙班稳定C.甲班的数学成绩平均分的中位数高于乙班D.甲、乙两班这5次数学测试的总平均分是1033.有4万个不小于70的两位数,从中随机抽取了3000个数据,统计如下:请根据表格中的信息,估计这4万个数据的平均数为()A.92.16B.85.23C.84.73D.77.974.如图是某学校的教研处根据调查结果绘制的本校学生每天放学后的自学时间情况的频率分布直方图:根据频率分布直方图,求出自学时间的中位数和众数的估计值(精确到0.01)分别是()A .2.20,2.25B .2.29,2.20C .2.29,2.25D .2.25,2.255.某歌手大赛进行电视直播,比赛现场有6名特约嘉宾给每位参赛选手评分,场内外的观众可以通过网络平台给每位参赛选手评分.某选手参加比赛后,现场嘉宾的评分情况如下表,场内外共有数万名观众参与了评分,组织方将观众评分按照[)70,80,[)80,90,[]90,100分组,绘成频率分布直方图如下:嘉宾评分的平均数为1x ,场内外的观众评分的平均数为2x ,所有嘉宾与场内外的观众评分的平均数为x ,则下列选项正确的是( ) A .122x x x +=B .122x x x +>C .122x x x +<D .12122x x x x x +>>>二、填空题6.解放战争中,国民党军队拥有过多辆各型坦克,编成了1个装甲兵团(师级编制).我军为了知道这个装甲兵团的各型坦克的数量,釆用了两种方法:一种是传统的情报窃取,一种是用统计学的方法进行估计.统计学的方法最后被证实比传统的情报收集更精确.这个装甲兵团对各型坦克从1开始进行了连续编号,在解放战争期间我军把缴获的这些坦克的编号进行记录并计算出这些编号的平均值为112.5,假设缴获的坦克代表了所有坦克的一个随机样本,则利用你所学过的统计知识估计这个装甲兵团的各型坦克的数量大约有_______.7.为了解某市居民用水情况,通过抽样,获得了100位居民某年的月均用水量(单位:吨),将该数据按照[0,0.5),[0.5,1),…[4.4.5]分成9组,绘制了如图所示的频率分布直方图,政府要试行居民用水定额管理,制定了一个用水量标准a,使85%的居民用水量不超过a(假设a为整数),按平价收水费,超出a的部分按议价收费,则a的最小值为_____.8.我国高铁发展迅速,技术先进,经统计在经停某站的高铁列车,有10个车次的正点率为0.97,有20个车次的正点率为0.99,有10个车次的正点率为0.98,则经停该站高铁列车的所有车次的平均正点率估计值为______.三、解答题9.某工厂为生产一种标准长度为40cm的精密器件,研发了一台生产该精密器件的车床,该精密器件的实际长度为acm,“长度误差”为40a cm,只要“长度误差”不超过0.03cm就认为合格.已知这台车床分昼、夜两个独立批次生产,每天每批次各生产1000件.已知每件产品的成本为5元,每件合格品的利润为10元.在昼、夜两个批次生产的产品中分别随机抽取20件,检测其长度并绘制了如下茎叶图:(1)分别估计在昼、夜两个批次的产品中随机抽取一件产品为合格品的概率;(2)以上述样本的频率作为概率,求这台车床一天的总利润的平均值.10.《中华人民共和国个人所得税法》规定,公民月收入总额(工资、薪金等)不超过免征额的部分不必纳税,超过免征额的部分为全月应纳税所得额,个人所得税税款按税率表分段累计计算.为了给公民合理减负,稳步提升公民的收入水平,自2018年10月1日起,个人所得税免征额和税率进行了调整,调整前后的个人所得税税率表如下:(1)已知小李2018年9月份上交的税费是295元,10月份工资、薪金等税前收入与9月份相同,请帮小李计算一下税率调整后小李10月份的税后实际收入是多少?(2)某税务部门在小李所在公司利用分层抽样方法抽取某月100位不同层次员工的税前收入,并制成下面的频率分布直方图.(i)请根据频率分布直方图估计该公司员工税前收入的中位数;(ii)同一组中的数据以这组数据所在区间中点的值作代表,按调整后税率表,试估计小李所在的公司员工该月平均纳税多少元?【提升练习】1.某校为了解高二年级学生某次数学考试成绩的分布情况,从该年级的1120名学生中随机抽取了100 名学生的数学成绩,发现都在[80,150]内现将这100名学生的成绩按照 [80,90),[90,100),[100,110),[110,120),[120,130),[130,140),[140,150]分组后,得到的频率 分布直方图如图所示则下列说法正确的是( )A .频率分布直方图中a 的值为 0.040B .样本数据低于130分的频率为 0.3C .总体的中位数(保留1位小数)估计为123.3分D .总体分布在[90,100)的频数一定不总体分布在[100,110)的频数相等2.学校为了解新课程标准提升阅读要求对学生阅读兴趣的影响情况,随机抽取了100名学生进行调查.根据调查结果绘制学生周末阅读时间的频率分布直方图如图所示:将阅读时间不低于30分钟的观众称为“阅读霸”,则下列命题正确的是( ) A .抽样表明,该校有一半学生为阅读霸 B .该校只有50名学生不喜欢阅读 C .该校只有50名学生喜欢阅读 D .抽样表明,该校有50名学生为阅读霸3.某次测试成绩满分是为150分,设n 名学生的得分分别为()12,,,1n i a a a a N i n ∈≤≤,()1150k b k ≤≤为n名学生中得分至少为k 分的人数.记M 为n 名学生的平均成绩,则( )A .12150b b b M n ++= B .12150150b b b M ++=C .12150b b b M n++>D .12150150b b b M ++>4.某赛季甲、乙两名篮球运动员每场比赛得分用茎叶图表示,茎叶图中甲得分的部分数据被墨迹污损不清(如图1),但甲得分的折线图完好(如图2),则下列结论错误的是( )A .乙运动员得分的中位数是17,甲运动员得分的极差是19B .甲运动员发挥的稳定性比乙运动员发挥的稳定性差C .甲运动员得分有12的叶集中在茎1上 D .甲运动员得分的平均值一定比乙运动员得分的平均值低5.学校随机抽查了本校20个学生,调查他们平均每天进行体育锻炼的时间(单位:min ),根据所得数据的茎叶图,以5为组距将数据分为8组,分别是[0,5),[5,10),…,[35,40],作出频率分布直方图如图所示,则原始的茎叶图可能是( )A .B .C .D .6.在一次体育水平测试中,甲、乙两校均有100名学生参加,其中:甲校男生成绩的优秀率为70%,女生成绩的优秀率为50%;乙校男生成绩的优秀率为60%,女生成绩的优秀率为40%.对于此次测试,给出下列三个结论:①甲校学生成绩的优秀率大于乙校学生成绩的优秀率;②甲、乙两校所有男生成绩的优秀率大于甲、乙两校所有女生成绩的优秀率;③甲校学生成绩的优秀率与甲、乙两校所有学生成绩的优秀率的大小关系不确定.其中,所有正确结论的序号是____________.7.为了解本市居民的生活成本,甲、乙、丙三名同学利用假期分别对三个社区进行了“家庭每月日常消费额”的调查.他们将调查所得到的数据分别绘制成频率分布直方图(如图所示),记甲、乙、丙所调查数据的标准差分别为s 1、s 2、s 3,则它们的大小关系为 .(用“>”连接)8.2020年年初,新冠肺炎疫情袭击全国.口罩成为重要的抗疫物资,为了确保口罩供应,某工厂口罩生产线高速运转,工人加班加点生产.设该工厂连续5天生产的口罩数依次为1x ,2x ,3x ,4x ,5x (单位:十万只),若这组数据1x ,2x ,3x ,4x ,5x 的方差为1.44,且21x ,22x ,23x ,24x ,25x 的平均数为4,则该工厂这5天平均每天生产口罩__________十万只.9.某市约有20万住户,为了节约能源,拟出台“阶梯电价”制度,即制定住户月用电量的临界值a ,若某住户某月用电量不超过a 度,则按平价(即原价)0.5(单位:元/度)计费;若某月用电量超过a 度,则超出部分按议价b (单位:元/度)计费,未超出部分按平价计费.为确定a 的值,随机调查了该市100户的月用电量,统计分析后得到如图所示的频率分布直方图.根据频率分布直方图解答以下问题(同一组数据用该区间的中点值作代表).(1)若该市计划让全市70%的住户在“阶梯电价”出台前后缴纳的电费不变,求临界值a;(2)在(1)的条件下,假定出台“阶梯电价”之后,月用电量未达a度的住户用电量保持不变;月用电量超过a度的住户节省“超出部分”的60%,试估计全市每月节约的电量.10.某校的3000名高三学生参加了天一大联考,为了分析此次联考数学学科的情况,现随机从中抽取15名学生的数学成绩(满分:150分),并绘制成如图所示的茎叶图.将成绩低于90分的称为“不及格”,不低于120分的称为“优秀”,其余的称为“良好”.根据样本的数字特征估计总体的情况.(1)估算此次联考该校高三学生的数学学科的平均成绩.(2)估算此次联考该校高三学生数学成绩“不及格”和“优秀”的人数各是多少.(3)在国家扶贫政策的倡导下,该地教育部门提出了教育扶贫活动,要求对此次数学成绩“不及格”的学生分两期进行学业辅导:一期由优秀学生进行一对一帮扶辅导,二期由老师进行集中辅导.根据实践总结,优秀学生进行一对一辅导的转化率为20%;老师集中辅导的转化率为30%,试估算经过两期辅导后,该校高三学生中数学成绩仍然不及格的人数.注:转化率=-辅导前不及格人数辅导后不及格人数辅导前不及格人数100%⨯。

2018届高考数学分类练习 第72练 用样本估计总体 含答案

2018届高考数学分类练习 第72练 用样本估计总体  含答案

一、选择题1.对于一组数据x i (i =1,2,3,…,n),如果将它们改变为x i +C(i =1,2,3,…,n),其中C ≠0,则下列结论正确的是( )A .平均数与方差均不变B .平均数变,方差保持不变C .平均数不变,方差变D .平均数与方差均发生变化2.甲、乙两位运动员在5场比赛的得分情况如茎叶图所示,记甲、乙两人的平均得分分别为x甲,x 乙,则下列判断正确的是( )A.x甲>x 乙;甲比乙成绩稳定B.x 甲>x 乙;乙比甲成绩稳定C.x 甲<x 乙;甲比乙成绩稳定D.x甲<x乙;乙比甲成绩稳定3.容量为100的样本数据,按从小到大的顺序分为8组,如下表:89第三组的频数和频率分别是( ) A .14和0.14 B .0.14和14 C.114和0.14 D.13和1144.(2016·全国丙卷)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A 点表示十月的平均最高气温约为15 ℃,B 点表示四月的平均最低气温约为5 ℃.下面叙述不正确的是( )A .各月的平均最低气温都在0 ℃以上B.七月的平均温差比一月的平均温差大C.三月和十一月的平均最高气温基本相同D.平均最高气温高于20 ℃的月份有5个5.某班级统计一次数学测试后的成绩,并制成了如下的频率分布表,根据该表估计该班级的数学测试平均分为( )A.80 B.81C.82 D.836.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )A.6 B.8。

高中数学必修二 9 2 用样本估计总体(精讲)(含答案)

高中数学必修二  9 2 用样本估计总体(精讲)(含答案)

9.2 用样本估计总体(精讲)考法一总体取值规律的估计【例1】(2021·全国高一课时练习)某市2020年4月1日~4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45,(1)完成频率分布表;(2)作出频率分布直方图;(3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,空间质量为良;在101~150之间时,空间质量为轻微污染;在151~200之间时,空间质量为轻度污染.请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.【答案】(1)频率分布表见解析;(2)频率分布直方图见解析;(3)该市空气质量有待进一步改善.【解析】(1)频率分布表(2)频率分布直方图(3)答对下述两条中的一条即可:①该市一个月中空气污染指数有2天处于优的水平,占当月天数的1 15;有26天处于良的水平,占当月天数的13 15;处于优或良的天数共有28天,占当月天数的1415.说明该市空气质量基本良好.②轻微污染有2天,占当月天数的115.污染指数在80以上的接近轻微污染的天数有15天,加上处于轻微污染的天数,共有17天,占当月天数的1730,超过50%.说明该市空气质量有待进一步改善.【一隅三反】1.(2020·全国高一单元测试)某市为提倡节约用水,准备实行自来水“阶梯计费”方式,用户用水不超出基本用水量的部分享受基本价格,超出基本用水量的部分实行超价收费,为更好地决策,自来水公司随机抽取了部分用户的用水量数据,并绘制了如图不完整的统计图(每组数据包括右端点但不包括左端点),请你根据统计图解答下列问题:用户用水量频数直方图用户用水量扇形统计图(1)此次抽样调查的样本容量是________;(2)补全频数分布直方图,求扇形图中“15吨~20吨”部分的圆心角的度数;(3)如果自来水公司将基本用水量定为每户25吨,那么该地区6万用户中约有多少用户的用水全部享受基本价格.【答案】(1)答案见解析;(2)答案见解析,79.2°;(3)4.08万户.【解析】(1)1010%100÷=;(2)用水15~20吨的户数为100-10-36-24-8=22(户),“15~20吨”部分的圆心角的度数为22 36079.2100︒⨯=︒(3)1022366 4.08100++⨯=(万户)所以该地区6万用户中约有4.08万户的用水全部享受基本价格.2.(2020·全国高一单元测试)对某校高一年级学生参加社区服务次数进行统计,随机抽取M名学生作为样本,得到这M名学生参加社区服务的次数.根据此数据作出了频数与频率的统计表和频率分布直方图如下:(1)求出表中M,p及图中a的值;(2)若该校高一学生有360人,试估计该校高一学生参加社区服务的次数在区间[10,15)内的人数. 【答案】(1)M =40,0.075p =,0.125a =;(2)90人. 【解析】(1)由[10,15)内的频数是10,频率是0.25知,100.25M=,所以M =40. 因为频数之和为40,所以10+25+m +2=40,m =3.330.07540p M ===. 因为a 是对应分组[15,20)的频率与组距的商,所以250.125405a ==⨯. (2)因为该校高一学生有360人,分组[10,15)内的频率是0.25,所以估计该校高一学生参加社区服务的次数在此区间内的人数为3600.25⨯=90人.3.(2021·北京丰台区)为了解某市家庭用电量的情况,该市统计局调查了100户居民去年一年的月均用电量,发现他们的用电量都在50kW ·h 至350kW ·h 之间,进行适当分组后,画出频率分布直方图如图所示.(I )求a 的值;(Ⅱ)求被调查用户中,用电量大于250kW ·h 的户数;(III )为了既满足居民的基本用电需求,又提高能源的利用效率,市政府计划采用阶梯定价,希望使80%的居民缴费在第一档(费用最低),请给出第一档用电标准(单位:kW ·h )的建议,并简要说明理由. 【答案】(I )0.006;(Ⅱ)18;(III )245.5 kW ·h.【解析】(1)因为()0.00240.00360.00440.00240.0012501a +++++⨯=,所以0.006a =; (2)根据频率分布直方图可知:“用电量大于250kW ·h ”的频率为()0.00240.0012500.18+⨯=, 所以用电量大于250kW ·h 的户数为:1000.1818⨯=, 故用电量大于250kW ·h 有18户;(3)因为前三组的频率和为:()0.00240.00360.006500.60.8++⨯=<,前四组的频率之和为()0.00240.00360.0060.0044500.820.8+++⨯=>, 所以频率为0.8时对应的数据在第四组, 所以第一档用电标准为:0.80.620050245.50.22-+⨯≈kW ·h.故第一档用电标准为245.5 kW ·h.4.(2021·陕西咸阳市)某微商对某种产品每天的销售量(单位:件)进行为期一个月(按30天计算)的数据统计分析,并得出了这种产品该月销售量的频率分布直方图(如图).假设用直方图中所得的频率来估计相应事件发生的概率.(Ⅰ)求频率分布直方图中a 的值;(Ⅱ)若微商在一天的销售量不低于25件,则上级商企会给微商赠送100元的礼金,估计该微商在一年内获得的礼金数.【答案】(Ⅰ)0.02;(Ⅱ)10800元. 【解析】(Ⅰ)由题意可得1[1(0.010.060.070.04)5]0.025a =-+++⨯=. (Ⅱ)根据频率分布直方图知,日销售量不低于25件的天数为: ()0.040.025309+⨯⨯=(天), 一个月可获得的礼金数为9100900⨯=(元),依此可以估计该微商一年内获得的礼金数为9001210800⨯=元. 【点睛】本题考查频率的求法,考查频率分布直方图的性质等基础知识,考查样本估计总体以及运算求解能力、数形结合思想的应用,是基础题.考法二 总体百分数的估计【例2】(2020·天津和平区)已知一组数据为4,5,67,8,8,,第40百分位数是( ) A .8 B .7C .6D .5【答案】C【解析】因为有6位数,所以640 2.4⨯=%,所以第40百分位数是第三个数6.故选:C 【一隅三反】1.(2020·山东菏泽市·高一期末)数据1,2,3,4,5,6的60%分位数为( ) A .3 B .3.5C .3.6D .4【答案】D【解析】由6⨯60%=3.6,所以数据1,2,3,4,5,6的60%分位数是第四个数,故选:D2.(2021·山东高一期末)已知从某中学高一年级随机抽取20名女生,测量她们的身高(单位:cm ),把这20名同学的身高数据从小到大排序:148.0 149.0 150.0 152.0 154.0 154.0 155.0 155.5 157.0 157.0 158.0 159.0 161.0 162.0 163.0 164.0 165.0 170.0 171.0 172.0 则这组数据的第75百分位数是( ) A .163.0 B .164.0C .163.5D .164.5【答案】A【解析】因为这组数据从小到大已排序,所以这组数据的第75百分位数为第200.7515⨯=个数,即为163.0故选:A3.(2020·山东滨州市·高一期末)“幸福感指数”是指某个人主观地评价他对自己目前生活状态的满意程度的指标,常用区间[]0,10内的一个数来表示,该数越接近10表示满意程度越高,现随机抽取6位小区居号,他们的幸福感指数分别为5,6,7,8,9,5,则这组数据的第80百分位数是( ) A .7 B .7.5C .8D .9【答案】C【解析】该组数据从小到大排列为:5,5,6,7,8,9,且680% 4.8⨯=,故选:C.考法三 总体集中趋势的估计【例3】(2021·湖北荆州市)因受新冠疫情的影响,某企业的产品销售面临困难.为了改变现状,该企业欲借助电商和“网红”直播带货扩大销售.受网红效应的影响,产品销售取得了较好的效果.现将该企业一段时间内网上销售的日销售额统计整理后绘制成如下图所示的频率分布直方图:请根据图中所给数据,求: (1)实数a 的值;(2)该企业网上销售日销售额的众数和中位数; (3)该企业在统计时间段内网上销售日销售额的平均数. 【答案】(1)0.012;(2)55万元,57万元;(3)57.4万元. 【解析】(1)由频率分布直方图知:(0.0080.0160.0200.0180.0100.0042)101a ++++++⨯=,解得:0.012a =;(2)用频率分布直方图中最高矩形所在区间的中点值作为众数的近似值,得众数为55万元;因为第一个小矩形的面积为0.08,第二个小矩形的面积为0.12, 第三个小矩形的面积为0.16,0.080.120.160.36++=,设第四个小矩形中底边的一部分长为x ,则0.0200.50.36x ⨯=-,解得7x =, 所以中位数为50757+=万元; (3)依题意,日销售额的平均值为:250.08350.12450.16550.20650.18750.12850.10950.0457.4⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯=所以该企业在统计时间段内网上销售日销售额的平均数为57.4万元. 【一隅三反】1.(2020·定边县第四中学高一期末)如图,从参加数学竞赛的学生中抽出60名,将其成绩(均为整数)整理后画出的频率分布直方图如图,观察图形,回答下列问题:(Ⅰ)79.5-89.5这一组的频数、频率分别是多少? (Ⅱ)估计这次数学竞赛的平均成绩是多少?(Ⅲ)估计这次数学竞赛的及格率(60分及以上为及格). 【答案】(Ⅰ)15;0.25;(Ⅱ)70.5;(Ⅲ)75%. 【解析】(Ⅰ)79.589.5这一组的频率为0.025100.25⨯=,79.589.5这一组的频数为600.2515⨯=;(Ⅱ)估计这次数学竞赛的平均成绩是:44.50.154.50.1564.50.1574.50.384.50.2594.50.0570.5⨯+⨯+⨯+⨯+⨯+⨯=.故估计这次数学竞赛的平均成绩是70.5.(Ⅲ)估计这次环保知识竞赛的及格率(60分及以上为及格)()10.010.0151075%P =-+⨯=. 2.(2021·河北唐山市·开滦第一中学高一期末)某校从参加高一年级期末考试的学生中抽出60名学生,将其物理成绩(均为整数)分成六段[)[)[]40,50,50,60,,90,100⋯后画出如下频率分布直方图.观察图形的信息,回答下列问题:(1)估计这次考试的众数m 与中位数n (结果保留一位小数); (2)估计这次考试的优秀率(80分及以上为及格)和平均分. 【答案】(1)75m =,73.3n =;(2)优秀率30%,平均分71分. 【解析】(1)众数是最高小矩形中点的横坐标,所以众数为75m =(分)前三个小矩形面积为0.01100.015100.015100.4⨯+⨯+⨯=, ∵中位数要平分直方图的面积, ∴0.50.47073.30.03n -=+=.(2)依题意,80及以上的分数所在的第五、六组, 频率和为 ()0.0250.005100.3+⨯=, 所以,抽样学生成绩的合格率是30%, 利用组中值估算抽样学生的平均分:450.1550.15650.15750.3850.25950.0571⨯+⨯+⨯+⨯+⨯+⨯=,估计这次考试的平均分是71分.3.(2021·吉林市)某城市100户居民的月平均用水量(单位:吨),以[0,2)[2,4)[4,6)[6,8)[8,10)[10,12)[12,14)分组的频率分布直方图如图.(1)求直方图中x 的值;并估计出月平均用水量的众数. (2)求月平均用水量的中位数及平均数;(3)在月平均用水量为[6,8),[8,10),[10,12),[12,14)的四组用户中,用分层抽样的方法抽取22户居民,则应在[10,12)这一组的用户中抽取多少户?(4)在第(3)问抽取的样本中,从[10,12)[12,14)这两组中再随机抽取2户,深入调查,则所抽取的两户不是来自同一个组的概率是多少?【答案】(1) x =0.075,7;(2) 6.4,5.36;(3) 2;(4)23. 【解析】(1)根据频率和为1,得2×(0.02+0.095+0.11+0.125+x +0.05+0.025)=1, 解得x =0.075;由图可知,最高矩形的数据组为[6,8),所以众数为()16872+=; (2) [2,6)内的频率之和为(0.02+0.095+0.11)×2=0.45;设中位数为y ,则0.45+(y −6)×0.125=0.5,解得y =6.4,∴中位数为6.4;平均数为()210.0230.09550.1170.12590.075110.025 5.36⨯+⨯+⨯+⨯+⨯+⨯=(3)月平均用电量为[10,12)的用户在四组用户中所占的比例为0.0520.1250.0750.050.02511=+++, ∴月平均用电量在[10,12)的用户中应抽取11×211=2(户). (4)月平均用电量在[12,14)的用户中应抽取11×111=1(户), 月平均用电量在[10,12)的用户设为A 、B , 月平均用电量在[12,14)的用户设为C ,从[10,12),[12,14)这两组中随机抽取2户共有 ,,AB AC BC ,3种情况,其中,抽取的两户不是来自同一个组的有,,AC BC ,2种情况, 所以,抽取的两户不是来自同一个组的概率为23. 考点四 总体离散程度的估计【例4】(2021·山东威海市·高一期末)如图所示的四组数据,标准差最小的是( )A .B .C .D .【答案】A【解析】对A ,()12106206302402516x =⨯+⨯+⨯+⨯=,s == 对B ,()16102202306402516x =⨯+⨯+⨯+⨯=,s == 对C ,()13105205303402516x =⨯+⨯+⨯+⨯=,10s ==, 对D ,()15103203305402516x =⨯+⨯+⨯+⨯=,s == 所以标准差最小的是A.故选:A.【一隅三反】1.(2020·全国高一)已知数据12,,,n x x x 的平均数为x ,方差为2s ,则123x +,223x +,…,23n x +的平均数和方差分别为( )A .x 和2sB .23x +和24sC .23x +和2sD .23x +和24129s s ++ 【答案】B【解析】因为数据12,,,n x x x 的平均数为x ,方差为2s ,所以123x +,223x +,…,23n x +的平均数和方差分别为23x +和24s故选:B2.(2020·安徽蚌埠市·蚌埠二中高一月考)一组数据中的每一个数据都乘以3,再减去50,得到一组新数据,若求得新的数据的平均数是1.6,方差是3.6,则原来数据的平均数和方差分别是( )A .17.2,3.6B .54.8,3.6C .17.2,0.4D .54.8,0.4 【答案】C【解析】设一组数据为i x (1,2,3,,)i n =,平均数为x ,方差为21s ,所得一组新数据为i y (1,2,3,,)i n =,平均数为y ,方差为22s ,则350i i y x =-(1,2,3,,)i n =,12 1.6n y y y y n +++==, 所以123503503501.6n x x x n -+-++-=, 所以350 1.6x -=,所以51.617.23x ==, 由题意得22222121()()() 3.6n s y y y y y y n ⎡⎤=-+-++-=⎣⎦, 所以222121(350 1.6)(350 1.6)(350 1.6) 3.6n x x x n⎡⎤--+--++--=⎣⎦, 所以2221219(17.2)(17.2)(17.2) 3.6n x x x n ⎡⎤⨯-+-++-=⎣⎦ 所以2221219()()() 3.6n x x x x x x n⎡⎤⨯-+-++-=⎣⎦, 所以219 3.6s =,所以210.4s =.故选:C.3.(2020·唐山市第十一中学)已知样本数据由小到大依次为2,3,3,7,a ,b ,12,13.7,18.3,20,且样本的中位数为10.5,若使该样本的方差最小,则a ,b 的值分别为( ).A .10,11B .10.5,9.5C .10.4,10.6D .10.5,10.5 【答案】D【解析】由于样本共有10个值,且中间两个数为a ,b ,依题意,得10.52a b +=,即21b a =-. 因为平均数为23371213.718.320101()0a b +++++++++÷=,所以要使该样本的方差最小,只需()()221010a b -+-最小.又()()()()222221010102110242221a b a a a a -+-=-+--=-+, 所以当4210.522a -=-=⨯时,()()221010a b -+-最小,此时10.5b =. 故选:D4.(2021·合肥市第六中学=)为了测试小班教学的实践效果,刘老师对A 、B 两班的学生进行了阶段测试,并将所得成绩统计如图所示;记本次测试中,A 、B 两班学生的平均成绩分别为A x ,B x ,A 、B 两班学生成绩的方差分别为2A s ,2B s ,则观察茎叶图可知( )A .AB x x <,22A B s s < B .A B x x >,22A B s s <C .A B x x <,22A B s s >D .A B x x >,22A B s s >【答案】B【解析】根据茎叶图中数据的分布可得,A 班学生的分数多集中在[]70,80之间, B 班学生的分数集中在[]50,70 之间,所以A B x x >.相对两个班级的成绩分布来说,A 班学生的分数更加集中,B 班学生的分数更加离散,所以22A B s s <.故选:B。

随机抽样、用样本估计总体习题及答案解析

随机抽样、用样本估计总体习题及答案解析

随机抽样、用样本估计总体1.某棉纺厂为了解一批棉花的质量,从中随机抽测了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标).所得数据均在区间[5,40]中,其频率分布直方图如图所示,则在抽测的100根中,有 根棉花纤维的长度小于20 mm.惠生活 观影指南爱尚嘟嘟园迅播影院请支持我们,有更多资源和动力【答案】 30【解析】 因为频率分布直方图的矩形的高为,频率概率故矩形的高⨯组距即为频率.从图中可知长 度小于20 mm 的频率为(0.01+0.01+0.04)50⨯=.3,又总体为100根,故纤维长度小于20 mm 的根 数为1000⨯.3=30根. 惠生活 观影指南 爱尚 嘟嘟园 迅播影院 请支持我们,有更多资源和动力 课后作业夯基基础巩固2.从2 008名学生中选取50名学生参加全国数学联赛,若采用下面的方法选取:先用简单随机抽 样从2 008人中剔除8人,剩下的2 000人再按系统抽样的方法抽取,则这2 008名学生中每人入选的概率( )A.不全相等B.均不相等C.都相等,且为502008D.都相等,且为140【答案】 C 【解析】 随机抽样过程中,保证每个个体被抽取的可能性是相等的,所以每人入选的概率都相等,且为502008. 3.某校选修乒乓球课程的学生中,高一年级有30名,高二年级有40名,现用分层抽样的方法在这70名学生中抽取一个样本,已知在高一年级的学生中抽取了6名,则在高二年 级的学生中应抽取的人数为… ( )A.6B.8C.10D.12【答案】 B【解析】 分层抽样的原理是按照各部分所占的比例抽取样本,设从高二年级抽取的学生数为n ,则30640n=,得n =8. 4.某工厂对一批产品进行了抽样检测.下图是根据抽样检测后的产品净重(单位:克)数据绘制的 频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是( )A.90B.75C.60D.45【答案】A【解析】样本中产品净重小于100克的频率为(0.050+0.100)⨯2=0.3,频数为36.样本总数为36120 03= ..∵样本中净重大于或等于98克并且小于104克的产品的频率为(0.100+0.150+0.125)20⨯=.75, ∴样本中净重大于或等于98克并且小于104克的产品的个数为1200⨯.75=90.5.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是( )A.91.5和91.5B.91.5和92C.91和91.5D.92和92【答案】A【解析】按照从小到大的顺序排列为87,89,90,91,92,93,94,96.∵有8个数据,∴中位数是中间两个数的平均数:91922+=91.5,平均数为8789909192939496918+++++++=.5,故选A.6.一组数据的平均数是4.8,方差是3.6,若将这组数据中的每一个数据都加上60,得到一组新数据,则所得新数据的平均数和方差分别是( )A.55.2,3.6B.55.2,56.4C.64.8,63.6D.64.8,3.6【答案】D【解析】每一个数据都加上60时,平均数也应加上60,而方差不变.7.为了解1 200名学生对学校某项教改实验的意见,打算从中抽取一个容量为30的样本,考虑采取系统抽样,则分段的间隔k为.【答案】40【解析】在系统抽样中,确定分段间隔k,对编号进行分段,(N k N n=为总体的容量,n 为样本的容量), ∴12004030N k n ===. 8.高三(1)班共有56人,学号依次为1,2,3,…,56,现用系统抽样的办法抽取一个容量为4的样本,已知 学号为6,34,48的同学在样本中,那么还有一个同学的学号应为 .【答案】 20【解析】 根据题意,56人应分为4组,每组14人,第一组为6号,第二组为6+14=20号,第三组为20+14=34号,第四组为34+14=48号,故还有一个同学的学号为20.9.为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量,产品数量的分组区间为[45,55),[55,65),[65,75),[75,85),[85,95],由此得到频率分布直方图如图,则由此估计该厂工人一天生产该产品数量在[55,70)的人数约占该厂工人总数的百分率是 .【答案】 52.5%【解析】 结合频率分布直方图可以看出:生产数量在[55,65)的人数频率为0.04100⨯=.4,生产数量在[65,75)的人数频率为0.025⨯10=0.25,而生产数量在[65,70)的人数频率约为0.25⨯102=.125,那么生产数量在[55,70)的人数频率约为0.4+0.125=0.525,即52.5%. 10.(2011江苏高考,6)某老师从星期一到星期五收到的信件数分别为10,6,8,5,6,则该组数据的方差2s = .【答案】 165【解析】 ∵10685675x ++++==, ∴2s = 22222(107)(67)(87)(57)(67)1655-+-+-+-+-=. 11.为了分析某篮球运动员在比赛中发挥的稳定程度,统计了该运动员在6场比赛中的得分,用茎叶图表示如图,则该组数据的方差为.【答案】 5 【解析】 该运动员6场的总得分为14+17+18+18+20+21=108,平均得分为10818(6=分),方差为 2222221[(1418)(1718)(1818)(1818)(2018)(2118)]56-+-+-+-+-+-=,故填5. 12.对甲、乙两名自行车赛手在相同条件下进行了6次测试,测得他们的最大速度(m/s)的数据如 下表:惠生活 观影指南 爱尚 嘟嘟园 迅播影院 请支持我们,有更多资源和动力(1)画出茎叶图,由茎叶图你能获得哪些信息?(2)分别求出甲、乙两名自行车赛手最大速度(m/s)数据的平均数、中位数、标准差,并判断选谁参加比赛更合适【解】 (1)画茎叶图,如图所示,中间数为数据的十位数.从这个茎叶图上可以看出,甲、乙的得分情况都是分布均匀的,只是乙更好一些;乙的中位数是33.5,甲的中位数是33.因此乙总体得分情况比甲好(2)根据公式得3333x x =,=甲乙;s =甲 3.96s ,=乙 3.35;甲的中位数是33,乙的中位数是综合比较选乙参加比赛较为合适.。

高中数学第二章统计221用样本的频率分布估计总体分布练习含解析新人教A版必修

2.2.1 用样本的频率分布估计总体分布A级基础巩固一、选择题1.没有信息的损失,所有的原始数据都可以从图中得到的统计图是( )A.总体密度曲线B.茎叶图C.频率分布折线图D.频率分布直方图答案:B2.下图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的频率为( )B.C.D.解析:数据总个数n=10,又落在区间[22,30)内的数据个数为4,故所求的频率为410=0.4.答案:B3.某雷达测速区规定:凡车速大于或等于70 km/h的汽车视为“超速”,并将受到处罚.下图是某路段的一个检测点对300辆汽车的车速进行检测所得结果的频率分布直方图,则从图中可得出将被处罚的汽车数为( )A.30辆B.40辆C.60辆D.80辆解析:车速大于或等于70 km/h的汽车数为×10×300=60(辆).答案:C4.一个社会调查机构就某地区居民的月收入调查了10 000人,并根据所得数据画了样本的频率分布直方图(如图),为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10 000人中再用分层抽样方法抽出100人作进一步调查,则在[2 500,3 000)(单位:元)月收入段应抽出的人数为( )A.5 B.25 C.50 D.2 500解析:组距=500,在[2 500,3 000)的频率=0.000 5×500=,样本数为100,则在[2 500,3 000)内应抽100×=25(人).答案:B5.为了了解某校高三学生的视力情况,随机抽查了该校100名高三学生的视力情况,得到频率分布直方图如图所示,由于不慎将部分数据丢失,仅知道后5组的频数和为62.设视力在到之间的学生数为a,最大频率为,则a的值为( )A.27 B.48 C.54 D.64解析:由已知,视力在到之间的学生数为100×=32,又视力在到之间的频率为1-+0.5)×-62100=,所以视力在到之间的学生数为100×=22,所以视力在到之间的学生数a =32+22=54.答案:C二、填空题6.某市共有5 000名高三学生参加联考,为了了解这些学生对数学知识的掌握情况,现从中随机抽出若干名学生在这次测试中的数学成绩,制成如下频率分布表:分组/分频数频率[80,90)①②[90,100)[100,110)[110,120)36[120,130)[130,140)12③[140,150]合计④根据上面的频率分布表,可以①处的数值为________,②处的数值为________. 解析:由位于[110,120)的频数为36,频率=36n=,得样本容量n =120,所以[130,140)的频率=12120=,②处的数值=1------=; ①处的数值为×120=3. 答案:37.从某小学随机抽取100名同学,将他们的身高(单位:cm)数据绘制成频率分布直方图(如图).由图中数据可知a =________.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法抽取18人参加一项活动,则从身高在[140,150]内的学生中抽取的人数应为________.解析:所有小矩形的面积和等于10×++0.020+a +0.035)=1,解得a =;100名同学中,身高在[120,130)内的学生数是10××100=30,身高在[130,140)内的学生数是10××100=20,身高在[140,150]内的学生数是10××100=10,则三组内的总学生数是30+20+10=60,抽样比是1860=310,所以身高在[140,150]内的学生中选取的人数应为10×310=3.答案: 38.为了解某校教师使用多媒体进行教学的情况,采用简单随机抽样的方法,从该校200名授课教师中抽取20名教师,调查了他们上学期使用多媒体进行教学的次数,结果用茎叶图表示如下:据此可估计该校上学期200名教师中,使用多媒体进行教学次数在[15,25)内的人数为________.答案:60三、解答题9.为了调查甲、乙两个网站受欢迎的程度,随机选取了14天,统计上午8:00-10:00间各自的点击量,得到如图所示的茎叶图.(1)甲网站点击量在[10,40]间的频率是多少? (2)甲、乙两个网站哪个更受欢迎?请说明理由.解:(1)甲网站点击量在[10,40]内的有17,20,38,32,共有4天,则频率为414=27. (2)甲网站的点击量集中在茎叶图的下方,而乙网站的点击量集中在茎叶图的上方,从数据的分布情况来看,甲网站更受欢迎.10.为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少? 解:(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此第二小组的频率为:42+4+17+15+9+3=0.08.又因为第二小组的频率=第二小组的频数样本容量,所以样本容量=第二小组的频数第二小组的频率=120.08=150.(2)由题意估计该学校高一学生的达标率约为17+15+9+32+4+17+15+9+3×100%=88%.B 级 能力提升1.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图所示是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )A .6B .8C .12D .18解析:志愿者的总人数为20(+)×1=50,所以第三组的人数为50×=18,有疗效的人数为18-6=12.答案:C2.在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是________.解析:由题意可知,这35名运动员的分组情况为,第一组(130,130,133,134,135),第二组(136,136,138,138,138),第三组(139,141,141,141,142),第四组(142,142,143,143,144),第五组(144,145,145,145,146),第六组(146,147,148,150,151),第七组(152,152,153,153,153),故成绩在区间[139,151]上的运动员恰有4组,则运动员人数为4.答案:43.从高一学生中抽取50名参加调研考试,成绩的分组及各组的频数如下(单位:分): [40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.(1)列出样本的频率分布表;(2)画出频率分布直方图;(3)估计成绩在[70,80)分的学生所占总体的百分比.解:(1)频率分布表如下:成绩分组频数频率[40,50)2[50,60)3[60,70)10[70,80)15[80,90)12[90,100]8合计50(2)由题意知组距为10,取小矩形的高根据表格画出如下的频率分布直方图:(3)由频率分布直方图,可估计成绩在[70,80)分的学生所占总体的百分比是×10==30%.。

高中数学人教A版必修三习题第二章-用样本的数字特征估计总体的数字特征含答案


;x =
5

5
=30,
2.所以-x 甲<-x 乙,s 甲>s 乙.
答案:B 二、填空题 6.甲、乙两位同学某学科连续五次的考试成绩用茎叶图表示如图所示,则平均分数较 高的是________,成绩较为稳定的是________.
解析:-x
甲=70,-x 乙
=68,s甲2
=1 5
×(22+12+12+22)=2,s乙2
11
= =6. 11
答案:A
2.甲、乙两同学在高考前各做了 5 次立定跳远测试,测得甲的成绩如下(单位:米):
2.20, 2.30, 2.30, 2.40, 2.30, 若 甲 、 乙 两 人 的 平 均 成 绩 相 同 , 乙 的 成 绩 的 方 差 是
0.005,那么甲、乙两人成绩较稳定的是________. 解析:求得甲的平均成绩为 2.30米,甲的成绩的方差是 0.004.由已知得甲、乙平均成
而 2(k1-3),2(k2-3),…,2(k6-3)的平均数为 2(k -3),则所求方差为
16[4(k1--k )2+4(k2--k )2+…+4(k6-
- k )2]=4×3=12.
答案:12
8.若有一个企业,70%的员工年收入 1 万元,25%的员工年收入 3 万元,5%的员工年收
入 11万元,则该企业员工的年收入的平均数是________万元,中位数是________万元,众
乙品种的样本平均数也为 10,样本方差为
[(9.4-10)2+(10.3-10)2+(10.8-10)2+(9.7-10)2)+(9.8-10)2]÷5=0.24.
因为 0.24>0.02,所以,由这组数据可以认为甲种水稻的产量比较稳定.

抽样推断练习题答案

抽样推断练习题答案抽样推断是统计学中的一个重要概念,它涉及到从总体中抽取一部分样本,然后根据这些样本来推断总体的特征。

以下是一些抽样推断练习题的答案:1. 题目一:某公司有1000名员工,为了了解员工的平均工资水平,公司随机抽取了100名员工的工资进行调查。

调查结果显示这100名员工的平均工资为5000元。

如果总体平均工资的方差为1000元^2,那么95%置信水平下,总体平均工资的置信区间是多少?答案:根据抽样分布的中心极限定理,样本均值的分布近似正态分布。

首先计算样本均值的标准误差(SE):\[ SE =\sqrt{\frac{\sigma^2}{n}} = \sqrt{\frac{1000}{100}} = 10 \]。

然后使用95%置信水平下的z值,该值为1.96。

置信区间为:\[ CI = \bar{x} \pm z \times SE = 5000 \pm 1.96 \times 10 = (4969.4, 5030.6) \]。

2. 题目二:一个研究者想要估计一个城市中所有家庭的平均年收入。

他随机抽取了50个家庭,并计算出他们的平均年收入为50000元,标准差为10000元。

如果研究者想要以90%的置信水平估计总体平均年收入,置信区间应该是多少?答案:同样使用样本均值的分布近似正态分布。

计算标准误差:\[ SE = \frac{s}{\sqrt{n}} = \frac{10000}{\sqrt{50}} =1414.21 \]。

90%置信水平下的z值为1.645。

置信区间为:\[ CI = 50000 \pm 1.645 \times 1414.21 = (47142.79, 52857.21) \]。

3. 题目三:一个班级有200名学生,随机抽取了25名学生进行数学测试,平均分为80分,标准差为10分。

如果以99%的置信水平估计班级所有学生的数学平均分,置信区间是多少?答案:计算标准误差:\[ SE = \frac{s}{\sqrt{n}} =\frac{10}{\sqrt{25}} = 2 \]。

高三数学用样本估计总体试题

高三数学用样本估计总体试题1.某学生在一门功课的22次考试中,所得分数如下茎叶图所示,则此学生该门功课考试分数的极差与中位数之和为()A.117B.118C.118.5D.119.5【答案】B【解析】22次考试分数最大为98,最小为56,所以极差为98-56=42,从小到大排列,中间两数为76,76,所以中位数为76,所以此学生该门功课考试分数的极差与中位数之和为42+76=118,故选B.【考点】茎叶图.2. PM2.5是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物,一般情况下PM2.5的浓度越大,大气环境质量越差.右边的茎叶图表示的是成都市区甲乙两个监测站某10日内每天的PM2.5浓度读数(单位:),则下列说法正确的是( )A.这10日内甲、乙监测站读数的极差相等B.这10日内甲、乙监测站读数的中位数中,乙的较大C.这10日内乙监测站读数的众数与中位数相等D.这10日内甲、乙监测站读数的平均数相等【答案】C【解析】甲的极差是98-43=55,乙的极差是94-37=57,两者不相等,A错误;甲的中位数是=74,乙的中位数是68,甲的中位数较大,B错误;乙的众数为68,与中位数相同,C正确;甲的平均数是(43+63+65+72+73+75+78+81+86+98)×=73.4乙的平均数是(37+58+61+65+68+68+71+77+82+94)×=68.1,可知D错误【考点】统计,茎叶图,极差,中位数,众数,平均数.3.有一个容量为66的样本,数据的分组及各组的频数如下:[11.5,15.5)2[15.5,19.5) 4[19.5,23.5)9[23.5,27.5)18[27.5,31.5)11[31.5,35.5)12[35.5,39.5)7[39.5,43.5) 3根据样本的概率分布估计,大于或等于31.5的数据约占()A.B.C.D.【答案】B【解析】大于或等于31.5的数据是最后的3组,故大于或等于31.5的数据约占=.4.从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量表得如下频数分布表:质量指标值分组[75,85)[85,95)[95,105)[105,115)[115,125)(I)在答题卡上作出这些数据的频率分布直方图:(II)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(III)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?【答案】(1)(2)质量指标值的样本平均数为100,质量指标值的样本方差为104(3)不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.【解析】(1)根据频率分布表与频率分布直方图的关系,先根据:频率=频数/总数计算出各组的频率,再根据:高度=频率/组距计算出各组的高度,即可以组距为横坐标高度为纵坐标作出频率分布直方图;(2)根据题意欲计算样本方差先要计算出样本平均数,由平均数计算公式可得:质量指标值的样本平均数为,进而由方差公式可得:质量指标值的样本方差为;(3)根据题意可知质量指标值不低于95的产品所占比例的估计值为,由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.试题解析:(1)(2)质量指标值的样本平均数为.质量指标值的样本方差为.所以这种产品质量指标值(3)质量指标值不低于95的产品所占比例的估计值为,由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.【考点】1.频率分布表;2.频率分布直方图;3.平均数与方差的计算5.某车间名工人年龄数据如下表:合计(1)求这名工人年龄的众数与极差;(2)以十位数为茎,个位数为叶,作出这名工人年龄的茎叶图;(3)求这名工人年龄的方差.【答案】(1)众数为,极差为;(2)详见解析;(3).【解析】(1)根据频率分布表中的相关信息结合众数与极差的定义求出众数与极差;(2)根据频率分布表中的信息以及茎叶图的作法作出这名工人年龄的茎叶图;(3)根据茎叶图所反映的信息,先求出平均数,然后根据方差的计算公式求出这名工人年龄的方差.(1)这名工人年龄的众数为,极差为;(2)茎叶图如下:(3)年龄的平均数为,故这名工人年龄的方差为.【考点】本题考查茎叶图、样本的数字特征,考查茎叶图的绘制,以及样本的众数、极差、平均数以及方差的计算,属于中等题.6.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,,第五组,右图是根据试验数据制成的频率分布直方图,已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A.6B.8C.12D.18【答案】C【解析】由图知,样本总数为设第三组中有疗效的人数为,则,故选C.【考点】频率分布直方图.7.从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:(1)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12小时的概率;(2)求频率分布直方图中的a,b的值;(3)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该周课外阅读时间的平均数在第几组(只需写出结论)【答案】(1);(2),;(3)第4组.【解析】(1)由频率分布表与频率分布直方图即可得结果;(2)由频率分布直方图即可得的值;(3)求平均数..(1)根据频数分布表,100名学生中课外阅读时间不少于12小时的学生共有6=2+2=10名,所以样本中的学生课外阅读时间少于12小时的频率是.从该校随机选取一名学生,估计这名学生该周课外阅读时间少于12小时的概率为.(2)课外阅读时间落在组的有17人,频率为,所以,课外阅读时间落在组的有25人,频率为,所以.(3)估计样本中的100名学生课外阅读时间的平均数在第4组.【考点】本小题主要考查频率分布表、频率分布直方图、频率与概率的关系等基础知识,难度不大,熟练基础知识是解决好本类题目的关键.8.(2014·厦门模拟)样本中共有五个个体,其值分别为a,0,1,2,3.若该样本的平均值为1,则样本方差为()A.B.C.D.2【答案】D【解析】因为=1,得a=-1,所以s2=[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2.9.在样本的频率分布直方图中,共有n个小矩形,若中间一个小矩形的面积等于其余(n-1)个小矩形面积的,且样本容量为300,则中间一组的频数为( )A.30B.40C.50D.60【答案】C【解析】设中间一个小矩形的面积为x,则其余(n-1)个小矩形面积和为5x,所以x=。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

用样本估计总体练习题(1)
1. 张先生去某城市参加学术会议,拟选择在会议中心附近的A、B两酒店中的一个人住.两酒店条件和价格相当,张先生在网上查看了最近入住两个酒店的客人对两酒店
的综合评分,并将评分数据记录为如图的茎叶图.记A、B两酒店的宗合评分数据的均
值为,,方差为S A2,S B2,若以此为依据,下述判断较合理的是()
A.因为,S A2>S B2,应选择A酒店
B.因为,S A2<S B2,应选择A酒店
C.因为,S A2>S B2,应选择B酒店
D.因为,S A2<S B2,应选择B酒店
2. 根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论不正确的是()
A.逐年比较,2008年减少二氧化硫排放量的效果最显著
B.2007年我国治理二氧化硫排放显现成效
C.2006年以来我国二氧化硫年排放量呈减少趋势
D.2006年以来我国二氧化硫年排放量与年份正相关
3. 某市为调查学生的学习负担,在某一所学校门口随机抽取一部分学生进行询问调查,这种抽样方法是()
A.简单随机抽样
B.系统抽样
C.分层抽样
D.以上都不是
4. (5分)如图是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动员在这五场比赛中得分的方差为________.
5.(5分) 2020年,面对突如其来的新冠肺炎疫情冲击,在党中央领导下,各地区各部门统筹疫情防控和经济社会发展取得显著成效,商业模式创新发展,消费结构升级持续发展.某主打线上零售产品的企业随机抽取了50名销售员,统计了其2020年的月均销售额(单位:万元),将数据按照[12,14),[14,16),⋯,[22,24]分成6组,制成了如图所示的频率分布直方图.已知[14,16)组的频数比[12,14)组多4.
(1)求频率分布直方图中a和b的值;
(2)该企业为了挖掘销售员的工作潜力,对销售员实行冲刺目标管理,即给销售员确定一个具体的冲刺目标,完成这个冲刺目标,则给予额外的奖励.若公司希望恰有20%的销售人员能够获得额外奖励,求该企业应该制定的月销售冲刺目标值.
参考答案与试题解析
用样本估计总体练习题(1)
一、选择题(本题共计 3 小题,每题 5 分,共计15分)
1.
【答案】
B
【考点】
茎叶图
【解析】
此题暂无解析
【解答】
此题暂无解答
2.
【答案】
D
【考点】
频率分布直方图
【解析】
此题暂无解析
【解答】
解:从图中明显看出2008年二氧化硫排放量比2007年的二氧化硫排放量明显减少,且
减少的最多,故A正确;
2004−2006年二氧化硫排放量越来越多,从2007年开始二氧化硫排放量变少,故B正确;
从图中看出,2006年以来我国二氧化硫年排放量呈减少趋势,故C正确;
2006年以来我国二氧化硫年排放量呈减少趋势,而不是与年份正相关,故D错误.
故选D.
3.
【答案】
D
【考点】
收集数据的方法
【解析】
利用排除法,本题既不是系统抽样,又不是分层抽样,它的形式类似于简单随机抽样,但它不符合简单随机抽样的两种形式抽签法和随机数表法,
不属于三种抽样方法的任一种.
【解答】
解:由题意知,本题既不是系统抽样,也不是分层抽样,
它的形式类似于简单随机抽样,
但是它不符合简单随机抽样的两种形式,即抽签法和随机数表法;
∴排除系统抽样,分层抽样和简单随机抽样三种方法.
故选:D.
二、填空题(本题共计 1 小题,共计5分)
4.
【答案】
6.8
【考点】
茎叶图
极差、方差与标准差
【解析】
根据茎叶图所给的数据,做出这组数据的平均数,把所给的数据和平均数代入求方差的个数,求出五个数据与平均数的差的平方的平均数就是这组数据的方差.
【解答】
∵ 根据茎叶图可知这组数据是8,9,10,13,15
这组数据的平均数是8+9+10+13+155
=11 ∴ 这组数据的方差是15[(8−11)2+(9−11)2+(10−11)2+(13−11)2+(15−
11)2]=15[9+4+1+4+16]=6.8
三、 解答题 (本题共计 1 小题 ,共计5分 )
5.
【答案】
解:(1)由题意得
{(a +b +0.12+0.14+0.10+0.04)×2=1,50×b ×2−50×a ×2=4,
解得a =0.03,b =0.07.
(2)设应该制定的月销售冲刺目标值为x 万元,
则在频率分布直方图中x 右边的面积为1−0.8=0.2.
最后一组的面积是0.04×2=0.08,
最后两组的面积之和为0.10×2+0.04×2=0.28.
因为0.08<0.2<0.28,
所以x 位于倒数第二组,
则(22−x )×0.10+0.08=0.2,
解得x =20.8.
所以该企业的月销售冲刺目标值应该定为20.8万元.
【考点】
频率分布直方图
【解析】


【解答】
解:(1)由题意得
{(a +b +0.12+0.14+0.10+0.04)×2=1,50×b ×2−50×a ×2=4,
解得a =0.03,b =0.07.
(2)设应该制定的月销售冲刺目标值为x 万元,
则在频率分布直方图中x 右边的面积为1−0.8=0.2.
最后一组的面积是0.04×2=0.08,
最后两组的面积之和为0.10×2+0.04×2=0.28.
因为0.08<0.2<0.28,
所以x位于倒数第二组,
则(22−x)×0.10+0.08=0.2,
解得x=20.8.
所以该企业的月销售冲刺目标值应该定为20.8万元.。

相关文档
最新文档