统计案例练习

合集下载

统计案例练习题(附答案)

统计案例练习题(附答案)

统计案例练习题(附答案)一、选择题 1.对具有线性相关关系的两个变量建立的线性回归方程y=a+bx中,回归系数b( ) A.可以小于0 B.只能大于0 C.可能等于0 D.只能小于0 【解析】b可能大于0,也可能小于0,但当b=0时,x,y不具有线性相关关系.【答案】 A 2.下列两个变量间的关系不是函数关系的是( ) A.正方体的棱长与体积 B.角的弧度数与它的正弦值 C.单产为常数时,土地面积与粮食总产量 D.日照时间与水稻亩产量【解析】∵A、B、C都可以得出一个函数关系式,而D不能写出确定的函数关系式,它只是一个不确定关系.【答案】 D 3.某产品的广告费用x与销售额y的统计数据如下表:广告费用x(万元) 4 2 3 5 销售额y(万元) 49 26 39 54 根据上表可得回归方程y=bx+a中的b为9.4,据此模型预报广告费用为6万元时销售额为( ) A.63.36万元 B.65.5万元C.67.7万元 D.72.0万元【解析】x=4+2+3+54=3.5, y=49+26+39+544=42,∴a=y-bx=42-9.4×3.5=9.1,∴回归方程为y=9.4x+9.1,∴当x=6时,y=9.4×6+9.1=65.5,故选B. 【答案】 B 4.由一组样本数据(x1,y1),(x2,y2),…,(xn,yn)得到回归直线方程y=bx+a,那么下列说法中不正确的是( ) A.直线y=bx+a必经过点(x,y) B.直线y=bx+a至少经过点(x1,y1)(x2,y2),…,(xn,bn)中的一个点 C.直线y=bx+a的斜率为∑ni=1xiyi-nx•y∑ni=1x2i-nx2 D.直线y=bx+a的纵截距为y-bx 【解析】回归直线可以不经过任何一个点.其中A:由a=y-bx代入回归直线方程y=bx+y-ax,即y=b(x-x)+y过点(x,y).∴B错误.【答案】 B 5.已知两个变量x和y 之间具有线性相关性,甲、乙两个同学各自独立地做了10次和15次试验,并且利用线性回归的方法求得回归直线分别为l1和l2,已知两个人在试验中发现对变量x的观测数据的平均数都为s,对变量y 的观测数据的平均数都是t,则下列说法正确的是( ) A.l1与l2一定有公共点(s,t) B.l1与l2相交,但交点一定不是(s,t) C.l1与l2必定平行 D.l1与l2必定重合【解析】由于回归直线y=bx+a恒过(x,y)点,又两人对变量x的观测数据的平均值为s,对变量y的观测数据的平均值为t,所以l1和l2恒过点(s,t).【答案】 A 二、填空题 6.从某大学随机选取8名女大学生,其身高x(cm)和体重y(kg)的线性回归方程为y=0.849x-85.712,则身高172 cm的女大学生,由线性回归方程可以预测其体重约为________.【解析】将x=172代入线性回归方程y=0.849x-85.712,有y=0.849×172-85.712=60.316(kg).【答案】60.316 kg 7.面对竞争日益激烈的消费市场,众多商家不断扩大自己的销售市场,以降低生产成本.某白酒酿造企业市场部对该企业9月份的产品销量(单位:千箱)与单位成本的资料进行线性回归分析,结果如下:x=72,y=71,∑6i=1x2i=79,∑6i=1xiyi=1 481. b=1 481-6×72×7179--1.818 2, a=71-(-1.8182)×72≈77.36,则销量每增加1 000箱,单位成本下降________元.【解析】由上表可得,y=-1.818 2x+77.36,销量每增加1千箱,则单位成本下降1.818 2元.【答案】 1.818 2 8.调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:y=0.254x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.【解析】由题意知[0.254(x+1)+0.321]-(0.254x+0.321)=0.254. 【答案】0.254 三、解答题 9.某电脑公司有6名产品推销员,其工作年限与年推销金额数据如下表:推销员编号 1 2 3 4 5 工作年限x/年 3 5 6 7 9 推销金额y/万元 2 3 3 4 5 (1)求年推销金额y关于工作年限x的线性回归方程; (2)若第6名推销员的工作年限为11年,试估计他的年推销金额.【解】(1)设所求的线性回归方程为y=bx+a,则b=i=--=-=1020=0.5, a=y-bx=0.4. 所以年推销金额y关于工作年限x的线性回归方程为y=0.5x+0.4. (2)当x=11时,y=0.5x+0.4=0.5×11+0.4 =5.9(万元).所以可以估计第6名推销员的年推销金额为5.9万元. 10.一种机器可以按各种不同速度运转,其生产物件中有一些含有缺点,每小时生产有缺点物件的多少随机器运转速度而变化,用x表示转速(单位:转/秒),用y表示每小时生产的有缺点物件个数.现观测得到(x,y)的4组值为(8,5),(12,8),(14,9),(16,11). (1)假设y与x之间存在线性相关关系,求y与x之间的线性回归方程. (2)若实际生产中所容许的每小时最大有缺点物件数为10,则机器的速度不得超过多少转/秒?(精确到1) 【解】(1)设回归方程为y=a+bx,则x=8+12+14+164=12.5, y=5+8+9+114=8.25,∑4i=1x2i=660,∑4i =1xiyi=438, b=∑4i=1xiyi-4xy∑4i=1x2i-4x2=438-4×12.5×8.25660-4×12.52≈0.73, a=y-bx=8.25-0.73×12.5=-0.875,所以所求回归方程为y=-0.875+0.73x. (2)由y≤10,即-0.875+0.73x≤10,得x≤10.8750.73≈15,即机器速度不得超过15转/秒. 11.高二(3)班学生每周用于数学学习的时间x(单位:小时)与数学成绩y(单位:分)之间有如下数据:x 24 15 23 19 16 11 20 16 17 13 y 92 79 97 89 64 47 83 68 71 59 若某同学每周用于数学学习的时间为18小时,试预测该同学的数学成绩.【解】显然学习时间与学习成绩间具有相关关系,可以列出下表,并用科学计算器进行计算.i 1 2 3 4 5 6 7 8 9 10 xi 24 15 23 19 16 11 20 16 17 13 yi 9279 97 89 64 47 83 68 71 59 xiyi 2 208 1 185 2 231 1 691 1 024 517 1 660 1 088 1 207 767 ∑10i=1x2i=3 182,∑10i=1xiyi=13 578于是可得b=∑10i=1xiyi-10xy∑10i=1x2i-10x2=545.4154.4≈3.53, a=y-bx=74.9-3.53×17.4≈13.5. 因此可求得回归直线方程为y=3.53x+13.5. 当x=18时,y=3.53×18+13.5≈77. 故该同学预计可得77分左右.。

简单统计练习题

简单统计练习题

简单统计练习题统计学作为一门重要的学科,对于数据的收集、整理和分析具有至关重要的作用。

通过统计,我们可以更好地理解数据背后的信息,做出科学的决策和预测。

为了帮助大家更好地掌握统计知识,本篇文章将提供一些简单的统计练习题,供大家练习。

题目一:某班级有50名学生,其中男生30人,女生20人。

请计算男生和女生的比例。

解答:男生比例=男生人数/总人数 = 30/50 = 0.6女生比例=女生人数/总人数 = 20/50 = 0.4题目二:某公司招聘了10名员工,其中有3名本科生,6名硕士生,1名博士生。

请计算本科生、硕士生和博士生的比例。

解答:本科生比例=本科生人数/总人数 = 3/10 = 0.3硕士生比例=硕士生人数/总人数 = 6/10 = 0.6博士生比例=博士生人数/总人数 = 1/10 = 0.1题目三:某餐厅上午8点到下午5点的客流量如下所示,请计算上午8点到中午12点和中午12点到下午5点的客流量占比。

上午8点到中午12点客流量:30人中午12点到下午5点客流量:70人解答:上午8点到中午12点客流量占比=上午8点到中午12点客流量/总客流量 = 30/(30+70) = 0.3中午12点到下午5点客流量占比=中午12点到下午5点客流量/总客流量 = 70/(30+70) = 0.7通过以上三道练习题,我们可以了解到统计学在实际问题中的应用。

通过计算比例,我们可以更直观地看到不同类别的数据之间的关系。

当然,这只是统计学的冰山一角,作为一门复杂的学科,统计学还有更多的方法和技巧可以帮助我们更好地理解和利用数据。

希望通过这些简单的统计练习题,大家能够对统计学有更深入的了解,并且能够灵活运用于实际问题中。

只有不断练习和实践,我们才能在统计学这条道路上越走越远,为各行各业的发展贡献自己的力量。

统计分析练习实例

统计分析练习实例

统计分析练习实例引言本文档旨在提供一些统计分析练实例,帮助读者加深对统计分析方法的理解和应用能力。

以下将介绍三个实例,分别涵盖了基本统计分析方法的应用。

实例一:描述性统计分析描述性统计分析是对数据进行总结和描述的一种方法。

以下是一个描述性统计分析的实例:假设我们有一份关于某个城市学生身高的数据集,包括100个样本。

我们想要对这些数据进行总结和描述,以了解学生身高的分布情况。

我们可以计算平均身高、标准差、最大值、最小值等统计量,并绘制直方图和箱线图来展示身高的分布和异常值。

实例二:假设检验假设检验是用于判断一个假设是否成立的一种统计方法。

以下是一个假设检验的实例:假设我们想要研究某个新药对患者的治疗效果是否有效。

我们将随机选择100名患者,将其中一半人分为实验组接受新药治疗,另一半人分为对照组接受传统治疗。

我们可以采集治疗前后的数据,比如疾病指标的变化情况。

然后,我们可以使用假设检验方法,比较实验组和对照组的治疗效果是否存在显著差异。

实例三:回归分析回归分析是用于研究变量之间关系的一种统计方法。

以下是一个回归分析的实例:假设我们想要研究某个电子产品的销售量与广告投入之间的关系。

我们可以收集该产品在不同广告投入下的销售量数据,然后使用回归分析方法来建立销售量与广告投入之间的数学模型。

通过分析回归模型的系数和显著性水平,我们可以评估广告投入对销售量的影响。

结论通过以上三个实例的介绍,我们可以看到统计分析在不同领域中的应用。

无论是描述性统计分析、假设检验还是回归分析,都可以帮助我们更好地理解和解释数据。

读者可以根据自己的需求,在实际问题中灵活运用这些统计分析方法。

统计案例测试题及答案(可编辑修改word版)

统计案例测试题及答案(可编辑修改word版)

第一章 统计案例 测试题一、选择题 1.下列属于相关现象的是( ) A.利息与利率 B.居民收入与储蓄存款 C.电视机产量与苹果产量 D.某种商品的销售额与销售价格 2. 已知盒中装有 3 只螺口与 7 只卡口灯泡,这些灯泡的外形与功率都相同且灯口向下放着,现需要一只卡口灯泡, 电工师傅每次从中任取一只并不放回,则在他第 1 次抽到的是螺口灯泡的条件下,第 2 次抽到的是卡口灯泡的概率为 ( )3 2 7 7 A. B. C. D. 10 9 8 93. 如图所示,图中有 5 组数据,去掉组数据后(填字母代号),剩下的 4 组数据的线性相关性最大( )A. E B. C C. D D. A4. 得到如下结果( 单位: 人)根据表中数据,你认为吸烟与患肺癌有关的把握有( ) A. 90% B. 95% C. 99% D.100%5. 调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据表:晚上 白天 合计男婴 24 31 55 女婴 8 26 34 合计 32 57 89你认为婴儿的性别与出生时间有关系的把握为( )A. 80% B. 90% C. 95% D. 99%6. 已知有线性相关关系的两个变量建立的回归直线方程为 y = a + bx ,方程中的回归系数 b ( )A.可以小于 0 B.只能大于 0 C.可以为 0 D.只能小于 0 7. 每一吨铸铁成本 y c (元)与铸件废品率 x %建立的回归方程 y c = 56 + 8x ,下列说法正确的是( ) A.废品率每增加 1%,成本每吨增加 64 元B.废品率每增加 1%,成本每吨增加 8% C.废品率每增加 1%,成本每吨增加 8 元D.如果废品率增加 1%,则每吨成本为 56 元 8. 下列说法中正确的有:①若 r > 0 ,则 x 增大时,y 也相应增大;②若 r < 0 ,则 x 增大时,y 也相应增大;③若r = 1,或 r = -1,则 x 与 y 的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上( ) A.①② B.②③ C.①③ D.①②③9. 有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与摄氏温度-5 04712151923273136热饮杯数15615013212813011610489937654A.100 B.143 C.200 D.243不患肺病 患肺病 合计 不吸烟 7775 42 7817 吸烟 2099 49 2148 合计 9874 91996510.甲、乙两个班级进行一门考试,按照学生考试成绩优秀和不优秀统计成绩后,得到如下列联表:优秀不优秀合计甲班10 35 45乙班7 38 45合计17 73 90利用独立性检验估计,你认为推断“成绩与班级有关系”错误的概率介于()A.0.3~0.4 B.0.4~0.5 C.0.5~0.6 D.0.6~0.7二、填空题11.某矿山采煤的单位成本Y 与采煤量x 有关,其数据如下:则Y 对x 的回归系数.采煤量289 298 316 322 327 329 329 331 350 (千吨)单位成本43.5 42.9 42.1 39.6 39.1 38.5 38.0 38.0 37.0(元)12.对于回归直线方程 y=4.75x+257,当x=28时,y的估计值为.13.在某医院,因为患心脏病而住院的665 名男性病人中,有214 人秃顶;而另外772 名不=是因为患心脏病而住院的男性病人中有175 人秃顶,则2.3 114.设A、B 为两个事件,若事件A 和B 同时发生的概率为,在事件A 发生的条件下,事件B 发生的概率为,10 2 则事件A 发生的概率为.15.由一个 2*2 列联表中数据计算得2= 4.013 ,有把握认为两个变量有关系.三、解答题 1 1 116.国庆节放假,甲去北京旅游的概率为,乙、丙去北京旅游的概率分别为,.假定三人的行动相互之间没有影响,求这段时间内至少有1 人去北京旅3游的概率 4 517.某教育机构为了研究人具有大学专科以上学历(包括大学专科)和对待教育改革态度的关系,随机抽取了 392 名成年人进行调查,所得数据如下表所示:积极支持教育改革不太赞成教育改革合计大学专科以上学历39 157 196大学专科以下学历29 167 196合计68 324 392对于教育机构的研究项目,根据上述数据能得出什么结论.18.1907 年一项关于 16 艘轮船的研究中,船的吨位区间位于 192 吨到3246 吨,船员的人数从 5 人到32 人,船员的人数关于船的吨位的回归分析得到如下结果:船员人数=9.1+0.006×吨位.(1)假定两艘轮船吨位相差 1000 吨,船员平均人数相差多少?(2)对于最小的船估计的船员数为多少?对于最大的船估计的船员数是多少?19.假设一个人从出生到死亡,在每个生日都测量身高,并作出这些数据散点图,则这些点将不会落在一条直线(1)(2)求出这些数据的回归方程;(3)对于这个例子,你如何解释回归系数的含义?(4)用下一年的身高减去当年的身高,计算他每年身高的增长数,并计算他从 3~16 岁身高的年均增长数.(5)解释一下回归系数与每年平均增长的身高之间的联系.20.某个服装店经营某种服装,在某周内获纯利 y(元),与该周每天销售这种服装件数 x 之间的一组数据关系见表:7已知∑ x 2= 280 , ∑ y 2= 45309 , ∑ x y= 3487 .(1) i 求=1ix ,y ;ii =1 i ii =1(2) 画出散点图; (3) 判断纯利 y 与每天销售件数 x 之间是否线性相关,如果线性相关,求出回归方程.2 3 21. 甲、乙两人各射击一次,击中目标的概率分别是 和 .假设两人射击是否击中目标相互之间没有影响;每人各3 4次射击是否击中目标,相互之间也没有影响.(1) 求甲射击 4 次,至少有 1 次未击中目标的概率;(2) 假设某人连续 2 次未击中目标,则中止其射击.问:乙恰好射击 5 次后,被中止射击的概率是多少?第一章 统计案例检测题答案一、选择题1-5 BDACB 6-10 ACCBB二、填空题 11. -0.1229 3 12.39013. 16.37314. 约为 6.323cm ;(5)回归系数与每年平均增长的身高之间近似相等. 15. 95%四、解答题20. 解 : ( 1)x =3 +4 +5 +6 +7 +8 +9 = 6 ,716. 1 1 166 + 69 + 73 + 81+ 89 + 90 + 91解:因甲、乙、丙去北京旅游的概率分别为 ,, .3 4 52 3 4y = ≈ 79.86 ;7(2) 略; 因此,他们不去北京旅游的概率分别为 ,,,所以,3 4 52 3 4 3(3)由散点图知,y 与 x 有线性相关关系, 至少有 1 人去北京旅游的概率为 P =1- × × = .3 4 5 5 2 392⨯ (39⨯167 -157 ⨯ 29)2设回归直线方程: y = bx + a , 17. 解: K = 196⨯196⨯ 68⨯ 324≈ 1.78 .3487 - 7 ⨯ 6⨯ 559 7 133因为1.78 < 2.706 ,所以我们没有理由说人具有大学专 b = 280 - 7 ⨯ 36= = 4.75 ,28科以上学历(包括大学专科)和对待教育改革态度有关.18. 解:由题意知:(1)船员平均人数之差=0.006×吨位之差=0.006×1000=6, ∴船员平均相差 6 人;a = 79.86 - 6⨯ 4.75 = 51.36 . ∴回归直线方程 y = 4.75x + 51.36 .21.解:(1)记“甲连续射击 4 次至少有 1 次未击中目标”为事件 A 1.由题意,射击 4 次,相当于作 4 次独立重复试验.2 65 故 P (A 1)=1-P (A 1)=1-( )4= ,( 2) 最小的船估计的船员数为: 9.1+0.006× 192=9.1+1.152=10.252≈10(人).最 大 的 船 估 计 的 船 员 数 为 : 9.1+0.006× 3246=9.1+19.476=28.576≈28(人). 19.解:(1)数据的散点图如下:(2) 用 y 表 示身高,x 表示年龄,则数据的回归3 81所以甲连续射击 4 次至少有一次未击中目标的概率为65. 1(2)记“乙恰好射击 5 次后被中止射击”为事件 A 3,“乙第 i 次射击未击中”为事件 D i (i =1,2,3,4,5),则 1 A 3=D 5D 4·D 3·(D 2D 1),且 P (D i )= .4 由于各事件相互独立,故 P (A 3)=P (D 5)·P (D 4)·P (D 3)·P (D 2D 1) 1 1 3 1 1 45 = × × ×(1- × )= . 4 4 4 4 4 1 02445方程为 y =6.317x +71.984;(3) 在该例中,回归系数 6.317 表示该人在一年中增加的高度;(4) 每年身高的增长数略.3~16 岁身高的年均增长数 所以乙恰好射击 5 次后被中止射击的概率为 .1 02458。

统计案例分析报告及典型例题

统计案例分析报告及典型例题

统计案例分析及典型例题§11.1 抽样方法1.为了了解所加工的一批零件的长度,抽取其中200个零件并测量了其长度,在这个问题中,总体的一个样本是 . 答案 200个零件的长度2.某城区有农民、工人、知识分子家庭共计2 004户,其中农民家庭1 600户,工人家庭303户,现要从中抽取容量为40的样本,则在整个抽样过程中,可以用到下列抽样方法:①简单随机抽样,②系统抽样,③分层抽样中的 . 答案 ①②③3.某企业共有职工150人,其中高级职称15人,中级职称45人,初级职称90人.现采用分层抽样抽取容量为30的样本,则抽取的各职称的人数分别为 . 答案 3,9,184.某工厂生产A 、B 、C 三种不同型号的产品,其相应产品数量之比为2∶3∶5,现用分层抽样方法抽出一个容量为n 的样本,样本中A 型号产品有16件,那么此样本的容量n= . 答案 80例1 某大学为了支援我国西部教育事业,决定从2007应届毕业生报名的18名志愿者中,选取6人组成志愿小组.请用抽签法和随机数表法设计抽样方案. 解 抽签法:第一步:将18名志愿者编号,编号为1,2,3, (18)第二步:将18个号码分别写在18张外形完全相同的纸条上,并揉成团,制成号签; 第三步:将18个号签放入一个不透明的盒子里,充分搅匀; 第四步:从盒子中逐个抽取6个号签,并记录上面的编号;基础自测第五步:所得号码对应的志愿者,就是志愿小组的成员. 随机数表法:第一步:将18名志愿者编号,编号为01,02,03, (18)第二步:在随机数表中任选一数作为开始,按任意方向读数,比如第8行第29列的数7开始,向右读;第三步:从数7开始,向右读,每次取两位,凡不在01—18中的数,或已读过的数,都跳过去不作记录,依次可得到12,07,15,13,02,09.第四步:找出以上号码对应的志愿者,就是志愿小组的成员.例2 某工厂有1 003名工人,从中抽取10人参加体检,试用系统抽样进行具体实施. 解 (1)将每个人随机编一个号由0001至1003. (2)利用随机数法找到3个号将这3名工人剔除. (3)将剩余的1 000名工人重新随机编号由0001至1000. (4)分段,取间隔k=100001=100将总体均分为10段,每段含100个工人.(5)从第一段即为0001号到0100号中随机抽取一个号l.(6)按编号将l ,100+l ,200+l,…,900+l 共10个号码选出,这10个号码所对应的工人组成样本. 例3 (14分)某一个地区共有5个乡镇,人口3万人,其中人口比例为3∶2∶5∶2∶3,从3万人中抽取一个300人的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程.解 应采取分层抽样的方法.3分过程如下:(1)将3万人分为五层,其中一个乡镇为一层.5分(2)按照样本容量的比例随机抽取各乡镇应抽取的样本. 300×153=60(人);300×152=40(人); 300×155=100(人);300×152=40(人); 300×153=60(人),10分因此各乡镇抽取人数分别为60人,40人,100人,40人,60人.12分(3)将300人组到一起即得到一个样本.14分练习:一、填空题1.(安庆模拟)某校高中生共有900人,其中高一年级300人,高二年级200人,高三年级400人,现分层抽取容量为45的样本,那么高一、高二、高三年级抽取的人数分别为 .答案15,10,202.某牛奶生产线上每隔30分钟抽取一袋进行检验,则该抽样方法为①;从某中学的30名数学爱好者中抽取3人了解学习负担情况,则该抽样方法为②.那么①,②分别为 .答案系统抽样,简单随机抽样3.下列抽样实验中,最适宜用系统抽样的是(填序号).①某市的4个区共有2 000名学生,且4个区的学生人数之比为3∶2∶8∶2,从中抽取200人入样②某厂生产的2 000个电子元件中随机抽取5个入样③从某厂生产的2 000个电子元件中随机抽取200个入样④从某厂生产的20个电子元件中随机抽取5个入样答案③4.(2013·重庆文)某校高三年级有男生500人,女生400人,为了解该年级学生的健康情况,从男生中任意抽取25人,从女生中任意抽取20人进行调查,这种抽样方法是 .答案分层抽样法5.某中学有高一学生400人,高二学生300人,高三学生200人,学校团委欲用分层抽样的方法抽取18名学生进行问卷调查,则下列判断不正确的是(填序号).①高一学生被抽到的概率最大②高三学生被抽到的概率最大③高三学生被抽到的概率最小④每名学生被抽到的概率相等答案①②③6.某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40种、10种、30种、20种,现从中抽取一个容量为20的样本进行食品安全检测,若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是 .答案 67.(天津文,11)一个单位共有职工200人,其中不超过45岁的有120人,超过45岁的有80人.为了调查职工的健康状况,用分层抽样的方法从全体职工中抽取一个容量为25的样本,应抽取超过45岁的职工 人. 答案 108.将参加数学竞赛的1 000名学生编号如下0001,0002,0003,…,1000,打算从中抽取一个容量为50的样本,按系统抽样的方法分成50个部分,如果第一部分编号为0001,0002,…,0020,从第一部分随机抽取一个号码为0015,则第40个号码为 . 答案 07959.某政府机关有在编人员100人,其中副处级以上干部10人,一般干部70人,工人20人,上级机关为了了解政府机构改革意见,要从中抽取一个容量为20的样本,试确定用何种方法抽取,如何抽取? 解 用分层抽样抽取. (1)∵20∶100=1∶5, ∴510=2,570=14,520=4∴从副处级以上干部中抽取2人,一般干部中抽取14人,从工人中抽取4人.(2)因副处级以上干部与工人人数较少,可用抽签法从中分别抽取2人和4人;对一般干部可用随机数表法抽取14人.(3)将2人、4人、14人编号汇合在一起就得到了容量为20的样本.10.某单位有工程师6人,技术员12人,技工18人,要从这些人中抽取一个容量为n 的样本.如果采用系统抽样法和分层抽样法抽取,不用剔除个体;如果样本容量增加一个,则在采用系统抽样时,需要在总体中先剔除1个个体,求样本容量n.解 总体容量为6+12+18=36.当样本容量是n 时,由题意知,系统抽样的间隔为n36,分层抽样的比例是36n ,抽取工程师36n ×6=6n (人),抽取技术人员36n ×12=3n (人),抽取技工36n×18=2n (人).所以n 应是6的倍数,36的约数即n=6,12,18,36.当样本容量为(n+1)时,在总体中剔除1人后还剩35人,系统抽样的间隔为135+n ,因为135+n 必须是整数,所以n 只能取6,即样本容量为6.总体分布的估计与总体特征数的估计1.一个容量为20的样本,已知某组的频率为0.25,则该组的频数为 . 答案 52.(2008·山东理)右图是根据《山东统计年鉴2007》中的资料作成的1997年至2006年我省城镇居民百户家庭人口数的茎叶图.图中左边的数字从左到右分别表示城镇居民百户家庭人口数的百位数字和十位数字,右边的数字表示城镇居民百户家庭人口数的个位数字.从图中可以得到1997年至2006年我省城镇居民百户家庭人口数的平均数为 . 答案 303.63.在抽查产品的尺寸过程中,将其尺寸分成若干组,[a ,b )是其中的一组,抽查出的个体在该组上的频率为m,该组在频率分布直方图的高为h ,则|a-b|= . 答案 hm4.(2008·山东文,9)从某项综合能力测试中抽取100人的成绩,统计如表,则这100人成绩的标准差为 .答案 51025.为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁~18岁的男生体重(kg ),得到频率分布直方图如下:根据上图可得这100名学生中体重在[56.5,64.5)的学生人数是 . 答案 40基础自测典型例题:例1 在学校开展的综合实践活动中,某班进行了小制作评比,作品上交时间为5月1日至30日,评委会把同学们上交 作品的件数按5天一组分组统计,绘制了频率分布直方图(如图所示),已知从左到右各长方形高的比为2∶3∶4∶6∶4∶1,第三组的频数为12,请解答下列问题: (1)本次活动共有多少件作品参加评比? (2)哪组上交的作品数量最多?有多少件?(3)经过评比,第四组和第六组分别有10件、2件作品获奖,问这两组哪组获奖率高? 解 (1)第三组的频率为1464324+++++=51又因为第三组的频数为12,∴参评作品数为5112=60.(2)根据频率分布直方图,可以看出第四组上交的作品数量最多,共有60×1464326+++++=18(件).(3)第四组的获奖率是1810=95,第六组上交的作品数量为60×1464321+++++=3(件),∴第六组的获奖率为32=96,显然第六组的获奖率高.例4(14分)某化肥厂甲、乙两个车间包装肥料,在自动包装传送带上每隔30 min 抽取一包产品,称其重量,分别 记录抽查数据如下: 甲:102, 101, 99, 98, 103, 98,99;乙:110, 115, 90,85,75,115, 110.(1)这种抽样方法是哪一种? (2)将这两组数据用茎叶图表示;(3)将两组数据比较,说明哪个车间产品较稳定. 解 (1)因为间隔时间相同,故是系统抽样. 2分(2)茎叶图如下:5分(3)甲车间: 平均值:1x =71(102+101+99+98+103+98+99)=100,7分方差:s 12=71[(102-100)2+(101-100)2+…+(99-100)2]≈3.428 6.9分乙车间:平均值:2x =71(110+115+90+85+75+115+110)=100,11分方差:s 22=71[(110-100)2+(115-100)2+…+(110-100)2]≈228.571 4.13分∵1x =2x ,s 12<s 22,∴甲车间产品稳定.14分练习:1.为了了解小学生的体能情况,抽取了某小学同年级部分学生进行跳绳测试,将所得数据整理后,画出频率分布直方图如图所示,已知图中从左到右前三个小组的频率分别是0.1,0.3,0.4,第一小组的频数为5.(1)求第四小组的频率;(2)参加这次测试的学生人数是多少?(3)在这次测试中,学生跳绳次数的中位数落在第几小组内? 解 (1)第四小组的频率=1-(0.1+0.3+0.4)=0.2. (2)设参加这次测试的学生人数是n, 则有n=第一小组频率第一小组频数=5÷0.1=50(人).(3)因为0.1×50=5,0.3×50=15,0.4×50=20,0.2×50=10,即第一、第二、第三、第四小组的频数分别为5、15、20、10,所以学生跳绳次数的中位数落在第三小组内. 练习:一、填空题1.下列关于频率分布直方图的说法中不正确的是 . ①直方图的高表示取某数的频率②直方图的高表示该组上的个体在样本中出现的频率 ③直方图的高表示该组上的个体数与组距的比值④直方图的高表示该组上的个体在样本中出现的频率与组距的比值 答案 ①②③2.甲、乙两名新兵在同样条件下进行射击练习,每人打5发子弹,命中环数如下:甲:6,8,9,9,8;乙:10,7,7,7,9.则这两人的射击成绩 比 稳定. 答案 甲 乙4.某班50名学生在一次百米测试中,成绩全部介于13秒与19秒之间,将测试结果分成六组:右图是得到的频率分布直方图.设成绩小于17秒的学生人数占全班总人数的百分比为x,成绩大于等于15秒且小于17秒的学生人数为y ,则从频率分布直方图中可分析出x 和y 分别为 . 答案 0.9, 356.甲、乙两名同学在5次体育测试中的成绩统计的茎叶图如图所示,若甲、乙两人的平均成绩分别是x 甲、x 乙,则x 甲 x 乙, 比 稳定. 答案 < 乙 甲7.(上海,9)已知总体的各个体的值由小到大依次为2,3,3,7,a ,b ,12,13.7,18.3,20,且总体的中位数为10.5.若要使该总体的方差最小,则a 、b 的取值分别是 . 答案 10.5、10.5二、解答题10.为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少? (3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由. 解 (1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小, 因此第二小组的频率为:391517424+++++=0.08.又因为频率=样本容量第二小组频数, 所以样本容量=第二小组频率第二小组频数=08.012=150. (2)由图可估计该学校高一学生的达标率约为39151742391517++++++++×100%=88%.(3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内.线性回归方程1.下列关系中,是相关关系的为 (填序号). ①学生的学习态度与学习成绩之间的关系;基础自测②教师的执教水平与学生的学习成绩之间的关系;③学生的身高与学生的学习成绩之间的关系;④家庭的经济条件与学生的学习成绩之间的关系.答案①②2.为了考察两个变量x、y之间的线性相关关系,甲、乙两同学各自独立地做10次和15次试验,并利用最小二乘法求得回归直线分别为l1和l2.已知在两人的试验中发现变量x的观测数据的平均值恰好相等,都为s,变量y的观测数据的平均值也恰好相等,都为t,那么下列说法中正确的是(填序号).①直线l1,l2有交点(s,t)②直线l1,l2相交,但是交点未必是(s,t)③直线l1,l2由于斜率相等,所以必定平行④直线l1,l2必定重合答案①3.下列有关线性回归的说法,正确的是(填序号).①相关关系的两个变量不一定是因果关系②散点图能直观地反映数据的相关程度③回归直线最能代表线性相关的两个变量之间的关系④任一组数据都有回归直线方程答案①②③4.下列命题:①线性回归方法就是由样本点去寻找一条贴近这些样本点的直线的数学方法;②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示;③通过回归直线yˆ=bˆx+aˆ及回归系数bˆ,可以估计和预测变量的取值和变化趋势. 其中正确命题的序号是 .答案①②③5.已知回归方程为yˆ=0.50x-0.81,则x=25时,yˆ的估计值为 .答案11.69例1下面是水稻产量与施化肥量的一组观测数据:施化肥量15 20 25 30 35 40 45水稻产量320 330 360 410 460 470 480(1)将上述数据制成散点图;(2)你能从散点图中发现施化肥量与水稻产量近似成什么关系吗?水稻产量会一直随施化肥量的增加而增长吗?解(1)散点图如下:(2)从图中可以发现施化肥量与水稻产量具有线性相关关系,当施化肥量由小到大变化时,水稻产量由小变大,图中的数据点大致分布在一条直线的附近,因此施化肥量和水稻产量近似成线性相关关系,但水稻产量只是在一定范围内随着化肥施用量的增加而增长.例2(14分)随着我国经济的快速发展,城乡居民的生活水平不断提高,为研究某市家庭平均收入与月平均生活支出的关系,该市统计部门随机调查了10个家庭,得数据如下:(1)判断家庭平均收入与月平均生活支出是否相关?(2)若二者线性相关,求回归直线方程.解(1)作出散点图:5分观察发现各个数据对应的点都在一条直线附近,所以二者呈线性相关关系. 7分(2)x =101 (0.8+1.1+1.3+1.5+1.5+1.8+2.0+2.2+2.4+2.8)=1.74,y=101(0.7+1.0+1.2+1.0+1.3+1.5+1.3+1.7+2.0+2.5)=1.42,9分bˆ=∑∑==-∙-ni ini i i x n xyx n y x 1221≈0.813 6,aˆ=1.42-1.74×0.813 6≈0.004 3,13分 ∴回归方程yˆ=0.813 6x+0.004 3.14分例3 下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y (吨)标准煤的几组对照数据.(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程yˆ=b ˆx+a ˆ; (3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤? (参考数值:3×2.5+4×3+5×4+6×4.5=66.5) 解 (1)散点图如下图:(2)x =46543+++=4.5,y =45.4435.2+++=3.5∑=41i ii yx =3×2.5+4×3+4×5+6×4.5=66.5.∑=412i ix=32+42+52+62=86∴bˆ=24124144x x yx yx i i i ii -∙-∑∑===25.44865.45.345.66⨯-⨯⨯-=0.7aˆ =y -bˆx =3.5-0.7×4.5=0.35. ∴所求的线性回归方程为yˆ=0.7x+0.35. (3)现在生产100吨甲产品用煤 y=0.7×100+0.35=70.35,∴降低90-70.35=19.65(吨)标准煤.1.科研人员为了全面掌握棉花新品种的生产情况,查看了气象局对该地区年降雨量与年平均气温的统计数据(单位分别是mm,℃),并作了统计.(1)试画出散点图;(2)判断两个变量是否具有相关关系. 解 (1)作出散点图如图所示,(2)由散点图可知,各点并不在一条直线附近,所以两个变量是非线性相关关系.2.在研究硝酸钠的可溶性程度时,对于不同的温度观测它在水中的溶解度,得观测结果如下:由资料看y 与x 呈线性相关,试求回归方程. 解 x =30,y =50.1283.1120.850.767.66++++=93.6.bˆ=25125155x xyx yx i ii ii -∙-∑∑==≈0.880 9.aˆ=y -bˆx =93.6-0.880 9×30=67.173. ∴回归方程为yˆ=0.880 9x+67.173.3.某企业上半年产品产量与单位成本资料如下:(1)求出线性回归方程;(2)指出产量每增加1 000件时,单位成本平均变动多少? (3)假定产量为6 000件时,单位成本为多少元? 解 (1)n=6,∑=61i i x =21,∑=61i i y =426,x =3.5,y =71,∑=612i i x =79,∑=61i i i y x =1 481,bˆ=26126166x xyx yx i ii ii -∙-∑∑===25.3679715.364811⨯-⨯⨯-=-1.82.aˆ=y-bˆx=71+1.82×3.5=77.37.回归方程为yˆ=aˆ+bˆx=77.37-1.82x.(2)因为单位成本平均变动bˆ=-1.82<0,且产量x的计量单位是千件,所以根据回归系数b的意义有: 产量每增加一个单位即1 000件时,单位成本平均减少1.82元.(3)当产量为6 000件时,即x=6,代入回归方程:yˆ=77.37-1.82×6=66.45(元)当产量为6 000件时,单位成本为66.45元.一、填空题1.观察下列散点图,则①正相关;②负相关;③不相关.它们的排列顺序与图形对应顺序是 .答案a,c,b2.回归方程yˆ=1.5x-15,则下列说法正确的有个.①y=1.5x-15②15是回归系数a③1.5是回归系数a④x=10时,y=0答案 13.(2009.湛江模拟)某地区调查了2~9岁儿童的身高,由此建立的身高y(cm)与年龄x(岁)的回归模型为yˆ=8.25x+60.13,下列叙述正确的是 .①该地区一个10岁儿童的身高为142.63 cm②该地区2~9岁的儿童每年身高约增加8.25 cm③该地区9岁儿童的平均身高是134.38 cm④利用这个模型可以准确地预算该地区每个2~9岁儿童的身高答案 ②4.三点(3,10),(7,20),(11,24)的回归方程是 .答案 yˆ=1.75x+5.75 5.某人对一地区人均工资x(千元)与该地区人均消费y(千元)进行统计调查,y 与x 有相关关系,得到回归直线方程yˆ=0.66x+1.562.若该地区的人均消费水平为7.675千元,估计该地区的人均消费额占人均工资收入的百分比约为 . 答案 83%6.某化工厂为预测产品的回收率y,需要研究它和原料有效成分含量x 之间的相关关系,现取8对观测值,计算,得∑=81i i x =52, ∑=81i i y =228, ∑=812i i x =478, ∑=81i i i y x =1 849,则其线性回归方程为 .答案 yˆ=11.47+2.62x 7.有下列关系:①人的年龄与他(她)拥有的财富之间的关系;②曲线上的点与该点的坐标之间的关系;③苹果的产量与气候之间的关系;④森林中的同一种树木,其断面直径与高度之间的关系.其中,具有相关关系的是 . 答案 ①③④8.已知关于某设备的使用年限x 与所支出的维修费用y(万元),有如下统计资料:若y 对x 呈线性相关关系,则回归直线方程yˆ=b ˆx+a ˆ表示的直线一定过定点 . 答案 (4,5) 二、解答题9.期中考试结束后,记录了5名同学的数学和物理成绩,如下表:(1)数学成绩和物理成绩具有相关关系吗?(2)请你画出两科成绩的散点图,结合散点图,认识(1)的结论的特点. 解 (1)数学成绩和物理成绩具有相关关系.(2)以x 轴表示数学成绩,y 轴表示物理成绩,可得相应的散点图如下:由散点图可以看出,物理成绩和数学成绩对应的点不分散,大致分布在一条直线附近. 10.以下是某地搜集到的新房屋的销售价格y 和房屋的面积x 的数据:(1)画出数据对应的散点图;(2)求线性回归方程,并在散点图中加上回归直线. 解 (1)数据对应的散点图如图所示:(2)x =109,y =23.2,∑=512i i x =60 975,∑=51i iiy x=12 952,bˆ=25125155x xyx yx i ii ii -∙-∑∑==≈0.196 2aˆ=y -bˆx ≈1.814 2 ∴所求回归直线方程为yˆ=0.196 2x+1.814 2.11.某公司利润y 与销售总额x(单位:千万元)之间有如下对应数据:(1)画出散点图; (2)求回归直线方程;(3)估计销售总额为24千万元时的利润. 解 (1)散点图如图所示:(2)x =71(10+15+17+20+25+28+32)=21,y=71(1+1.3+1.8+2+2.6+2.7+3.3)=2.1,∑=712i ix=102+152+172+202+252+282+322=3 447,∑=71i iiy x=10×1+15×1.3+17×1.8+20×2+25×2.6+28×2.7+32×3.3=346.3,bˆ=27127177x x yx yx i i i ii -∙-∑∑===221744731.22173.346⨯-⨯⨯-≈0.104, aˆ=y -bˆx =2.1-0.104×21=-0.084, ∴yˆ=0.104x-0.084. (3)把x=24(千万元)代入方程得,yˆ=2.412(千万元).∴估计销售总额为24千万元时,利润为2.412千万元.12.某种产品的广告费支出x 与销售额y(单位:百万元)之间有如下对应数据:(1)画出散点图;(2)求回归直线方程;(3)试预测广告费支出为10百万元时,销售额多大? 解 (1)根据表中所列数据可得散点图如下:(2)列出下表,并用科学计算器进行有关计算:因此,x =525=5,y =5250 =50,∑=512i i x =145, ∑=512i i y =13 500, ∑=51i i i y x =1 380.于是可得:bˆ=25125155x xyx yx i ii ii -∙-∑∑===55514550553801⨯⨯-⨯⨯-=6.5;aˆ=y -bˆx =50-6.5×5=17.5. 因此,所求回归直线方程为:yˆ=6.5x+17.5. (3)根据上面求得的回归直线方程,当广告费支出为10百万元时,yˆ=6.5×10+17.5=82.5(百万元),即这种产品的销售收入大约为82.5百万元.§11.4 统计案例1.对有线性相关关系的两个变量建立的回归直线方程y ˆ=a ˆ+b ˆx 中,回归系数bˆ与0的大小关系为 .(填序号) ①大于或小于 ②大于 ③小于 ④不小于答案 ①2.如果有90%的把握说事件A 和B 有关系,那么具体计算出的数据 2 2.706.(用“>”,“<”,“=”填空) 答案 >3.对两个变量y 与x 进行回归分析,分别选择不同的模型,它们的相关系数r 如下,其中拟合效果最好的模型是 .①模型Ⅰ的相关系数r 为0.98 ②模型Ⅱ的相关系数r 为0.80 ③模型Ⅲ的相关系数r 为0.50 ④模型Ⅳ的相关系数r 为0.25 答案 ①4.下列说法中正确的有:①若r >0,则x 增大时,y 也相应增大;②若r <0,则x 增大时,y 也相应增大;③若r=1或r=-1,则x 与y 的关系完全对应(有函数关系),在散点图上各个点均在一条直线上 . 答案 ①③基础自测例1 (14分)调查339名50岁以上人的吸烟习惯与患慢性气管炎的情况,获数据如下:试问:(1)吸烟习惯与患慢性气管炎是否有关? (2)用假设检验的思想给予证明. (1)解 根据列联表的数据,得到χ2=))()()(()(2c d b d c a b a bc ad n ++++-2分 =13428356205)1316212143(3392⨯⨯⨯⨯-⨯⨯=7.469>6.6356分 所以有99%的把握认为“吸烟与患慢性气管炎有关”.9分(2)证明 假设“吸烟与患慢性气管炎之间没有关系”,由于事件A={χ2≥6.635}≈0.01,即A 为小概率事件,而小概率事件发生了,进而得假设错误,这种推断出错的可能性约有1%.14分例2 一台机器使用时间较长,但还可以使用.它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有 缺点零件的多少,随机器运转的速度而变化,下表为抽样试验结果:(1)对变量y 与x 进行相关性检验;(2)如果y 与x 有线性相关关系,求回归直线方程;(3)若实际生产中,允许每小时的产品中有缺点的零件最多为10个,那么,机器的运转速度应控制在什么范围内?解 (1)x =12.5,y =8.25,∑=41i iiy x=438,4x y =412.5,∑=412i i x =660,∑=412i i y =291,所以r=)4)(4(42412241241y yx xyx yx i ii ii ii --∙-∑∑∑====)25.272291()625660(5.412438-⨯--=25.6565.25≈62.2550.25≈0.995 4.因为r >r 0.05,所以y 与x 有很强的线性相关关系.(2)yˆ=0.728 6x-0.857 1. (3)要使yˆ≤10⇒0.728 6x-0.857 1≤10, 所以x ≤14.901 3.所以机器的转速应控制在14.901 3转/秒以下.例3 下表是某年美国旧轿车价格的调查资料,今以x 表示轿车的使用年数,y 表示相应的年均价格,求y 关于x 的回归 方程.解 作出散点图如图所示.可以发现,各点并不是基本处于一条直线附近,因此,y 与x 之间应是非线性相关关系.与已学函数图象比较,用y ˆ=e a x b ˆˆ来刻画题中模型更为合理,令zˆ=ln y ˆ,则z ˆ=b ˆx+a ˆ,题中数据变成如下表所示:相应的散点图如图所示,从图中可以看出,变换的样本点分布在一条直线附近,因此可以用线性回归方程拟合.由表中数据可得r ≈-0.996.|r|>r 0.05.认为x 与z之间具有线性相关关系,由表中数据得bˆ≈-0.298,a ˆ≈8.165,所以z ˆ=-0.298x+8.165,最后回代z ˆ=ln y ˆ,即y ˆ=e -0.298x+8.165为所求.1.某班主任对全班50名学生学习积极性和对待班级工作的态度进行了调查,统计数据如下表所示:(1)如果随机抽查这个班的一名学生,那么抽到积极参加班级工作的学生的概率是多少?抽到不太主动参加班级工作且学习积极性一般的学生的概率是多少?(2)试运用独立性检验的思想方法分析:学生的学习积极性与对待班级工作的态度是否有关系?说明理由.解 (1)随机抽查这个班的一名学生,有50种不同的抽查方法,由于积极参加班级工作的学生有18+6=24人,所以有24种不同的抽法,因此由古典概型的计算公式可得抽到积极参加班级工作的学生的概率是P 1=5024=2512,又因为不太主动 参加班级工作且学习积极性一般的学生有19人,所以抽到不太主动参加班级工作且学习积极性一般的学生的概率是P 2=5019.(2)由2χ统计量的计算公式得2χ=25252624)761918(502⨯⨯⨯⨯-⨯⨯≈11.538,由于11.538>10.828,所以可以有99.9%的把握认为“学生的学习积极性与对待班级工作的态度有关系”.2.某个体服装店经营某种服装,一周内获纯利y (元)与该周每天销售这种服装的件数x 之间的一组数据如下:已知∑=712i i x =280, ∑=712i i y =45 309, ∑=71i i i y x =3 487,此时r 0.05=0.754.(1)求x ,y ;(2)判断一周内获纯利润y 与该周每天销售件数x 之间是否线性相关,如果线性相关,求出回归直线方程.解 (1)x =71(3+4+5+6+7+8+9)=6,y=71 (66+69+73+81+89+90+91)≈79.86.(2)根据已知∑=712i i x =280, ∑=712i i y =45 309, ∑=71i i i y x =3 487,得相关系数 r=)86.79730945)(67280(86.7967487322⨯-⨯-⨯⨯-≈0.973.由于0.973>0.754,所以纯利润y与每天销售件数x 之间具有显著线性相关关系. 利用已知数据可求得回归直线方程为yˆ=4.746x+51.386.3.某种书每册的成本费y (元)与印刷册数x (千册)有关,经统计得到数据如下:检验每册书的成本费y 与印刷册数的倒数x1之间是否具有线性相关关系,如有,求出y 对x 的回归方程.解 首先作变量置换,令u=x1,题目所给数据变成如下表所示的10对数据:然后作相关性检验.经计算得r ≈0.999 8>0.75,从而认为u 与y 之间具有线性相关关系.由公式得aˆ≈1.125,b ˆ≈8.973, 所以yˆ=1.125+8.973u, 最后回代u=x1,可得y ˆ=1.125+x973.8,这就是题目要求的y 对x 的回归曲线方程.回归曲线的图形如图所示,它是经过平移的反比例函数图象的一个分支.一、填空题1.对于独立性检验,下列说法中正确的是 . ①2χ的值越大,说明两事件相关程度越大 ②2χ的值越小,说明两事件相关程度越小 ③2χ≤2.706时,有90%的把握说事件A 与B 无关 ④2χ>6.635时,有99%的把握说事件A 与B 有关 答案 ①②④2.工人月工资y (元)依劳动生产率x(千元)变化的回归方程为y ˆ=50+80x ,下列判断正确的是 .①劳动生产率为1 000元时,工资为130元。

统计学案例

统计学案例

统计学案例总量指标与相对指标案例1:指出下面的统计分析报告摘要错在哪里?并改正:1、本厂按计划规定,第一季度的单位产品成本应比去年同期降低10%,实际执行结果是,单位产品成本较去年同期降低8%,仅完成产品成本计划的80%(即8%÷10%=80%)。

2、本厂的劳动生产率(按全部职工计算)计划在去年的基础上提高8%,计划执行结果仅提高4%,劳动生产率的计划任务仅实现一半(即4%÷8%=50%)。

3、该车间今年1月份生产老产品的同时,新产品首次小批投产,出现了2件废品(按计算,车间废品率为1.2%)。

2月份老产品下马,新产品大批投产,全部制品1000件,其中废品8件,废品量是1月份的4倍,因此产品质量下降了。

4、在组织生产中,本厂先进小组向另一组提出高产优质的挑战竞赛。

本月先进小组的产量超过了另一小组的1倍,但是在两组废品总量中该组却占了60%,所以在产品质量方面,先进小组明显地落后了。

案例11试计算所有可能计算的相对指标。

案例2:根据下表资料分析哪个企业对社会贡献更大?平均指标与变异指标案例3、以组平均数补充说明总平均数案例4:某单位有10个人,其中1人月工资为10万元,9人每人月工资为1000元。

该单位职工月平均工资为10900元。

即:)(109001091000100000元=⨯+你认为这个平均数有代表性吗?如果缺乏代表性应如何改正?案例5:以下是各单位统计分析报告的摘录1、 本局所属30个工厂,本月完成生产计划的情况是不一致的。

完成计划90%的有3个,完成96%的有5个,完成102%的有10个,完成110%的有8个,完成120%的有4个。

平均全局生产计划完成程度为104.33%。

即:304%1208%11010%1025%963%90⨯+⨯+⨯+⨯+⨯=104.33%2、 本厂开展增产节约运动以后,产品成本月月下降,取得显著的成绩,根据财务部门的报告,1 月份开支总成本15000元,平均单位产品成本为15元,2月份开支总成本25000元,平均单位产品成本下降为10元,3月份开支总成本45000元,平均单位产品成本仅8元。

统计与统计案例练习题及知识点总结(全面)-高考数学

统计与统计案例练习题及知识点总结(全面)-高考数学

统计与统计案例练习题与知识点总结1.为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:根据此频率分布直方图,下面结论中不正确的是()A.该地农户家庭年收入低于4.5万元的农户比率估计为6%B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%C.估计该地农户家庭年收入的平均值不超过6.5万元D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间【答案】C【分析】根据直方图的意义直接计算相应范围内的频率,即可判定ABD,以各组的中间值作为代表乘以相应的频率,然后求和即得到样本的平均数的估计值,也就是总体平均值的估计值,计算后即可判定C.【详解】因为频率直方图中的组距为1,所以各组的直方图的高度等于频率.样本频率直方图中的频率即可作为总体的相应比率的估计值.该地农户家庭年收入低于4.5万元的农户的比率估计值为0.020.040.066%+==,故A 正确;该地农户家庭年收入不低于10.5万元的农户比率估计值为0.040.0230.1010%+⨯==,故B 正确;该地农户家庭年收入介于4.5万元至8.5万元之间的比例估计值为0.100.140.2020.6464%50%++⨯==>,故D 正确;该地农户家庭年收入的平均值的估计值为30.0240.0450.1060.1470.2080.2090.10100.10110.04120.02130.02140.027.68⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯=(万元),超过6.5万元,故C 错误.综上,给出结论中不正确的是C.故选:C.【点睛】本题考查利用样本频率直方图估计总体频率和平均值,属基础题,样本的频率可作为总体的频率的估计值,样本的平均值的估计值是各组的中间值乘以其相应频率然后求和所得值,可以作为总体的平均值的估计值.注意各组的频率等于⨯频率组距组距.2.甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:一级品二级品合计甲机床15050200乙机床12080200合计270130400(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?(2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?附:22()()()()()n ad bc K a b c d a c b d -=++++()2P K k ≥0.0500.0100.001k3.8416.63510.828【答案】(1)75%;60%;(2)能.【分析】本题考查频率统计和独立性检验,属基础题,根据给出公式计算即可【详解】(1)甲机床生产的产品中的一级品的频率为15075% 200=,乙机床生产的产品中的一级品的频率为12060% 200=.(2)()22400150801205040010 6.63527013020020039K⨯-⨯==>>⨯⨯⨯,故能有99%的把握认为甲机床的产品与乙机床的产品质量有差异.1.随机抽样(1)简单随机抽样:一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.(2)分层抽样:一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.2.用样本的频率分布估计总体分布(1)在频率分布直方图中,纵轴表示频率/组距,数据落在各小组内的频率用各小长方形的面积表示.各小长方形的面积的总和等于1.(2)频率分布折线图和总体密度曲线①频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.②总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线.(3)茎叶图茎是指中间的一列数,叶是从茎的旁边生长出来的数.3.用样本的数字特征估计总体的数字特征(1)众数:一组数据中出现次数最多的数.(2)中位数:将数据从小到大排列,若有奇数个数,则最中间的数是中位数;若有偶数个数,则中间两数的平均数是中位数.(3)平均数:x=x1+x2+…+x nn,反映了一组数据的平均水平.(4)标准差:是样本数据到平均数的一种平均距离,s=1[x1-x2+x2-x2+…+x n-x2].n[(x1-x)2+(x2-x)2+…+(x n-x)2](x n是样本数据,n是样本容量,x是样本平均数).(5)方差:s2=1n4.相关关系与回归方程(1)相关关系的分类①正相关在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关.②负相关在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关.(2)线性相关关系如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.(3)回归方程①最小二乘法求回归直线,使得样本数据的点到它的距离的平方和最小的方法叫做最小二乘法.②回归方程方程y ^=b ^x +a ^是两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )的回归方程,其中a ^,b ^是待定参数.(4)回归分析①定义:对具有相关关系的两个变量进行统计分析的一种常用方法.②样本点的中心对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其中(x ,y )称为样本点的中心.③相关系数当r >0时,表明两个变量正相关;当r <0时,表明两个变量负相关.r 的绝对值越接近于1,表明两个变量的线性相关性越强.r 的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r |大于0.75时,认为两个变量有很强的线性相关性.5.独立性检验(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.(2)列联表:列出的两个分类变量的频数表,称为列联表.假设有两个分类变量X 和Y ,它们的可能取值分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(称为2×2列联表)为2×2列联表y 1y 2总计x 1a b a +b x 2c d c +d 总计a +cb +da +b +c +d构造一个随机变量K 2=n ad -bc 2a +bc +d a +cb +d,其中n =a +b +c +d 为样本容量.(3)独立性检验:利用随机变量K 2来判断“两个分类变量有关系”的方法称为独立性检验.1.如图为国家统计局2021年1月19日发布的2020年各季度社会消费品零售总额及增速,则下列说法:①各季度社会消费品零售总额增速最快的是4季度;②各季度社会消费品零售总额增速最快的是2季度;③各季度社会消费品零售总额增量最大的是4季度;④各季度社会消费品零售总额增量最大的是2季度.其中所有正确说法的序号为()A.①④B.②③C.①③D.②④2.下图是2020年我国居民消费价格月度涨跌幅度图(来源于国家统计局网站)下列说法错误的是()A.1~12月月度同比的平均值为2.55B .1~12月月度环比的平均值为负数C .1~12月月度同比整体为下降趋势D .1~12月月度环比的方差大于月度同比的方差3.已知相关变量x 和y 的散点图如图所示,若用()11ln y b k x =⋅与22y kx b =+拟合时的相关系数分别为12,r r 则比较12,r r 的大小结果为()A .12r r >B .12r r =C .12r r <D .不确定4.下列说法中错误的个数是①某校共有女生2021人,用简单随机抽样的方法先剔除21人,再按系统抽样的方法抽取为200人,则每个女生被抽到的概率为110;②由样本数据得到的回归直线方程y bx a =+$$$必经过样本中心点()x y ;③如果落在回归直线上的样本点越多,则回归直线方程的拟合效果就越好;④在一个2×2列联表中,由计算得出220.21K =,而()210.8280.001P K ≥≈,则在犯错误的概率不超过0.001的前提下认为这两个变量之间有相关关系.()A .1B .2C .3D .45.质检机构为检测一大型超市某商品的质量情况,从编号为1~120的该商品中利用系统抽样的方法抽8件进行质检,若所抽样本中含有编号67的商品,则下列编号一定被抽到的是()A .112B .53C .38D .96.2020年是全面实现小康社会目标的一年,也是全面打赢脱贫攻坚战的一年,某研究性学习小组调查了某脱贫县的甲、乙两个家庭,对他们过去6年(2014年到2019年)的家庭收入情况分别进行统计,发现他们的收入逐年增长,得到这两个家庭的年人均纯收入(单位:百元/人)茎叶图.对甲、乙两个家庭的年人均纯收入(以下分别简称“甲”“乙”)情况的判断,不正确的是()A.过去的6年,“甲”的极差小于“乙”的极差B.过去的6年,“甲”的平均值小于“乙”的平均值C.过去的6年,“甲”的中位数小于“乙”的中位数D.过去的6年,“甲”的平均增长率小于“乙”的平均增长率7.为了普及新冠肺炎知识,增强疫情防控意识,某学校从高一和高二两个年级各抽取5位同学参加新冠肺炎知识测试,得分(十分制)情况如下表所示,则下列描述正确的是()高一年级组高二年级组得分45678得分569频数11111频数311A.高一年级组数据的平均数为6分,高二年级组数据的平均数为5分B.两组数据的中位数都是6分C.高一年级组数据的极差小于高二年级组数据的极差D.高一年级组成绩的方差小于高二年级组成绩的方差8.某中学2018年的高考考生人数是2015年高考考生人数的1.5倍,为了更好地对比该校考生的升学情况,统计了该校2015年和2018年的高考情况,得到如图柱状图:则下列结论正确的是()A.与2015年相比,2018年一本达线人数减少B .与2015年相比,2018年二本达线人数增加了0.5倍C .2015年与2018年艺体达线人数相同D .与2015年相比,2018年不上线的人数有所增加9.m 个数据的平均数为a ,中位数为b ,方差为c .若将这m 个数据均扩大到原来的2倍得到一组新数据,则下列关于这组新数据的说法正确的是()A .平均数为aB .中位数为2bC D .方差为2c10.已知变量y 关于x 的回归方程为0.5bx y e -=,其一组数据如表所示:若5x =,则预测y 值可能为()x1234ye3e 4e 6e A .5e B .112e C .7e D .152e 11.给出下列说法:①回归直线ˆˆˆy bx a =+恒过样本点的中心(x y ,且至少过一个样本点;②两个变量相关性越强,则相关系数||r 就越接近1;③将一组数据的每个数据都加一个相同的常数后,方差不变;④在回归直线方程ˆ20.5yx =-中,当解释变量x 增加一个单位时,预报变量ˆy 平均减少0.5个单位.其中说法正确的是()A .①②④B .②③④C .①③④D .②④12.在一次对性别与是否说谎有关的调查中,得到如下数据,根据表中数据判断如下结论中正确的是()性别说谎不说谎总计男6713女8917总计141630A .在此次调查中有95%的把握认为是否说谎与性别有关B .在此次调查中有99%的把握认为是否说谎与性别有关C .在此次调查中有99.5%的把握认为是否说谎与性别有关D .在此次调查中没有充分证据显示说谎与性别有关13.下列四个命题中,正确的有()①两个变量间的相关系数r 越小,说明两变量间的线性相关程度越低;②命题“x ∃∈R ,使得210x x ++<”的否定是:“对x ∀∈R ,均有210x x ++>”;③命题“p g ∧为真”是命题“p q ∨为真”的必要不充分条件;④若函数322()3f x x ax bx a =+++在1x =-有极值0,则2a =,9b =或1a =,3b =.A .0B .1C .2D .314.某中学共有1000人,其中男生700人,女生300人,为了了解该校学生每周平均体育锻炼时间的情况以及经常进行体育锻炼的学生是否与性别有关(经常进行体育锻炼是指:周平均体育锻炼时间不少于4小时),现在用分层抽样的方法从中收集200位学生每周平均体育锻炼时间的样本数据(单位:小时),其频率分布直方图如图.已知在样本数据中,有40位女生的每周平均体育锻炼时间超过4小时,根据独立性检验原理()附:()()()()()22n ad bc K a c b d a d b c -=++++,其中n a b c d =+++.()20P K k ≥0.100.050.010.0050k 2.7063.8416.6357.879A .有95%的把握认为“该校学生每周平均体育锻炼时间与性别无关”B .有90%的把握认为“该校学生每周平均体育锻炼时间与性别有关”C .有90%的把握认为“该校学生每周平均体育锻炼时间与性别无关”D .有95%的把握认为“该校学生每周平均体育锻炼时间与性别有关”15.下图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的概率为()A.0.2B.0.4C.0.5D.0.616.设一组样本数据x1,x2,…,x n的方差为0.01,则数据10x1,10x2,…,10x n的方差为()A.0.01B.0.1C.1D.1017.下图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件)若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为A.5,5B.3,5C.3,7D.5,718.某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):锻炼人次[0,200](200,400](400,600]空气质量等级1(优)216252(良)510123(轻度污染)6784(中度污染)720(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?人次≤400人次>400空气质量好空气质量不好附:22()()()()()n ad bcKa b c d a c b d-=++++,P(K2≥k)0.0500.0100.001k 3.841 6.63510.82819.某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:满意不满意男顾客4010女顾客3020(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?附:22()()()()()n ad bcKa b c d a c b d-=++++.P(K2≥k)0.0500.0100.001k 3.841 6.63510.82820.为调查某地区老人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:是否需要志愿性别男女需要4030不需要160270(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?(3)根据(2)的结论,能否提供更好的调查方法来估计该地区老年人,需要志愿帮助的老年人的比例?说明理由附:1.C 【分析】根据折线统计图比较各季度社会消费品零售总额增速,可判断①②的正误;计算各季度社会消费品零售总额增量,可判断③④的正误.【详解】第1季度社会消费品零售总额增速为19.0%-,第2季度社会消费品零售总额增速为 3.9%-,第3季度社会消费品零售总额增速为0.9%,第4季度社会消费品零售总额增速为4.6%,故①正确,②错误;第2季度社会消费品零售总额增量为9.377.86 1.51-=(万亿元),第3季度社会消费品零售总额增量为10.119.370.74-=(万亿元),第4季度社会消费品零售总额增量为11.8710.11 1.76-=(万亿元).故③正确,④错误.故选:C.2.D 【分析】根据图表数据计算平均数,然后判断A 和B ;根据图表数据的变化趋势判断C 和D.【详解】同比平均数:()5.4 5.2 4.3 3.3 2.4 2.5 2.7 2.4 1.70.50.50.72.5512++++++++++-+=,环比平均数:()()()()()()1.40.8 1.20.90.80.10.60.40.20.30.60.20.02512++-+-+-+-++++-+-+=-,1-12月月度同比的平均值为2.55,选项A 正确;1~12月月度环比的平均值为0.025-,选项B 正确;观察图表可以得出,1~12月月度同比整体为下降趋势,选项C 正确;1~12月月度环比的波动小于月度同比的波动,选项D 错误.故选:D .3.C 【分析】由散点图可知,对数形式的拟合程度高,再根据负相关,比较两个相关系数大小.【详解】由散点图可知,()11ln y b k x =拟合比用22y k x b =+拟合的程度高,故12r r >;又因为此关系为负相关,1212,r r r r ∴->-<故选:C 4.B 【分析】由古典概型的特征可判断①;由回归直线方程的特征可判断②③;由独立性检验思想可判断④.【详解】①错误,古典概率中,每个个体被抽的概率都是一样的,都等于2002021;②正确由回归直线方程的特征可知回归直线方程y bx a =+$$$必经过样本中心点(),x y ;③错误,落在回归直线附近的样本点越多,则回归直线方程的拟合效果越好;④正确,当220.21K =,而()210.8280.001P K ≥≈,则在犯错误的概率不超过0.001的前提下认为这两个变量之间有相关关系所以错误个数为2.故选:B.5.A 【分析】根据系统抽样的特征,结合所给编号求出第一组抽取商品编号,即可求解.【详解】由题意知,组距为120158=,设第一组抽取编号为k ,则第n 组抽取的编号为15(1)n k -+,样本中含有编号67的商品,即15(51)67k ⨯-+=,可得7k =,因为1577112⨯+=,即第8组中抽取商品的编号为112.故选:A 6.B 【分析】对茎叶图进行数据分析,分别计算极差、平均数、中位数、及平均增长率,依次判断四个选项.【详解】对于A ,甲的极差为42366-=,乙的极差为41347-=,所以“甲”的极差小于“乙”的极差,A 正确;对于B ,甲的平均数是1230(363737384042)66⨯+++++=,乙的平均数为1228(343638394041)66⨯+++++=,所以“甲”的平均值大于“乙”的平均值,B 错误;对于C ,甲的中位数是1(3738)37.52⨯+=,乙的中位数是1(3839)38.52⨯+=,所以,“甲”的中位数小于“乙”的中位数,C 正确;对于D ,设过去6年甲的平均增长率为x ,则()636142x +=,解得:1x =-,即过去61-;1-.因为42413634<,所以“甲”的平均增长率小于“乙”的平均增长率,D 正确.故选:B.7.D 【分析】根据表中数据,依次讨论各选项即可得答案.【详解】对于A 选项,高一年级和高二年级的平均分均为6分,故A 选项错误;对于B 选项,高一年级的中位数是6,高二年级的中位数是5,故B 选项错误;对于C 选项,高一年级的极差为4,高二年级的极差为3,故高一年级组数据的极差大于高二年级组数据的极差,故C 选项错误;对于D 选项,高一年成绩的方差为()()()()()2222221465666768625S ⎡⎤=-+-+-+-+-=⎣⎦,高二年级成绩的方差为()()()222213566696 2.45S ⎡⎤=-+-+-=⎣⎦,满足,故D 选项正确;故选:D 8.D 【分析】设2015年该校参加高考的人数为S ,则2018年该校参加高考的人数为1.5S ,观察柱状统计图,找出各数据,再利用各数量间的关系列式计算得到【详解】设2015年该校参加高考的人数为S ,则2018年该校参加高考的人数为1.5S.对于选项A :2015年一本达线人数为0.28S ,2018年一本达线人数为0.24×1.5S =0.36S ,可见一本达线人数增加了,故A 错误;对于选项B :2015年二本达线人数为0.32S ,2018年二本达线人数为0.4×1.5S =0.6S ,显然2018年二本达线人数不是增加了0.5倍,故B 错误;对于选项C :2015年和2018年艺体达线率没变,但是人数是不相同的,故C 错误;对于选项D :2015年不上线人数为0.32S ,2018年不上线人数为0.28×1.5S=0.42S ,不达线人数有所增加,故D 正确.故选:D 9.B 【分析】m 个12,,,n x x x 数据的平均数为a ,中位数为b ,方差为c .若将这m 个数据均扩大到原来的2倍得到一组新数据122,2,,2n x x x ,根据平均数、中位数、方差、标准差的定义进行判断即可.【详解】m 个12,,,n x x x 数据的平均数为a ,中位数为b ,方差为c .若将这m 个数据均扩大到原来的2倍得到一组新数据122,2,,2n x x x ,则由于平均数为所有数之和除以m ,故平均数变为2a ,故A 错;中位数为这组数从小到大排列后中间的那个数或中间两数和的平均数,由于每个数都变为原来2倍,所以中位数也变为原来的2倍,即2b ,故B 对;方差描述的是这组数的波动情况,12,,,n x x x 的方差为c ,则122,2,,2n x x x 的方差为224c c =2c =,故C,D 错;故选:B 【点睛】熟悉平均数、中位数、方差、标准差的概念,特别是一组数据扩大某个倍数或增加某个数值的情况下,平均数、中位数、方差、标准差的变化.10.D 【分析】将回归方程左右同时取对数得:ln 0.5y bx =-,看作回归直线的形式,由回归直线过样本中心点可构造方程求得b ,由此得到回归方程;将5x =代入回归方程即可求得结果.【详解】由0.5bx y e-=得:ln 0.5y bx =-,346ln ln ln ln 12340.544e e e e b ++++++∴=⋅-,解得: 1.6b =,∴回归方程为 1.60.5x y e -=,若5x =,则1580.52y e e -==.故选:D.【点睛】关键点点睛:本题考查非线性回归中的预估值的求解,解题关键是能够通过对指数型回归模型左右同时取对数,将其变为线性回归的形式来进行求解.11.B 【分析】①中,根据回归直线方程的特征,可判定是不正确;②中,根据相关系数的意义,可判定是是正确的;③中,根据方差的计算公式,可判定是正确的;④中,根据回归系数的含义,可判定是正确的.【详解】对于①中,回归直线ˆˆˆy bx a =+恒过样本点的中心(x y ,但不一定过一个样本点,所以不正确;对于②中,根据相关系数的意义,可得两个变量相关性越强,则相关系数||r 就越接近1,所以是正确的;对于③中,根据方差的计算公式,可得将一组数据的每个数据都加一个相同的常数后,方差是不变的,所以是正确的;对于④中,根据回归系数的含义,可得在回归直线方程ˆ20.5yx =-中,当解释变量x 增加一个单位时,预报变量ˆy平均减少0.5个单位,所以是正确的.故选:B.【点睛】本题主要考查了统计知识的相关概念及判定,其中解答中熟记回归直线方程的特征,回归系数的含义,相关系数的意义,以及方程的计算方法是解答的关键,属于基础题.12.D 【解析】根据上表数据可求得20.027 1.323k ≈<,再结合课本上的概率附表可知在此次调查中没有充分证据显示说谎与性别有关,故选D 13.A 【分析】根据相关系数的定义可知①错误;根据特称命题(又叫存在性命题)的否定可知②错误;根据真值表即可判断“p q ∧为真”是命题“p q ∨为真”的充分不必要条件,故③错误;由条件可得,(1)0,(1)0,f f '-=-=解得a=2,b=9或a=1,b=3,经检验,当a=1,b=3时,22()3633(1)0f x x x x '=++=+≥恒成立,此时()f x 没有极值点,故④错误。

数据的统计和分析练习题

数据的统计和分析练习题

数据的统计和分析练习题数据统计和分析是现代社会中非常重要的一项技能,它可以帮助我们更好地理解和解释各种现象和问题。

通过统计和分析数据,我们可以从中发现规律,做出准确的预测,以及支持科学研究和决策制定。

本文将为大家提供一些数据统计和分析的练习题,以帮助大家熟悉和掌握这一技能。

1. 题目:某餐厅的销售额统计某餐厅进行了一周的销售额统计,结果如下:周一:500元周二:800元周三:600元周四:700元周五:1000元周六:900元周日:1200元请回答以下问题:a) 这周餐厅的总销售额是多少?b) 这周餐厅的平均每天销售额是多少?c) 这周餐厅的销售额中位数是多少?d) 这周餐厅的销售额众数是多少?2. 题目:某公司员工的年龄统计某公司进行了员工年龄的统计调查,结果如下:25, 26, 28, 30, 32, 35, 36, 38, 40, 42请回答以下问题:a) 这些员工的平均年龄是多少?b) 这些员工的年龄中位数是多少?c) 这些员工的年龄众数是多少?3. 题目:某地区某年的降雨量统计某地区统计了某年的每个月的降雨量,结果如下:1月:30毫米2月:20毫米3月:40毫米4月:60毫米5月:80毫米6月:70毫米7月:90毫米8月:100毫米9月:80毫米10月:60毫米11月:40毫米12月:30毫米请回答以下问题:a) 这年的总降雨量是多少?b) 降雨量最大的月份是哪个月?c) 降雨量最小的月份是哪个月?4. 题目:某班级学生的考试成绩统计某班级进行了一次考试,并统计了学生的成绩,结果如下:95, 88, 92, 78, 85, 90, 68, 73, 80, 82请回答以下问题:a) 这次考试的平均成绩是多少?b) 这些学生的成绩中位数是多少?c) 这些学生中成绩最高的是多少?d) 这些学生中成绩最低的是多少?通过以上这些练习题,我们可以锻炼自己的数据统计和分析能力。

掌握这一技能将对我们在各个领域中的工作和研究都大有裨益。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第一章:统计案例一.选择题1. 炼钢时钢水的含碳量与冶炼时间有( )A.确定性关系B.相关关系C.函数关系D.无任何关系 2.下列说法正确的有( )①回归方程适用于一切样本和总体。

②回归方程一般都有时间性。

③样本取值的范围会影响回归方程的适用范围。

④回归方程得到的预报值是预报变量的精确值。

A. ①② B. ②③ C. ③④ D. ①③ 3.下列结论正确的是( )①函数关系是一种确定性关系; ②相关关系是一种非确定性关系 ③回归分析是对具有函数关系的两个变量进行统计分析的一种方法 ④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法。

A. ①② B. ①②③ C. ①②④ D. ①②③④ 4. 设有一个回归方程为y=2-2.5x,则变量x 增加一个单位时( ) A.y 平均增加2.5个单位 B.y 平均增加2个单位 C.y 平均减少2.5个单位 D.y 平均减少2个单位5.已知回归直线的斜率的估计值是1.23,样本点的中心为(4,5),则回归直线的方程是( ) A. y ∧=1.23x +4 B. y ∧=1.23x+5 C. y ∧=1.23x+0.08 D. y ∧=0.08x+1.23 6. 已知x 与y 之间的一组数据:则y 与x 的线性回归方程为y=bx+a 必过( )A.(2,2)点B.(1.5,0)点C.(1,2)点D.(1.5,4)点7. 在三维柱形图中,主对角线上两个柱形高度的乘积与副对角线上的两个柱形的高度的乘积相差越大两个变量有关系的可能性就( )A. 越大B.越小C.无法判断D. 以上都不对 8.身高与体重有关系可以用( )分析来分析A.殘差B.回归C.二维条形图D.独立检验9. 设两个变量x 和y 之间具有线性相关关系,它们的相关系数是r ,y 关于x 的回归直线的斜率是b ,纵截距是a ,那么必有( )A. b 与r 的符号相同B. a 与r 的符号相同C. b 与r 的相反D. a 与r 的符号相反10. 为研究变量x 和y 的线性相关性,甲、乙二人分别作了研究,利用线性回归方法得到回归直线方程1l 和2l ,两人计算知x 相同,y 也相同,下列正确的是( )A. 1l 与2l 重合B. 1l 与2l 一定平行C. 1l 与2l 相交于点),(y xD. 无法判断1l 和2l 是否相交 11. 考察棉花种子经过处理跟生病之间的关系得到如下表数据:A.种子经过处理跟是否生病有关B. 种子经过处理跟是否生病无关C.种子是否经过处理决定是否生病D. 以上都是错误的12.变量x 与y 具有线性相关关系,当x 取值16,14,12,8时,通过观测得到y 的值分别为11,9,8,5,若在实际问题中,y 的预报最大取值是10,则x 的最大取值不能超过( ) A.16 B.17 C.15 D.12 二.填空题13 .有下列关系:(1)人的年龄与他(她)拥有的财富之间的关系; (2)曲线上的点与该点的坐标之间的关系; (3)苹果的产量与气候之间的关系;(4)森林中的同一种树木,其断面直径与高度之间的关系;(5)学生与他(她)的学号之间的关系,其中有相关关系的是 14. 归直线方程为y=0.5x-0.81,则x=25时,y 的估计值为15. 在两个变量的回归分析中,作散点图的目的是______________________________16. 许多因素都会影响贫穷,教育也许是其中之一,在研究这两个因素的关系时收集了美国50个州的成年人受过9年或更少教育的百分比(x )和收入低于官方规定的贫困线的人数占本州人数的百分比(y )的数据,建立的回归直线方程如下ˆ0.8 4.6yx =+,斜率的估计等于0.8说明 ,成年人受过9年或更少教育的百分比(x )和收入低于官方的贫困线的人数占本州人数的百分比(y )之间的相关系数 (填充“大于0”或“小于0”) 三.解答题17. 在回归分析中,通过模型由解释变量计算预报变量时,应注意什么问题?18.若)101(,1531≤≤=+=i iy y i x i i ,求.,y x19.某企业为考察生产同一种产品的甲、乙两条生产线的产品合格率,同时各抽取100件产品,检验后得到如下联表:生产线与产品合格率列联表请问甲、乙两线生产的产品合格率在多大程度上有关系?20.为了研究某种细菌随时间x 变化,繁殖的个数,收集数据如下:(1) 用天数作解释变量,繁殖个数作预报变量,作出这些数据的散点图 (2) 描述解释变量与预报变量之间的关系 (3) 计算残差、相关指数R 2.1.1 回归分析的基本思想及其初步应用例题:1. 在画两个变量的散点图时,下面哪个叙述是正确的( )(A)预报变量在x 轴上,解释变量在y 轴上 (B)解释变量在x 轴上,预报变量在y 轴上(C)可以选择两个变量中任意一个变量在x 轴上 (D)可以选择两个变量中任意一个变量在y 轴上 2. 若一组观测值(x 1,y 1)(x 2,y 2)…(x n ,y n )之间满足y i =bx i +a+e i (i=1、2. …n)若e i 恒为0,则R 2为3. 假设关于某设备的使用年限x 和所支出的维修费用y (万元),有如下的统计资料:若由资料可知y 对x 呈线性相关关系试求:(1)线性回归方程;(2)估计使用年限为10年时,维修费用是多少?课后练习:1. 一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的回归模型为y=7.19x+73.93 用这个模型预测这个孩子10岁时的身高,则正确的叙述是( ) A.身高一定是145.83cm; B.身高在145.83cm 以上; C.身高在145.83cm 以下; D.身高在145.83cm 左右.2. 两个变量y 与x 的回归模型中,分别选择了4个不同模型,它们的相关指数2R 如下 ,其中拟合效果最好的模型是( )A.模型1的相关指数2R 为0.98B.模型2的相关指数2R 为0.80C.模型3的相关指数2R 为0.50D.模型4的相关指数2R 为0.253.在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是( ) A.总偏差平方和 B.残差平方和 C.回归平方和 D.相关指数R 24.工人月工资(元)依劳动生产率(千元)变化的回归直线方程为ˆ6090y x =+,下列判断正确的是( ) A.劳动生产率为1000元时,工资为50元 B.劳动生产率提高1000元时,工资提高150元 C.劳动生产率提高1000元时,工资提高90元 D.劳动生产率为1000元时,工资为90元5.线性回归模型y=bx+a+e中,b=_______,a=_________e称为_________6. 若有一组数据的总偏差平方和为100,相关指数为0.5,则期残差平方和为_______ 回归平方和为____________7. 一台机器使用的时间较长,但还可以使用,它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点零件的多少,随机器的运转的速度而变化,下表为抽样试验的结果:(1)变量y对x进行相关性检验;(2)如果y对x有线性相关关系,求回归直线方程;(3)若实际生产中,允许每小时的产品中有缺点的零件最多为10个,那么机器的运转速度应控制在什么范围内?1.2 独立性检验的基本思想及其初步应用例题:1.三维柱形图中柱的高度表示的是( )A.各分类变量的频数B.分类变量的百分比C.分类变量的样本数D.分类变量的具体值2. 统计推断,当______时,有95 %的把握说事件A 与B 有关;当______时,认为没有充分的证据显示事件A 与B 是有关的.3.为了探究患慢性气管炎与吸烟有无关系,调查了却339名50岁以上的人,结果如下表所示,据此数据请问:50岁以上的人患慢性气管炎与吸烟习惯有关系吗?课后练习:1. 在三维柱形图中,主对角线上两个柱形高度的乘积与副对角线上的两个柱形的高度的乘积相差越大两个变量有关系的可能性就()A.越大B.越小C.无法判断D.以上都不对2.下列关于三维柱形图和二维条形图的叙述正确的是: ( )A .从三维柱形图可以精确地看出两个分类变量是否有关系B .从二维条形图中可以看出两个变量频数的相对大小,从三维柱形图中无法看出相对频数的大小C .从三维柱形图和二维条形图可以粗略地看出两个分类变量是否有关系D .以上说法都不对K的观测值K ,说法正确的是()3.对分类变量X 与Y 的随机变量2A . k 越大," X 与Y 有关系”可信程度越小;B . k 越小," X 与Y 有关系”可信程度越小;C . k 越接近于0," X 与Y 无关”程度越小D . k 越大," X 与Y 无关”程度越大4. 在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是()A.若K2的观测值为k=6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;B.从独立性检验可知有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病;C.若从统计量中求出有95% 的把握认为吸烟与患肺病有关系,是指有5% 的可能性使得推判出现错误;D.以上三种说法都不正确.5.若由一个2*2列联表中的数据计算得k2=4.013,那么有把握认为两个变量有关系6.某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:性别 专业非统计专业统计专业 男 13 10 女720为了判断主修统计专业是否与性别有关系,根据表中的数据,得到250(1320107) 4.84423272030k ⨯⨯-⨯=≈⨯⨯⨯因为2 3.841K ≥,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为 ____;7.在对人们的休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人。

女性中有43人主要的休闲方式是看电视,另外27人主要的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动。

(1)根据以上数据建立一个2×2的列联表; (2)判断性别与休闲方式是否有关系。

高中新课标选修(1-2)统计案例测试题1一、选择题1.下列属于相关现象的是( )A .利息与利率B .居民收入与储蓄存款C .电视机产量与苹果产量D .某种商品的销售额与销售价格 2.如果有95%的把握说事件A 和B 有关,那么具体算出的数据满足( ) A .2 3.841K >B .2 3.841K <C .2 6.635K >D .2 6.635K <3.如图所示,图中有5组数据,去掉 组数据后(填字母代号),剩下的4组数据的线性相关性最大 A .EB .CC .DD .A4.为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果(单位:人)根据表中数据,你认为吸烟与患肺癌有关的把握有( ) A .90%B .95%C .99%D .100%5.调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据表:你认为婴儿的性别与出生时间有关系的把握为( ) A .80%B .90%C .95%D .99%6.已知有线性相关关系的两个变量建立的回归直线方程为y a bx =+,方程中的回归系数b ( ) A .可以小于0B .只能大于0C .可以为0D .只能小于07.每一吨铸铁成本c y (元)与铸件废品率x %建立的回归方程568c y x =+,下列说法正确的是( ) A .废品率每增加1%,成本每吨增加64元 B .废品率每增加1%,成本每吨增加8% C .废品率每增加1%,成本每吨增加8元 D .如果废品率增加1%,则每吨成本为56元8.下列说法中正确的有:①若0r >,则x 增大时,y 也相应增大;②若0r <,则x 增大时,y 也相应增大;③若1r =,或1r =-,则x 与y 的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上.( ) A .①②B .②③C .①③D .①②③9.有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表:如果某天气温是2℃,则这天卖出的热饮杯数约为( ) A .100B .143C .200D .24310.甲、乙两个班级进行一门考试,按照学生考试成绩优秀和不优秀统计成绩后,得到如下列联表:利用独立性检验估计,你认为推断“成绩与班级有关系”错误的概率介于()A.0.30.4B.0.40.5C.0.50.6D.0.60.7二、填空题11.某矿山采煤的单位成本Y与采煤量x有关,其数据如下:则Y对x的回归系数为.12.对于回归直线方程 4.75257=+,当28y xx=时,y的估计值为.13.在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶,则2K=.14.某工厂在2004年里每月产品的总成本y(万元)与该月产量x(万件)之间有如下一组数据:则月总成本y对月产量x的回归直线方程为.三、解答题15.某教育机构为了研究人具有大学专科以上学历(包括大学专科)和对待教育改革态度的关系,随机抽取了392名成年人进行调查,所得数据如下表所示:对于教育机构的研究项目,根据上述数据能得出什么结论.16.1907年一项关于16艘轮船的研究中,船的吨位区间位于192吨到3246吨,船员的人数从5人到32人,船员的人数关于船的吨位的回归分析得到如下结果:船员人数9.10.006=+⨯吨位.(1)假定两艘轮船相差1000吨,船员平均人数相差多少?(2)对于最小的船估计的船员数为多少?对于最大的船估计的船员数是多少?17.假设一个人从出生到死亡,在每个生日都测量身高,并作出这些数据散点图,则这些点将不会落在一条直线上,但在一段时间内的增长数据有时可以用线性回归来分析.下表是一位母亲给儿子作的成长记录:(1)作出这些数据的散点图;(2)求出这些数据的回归方程;(3)对于这个例子,你如何解释回归系数的含义?(4)用下一年的身高减去当年的身高,计算他每年身高的增长数,并计算他从3~16岁身高的年均增长数.(5)解释一下回归系数与每年平均增长的身高之间的联系.18.某个服装店经营某种服装,在某周内获纯利y (元),与该周每天销售这种服装件数x 之间的一组数据关系见表:已知721280i i x ==∑,72145309i i y ==∑,713487i i i x y ==∑.(1)求x y ,;(2)画出散点图;(3)判断纯利y 与每天销售件数x 之间是否线性相关,如果线性相关,求出回归方程.高中新课标数学选修(1-2)统计案例测试题一、选择题:本大题共12道小题,每小题5分,共60分1、对于散点图下列说法中正确一个是( )(A )通过散点图一定可以看出变量之间的变化规律(B )通过散点图一定不可以看出变量之间的变化规律(C )通过散点图可以看出正相关与负相关有明显区别(D )通过散点图看不出正相关与负相关有什么区别2、在画两个变量的散点图时,下面叙述正确的是( )(A )预报变量在x 轴上,解释变量在y 轴上(B )解释变量在x 轴上,预报变量在y 轴上(C )可以选择两个变量中的任意一个变量在x 轴上(D )可以选择两个变量中的任意一个变量在y 轴上3、如果根据性别与是否爱好运动的列联表,得到841.3852.3>≈k ,所以判断性别与运动有关,那么这种判断出错的可能性为( )(A )0020 (B )0015 (C )0010 (D )0054、下列关于线性回归的说法,不正确的是( )(A )变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系;(B )在平面直角坐标系中用描点法的方法得到表示具有相关关系的两个变量的一组数据的图形叫散点图;(C )线性回归直线方程最能代表观测值y x ,之间的关系;(D )任何一组观测值都能得到具有代表意义的回归直线方程;5、在两个变量y 与x 的回归模型中,分别选择了四个不同的模型,它们的相关指数2R 如下,其中拟合效果最好的为( )(A )模型①的相关指数为976.0 (B )模型②的相关指数为776.0(C )模型③的相关指数为076.0 (D )模型④的相关指数为351.06、关于如何求回归直线的方程,下列说法正确的一项是( )(A )先画一条,测出各点到它的距离,然后移动直线,到达一个使距离之和最小的位置,测出此时的斜率与截距,就可得到回归直线方程(B )在散点图中,选两点,画一条直线,使所画直线两侧的点数一样多或基本相同,求出此直线方程,则该方程即为所求回归方程(C )在散点图中多选几组点,分别求出各直线的斜率与截距,再求它们的平均值,就得到了回归直线的斜率与截距,即可产生回归方程(D )上述三种方法都不可行7、若对于变量y 与x 的10组统计数据的回归模型中,相关指数95.02=R ,又知残差平方和为53.120,那么∑=-1012)(i i y y的值为( )(A )06.241 (B )6.2410 (C )08.253 (D )8.25308、右表是对与喜欢足球与否的统计列联表依据表中的数据,得到( )(A )564.92=K (B )564.32=K(C )706.22<K (D )841.32>K9、某医院用光电比色计检验尿汞时,得尿汞含量)/(L mg 与消光系数读数的结果如下:如果y 与x 之间具有线性相关关系,那么当消光系数的读数为480时,( )(A )汞含量约为L mg /27.13 (B )汞含量高于L mg /27.13(C )汞含量低于L mg /27.13 (D )汞含量一定是L mg /27.1310、由一组样本数据),(,),,(),,(2221n n y x y x y x 得到的回归直线方程a bx y +=∧,那么下面说法正确的是(A )直线a bx y +=∧必过点),(--y x(B )直线a bx y +=∧必经过),(,),,(),,(2221n n y x y x y x 一点(C )直线a bx y +=∧经过),(,),,(),,(2221n n y x y x y x 中某两个特殊点(D )直线a bx y +=∧必不过点),(--y x11、根据下面的列联表得到如下中个判断:①有009.99的把握认为患肝病与嗜酒有关;②有0099的把握认为患肝病与嗜酒有关;③认为患肝病与嗜酒有关的出错的可能为001;④认为患肝病与嗜酒有关的出错的可能为0010;其中正确命题的个数为( )(A )0 (B )1 (C )2 (D )312、对于两个变量之间的相关系数r ,下列说法中正确的是( )(A )||r 越大,相关程度越大 (B )||r 越小,相关程度越大(C )||r 越大,相关程度越小;||r 越小,相关程度越大(D )1||≤r 且||r 越接近于1,相关程度越大; ||r 越接近于0,相关程度越小;二、填空题:本大题共4小题,每小题4分,共16分,把答案填在题中的横线上13、下表是关于出生男婴与女婴调查的列联表那么,A= ,B= ,C= ,D= ,E= ;14、如右表中给出五组数据),(y x ,从中选出四组使其线性相关最大,且保留第一组)3,5(--,那么,应去掉第 组。

相关文档
最新文档