统计及统计案例

统计及统计案例
统计及统计案例

§10.2统计及统计案例

考纲解读

分析解读

从近几年的高考试题来看,本部分在高考中的考查点如下

:1.

主要考查分层抽样的定义,频率分布直方图,平

均数、方差的计算,识图能力及借助概率知识分析、解决问题的能力;2.在频率分布直方图中,注意小矩形的高=频率/组距,小矩形的面积为频率,所有小矩形的面积之和为1;3.分析两个变量间的相关关系,通过独立性检验判断两个变量是否相关.本节内容在高考中分值为17分左右,属中档题.

(1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6,

所以样本中分数小于70的频率为1-0.6=0.4.

所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4.

(2)根据题意,样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)×10=0.9,

分数在区间[40,50)内的人数为100-100×0.9-5=5.

所以总体中分数在区间[40,50)内的人数估计为400×=20.

(3)由题意可知,样本中分数不小于70的学生人数为(0.02+0.04)×10×100=60,

所以样本中分数不小于70的男生人数为60×=30.

所以样本中的男生人数为30×2=60,女生人数为100-60=40,男生和女生人数的比例为60∶40=3∶2.

所以根据分层抽样原理,总体中男生和女生人数的比例估计为3∶2.

五年高考

考点一抽样方法

1.(2015北京,4,5分)某校老年、中年和青年教师的人数见下表.采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为( )

A.90

B.100

C.180

D.300

答案C

2.(2015湖南,2,5分)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.

若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运

动员人数是( )

A.3

B.4

C.5

D.6

答案B

3.(2015四川,3,5分)某学校为了了解三年级、六年级、九年级这三个年级之间的学生视力是否存在显著差异,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是( )

A.抽签法

B.系统抽样法

C.分层抽样法

D.随机数法

答案C

4.(2014湖南,3,5分)对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则( )

A.p1=p2

B.p2=p3

C.p1=p3

D.p1=p2=p3

答案D

5.(2014四川,2,5分)在“世界读书日”前夕,为了了解某地5 000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.在这个问题中,5 000名居民的阅读时间的全体是( )

A.总体

B.个体

C.样本的容量

D.从总体中抽取的一个样本

答案A

6.(2017江苏,3,5分)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取件.

答案18

7.(2014山东,16,12分)海关对同时从A,B,C三个不同地区进口的某种商品进行抽样检测,从各地区进口此种商品的数量(单位:件)如下表所示.工作人员用分层抽样的方法从这些商品中共抽取6件样品进行检测.

(1)求这6件样品中来自A,B,C各地区商品的数量;

(2)若在这6件样品中随机抽取2件送往甲机构进行进一步检测,求这2件商品来自相同地区的概率.

解析(1)因为样本容量与总体中的个体数的比是=,

所以样本中包含三个地区的个体数量分别是:

50×=1,150×=3,100×=2,

所以A,B,C三个地区的商品被选取的件数分别为1,3,2.

(2)设6件来自A,B,C三个地区的样品分别为:A;B1,B2,B3;C1,C2,

则抽取的这2件商品构成的所有基本事件为:

{A,B1},{A,B2},{A,B3},{A,C1},{A,C2},{B1,B2},{B1,B3},{B1,C1},{B1,C2},{B2,B3},{B2,C1},{B2,C2},{B3,C1},

{B3,C2},{C1,C2},共15个.

每个样品被抽到的机会均等,因此这些基本事件的出现是等可能的.

记事件D:“抽取的这2件商品来自相同地区”,

则事件D包含的基本事件有

{B1,B2},{B1,B3},{B2,B3},{C1,C2},共4个.

所以P(D)=,即这2件商品来自相同地区的概率为.

教师用书专用(8—15)

8.(2014重庆,3,5分)某中学有高中生3 500人,初中生1 500人.为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取70人,则n为( )

A.100

B.150

C.200

D.250

答案A

9.(2014广东,6,5分)为了解1 000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为( )

A.50

B.40

C.25

D.20

答案C

10.(2013江西,5,5分)总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为( )

A.08

B.07

C.02

D.01

答案D

11.(2013湖南,3,5分)某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件、80件、60件.为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为n的样本进行调查,其中从丙车间的产品中抽取了3件,则n=( )

A.9

B.10

C.12

D.13

答案D

12.(2015福建,13,4分)某校高一年级有900名学生,其中女生400名.按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为.

答案25

13.(2014湖北,11,5分)甲、乙两套设备生产的同类型产品共4 800件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测.若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为件.

答案 1 800

14.(2014天津,9,5分)某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,则应从一年级本科生中抽取名学生.

答案60

15.(2013陕西,19,12分)有7位歌手(1至7号)参加一场歌唱比赛,由500名大众评委现场投票决定歌手名次.

根据年龄将大众评委分为五组,各组的人数如下:

(1)为了调查评委对7位歌手的支持情况,现用分层抽样方法从各组中抽取若干评委,其中从B组抽取了6人,请将其余各组抽取的人数填入下表;

(2)在(1)中,若A,B两组被抽到的评委中各有2人支持1号歌手,现从这两组被抽到的评委中分别任选1人,求这2人都支持1号歌手的概率.

解析(1)由题设知,分层抽样的抽取比例为6%,所以各组抽取的人数如下表:

(2)记从A组抽到的3个评委为a1,a2,a3,其中a1,a2支持1号歌手;从B组抽到的6个评委为b1,b2,b3,b4,b5,b6,其中b1,b2支持1号歌手.从{a1,a2,a3}和{b1,b2,b3,b4,b5,b6}中各抽取1人的所有结果为:

由以上树状图知所有结果共18种,其中2人都支持1号歌手的有a1b1,a1b2,a2b1,a2b2,共4种,故所求概率P==. 考点二统计图表

1.(2017课标全国Ⅲ,3,5分)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.

根据该折线图,下列结论错误的是( )

A.月接待游客量逐月增加

B.年接待游客量逐年增加

C.各年的月接待游客量高峰期大致在7,8月

D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳

答案A

2.(2016山东,3,5分)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),

[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( )

A.56

B.60

C.120

D.140

答案D

3.(2015课标Ⅱ,3,5分)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是( )

A.逐年比较,2008年减少二氧化硫排放量的效果最显著

B.2007年我国治理二氧化硫排放显现成效

C.2006年以来我国二氧化硫年排放量呈减少趋势

D.2006年以来我国二氧化硫年排放量与年份正相关

答案D

4.(2015陕西,2,5分)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为( )

A.93

B.123

C.137

D.167

答案C

5.(2014山东,8,5分)为了研究某药品的疗效,选取若干名志愿者进行临床试验.所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,……,第五组.如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )

A.6

B.8

C.12

D.18

答案C

6.(2015课标Ⅱ,18,12分)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表.

B地区用户满意度评分的频数分布表

(1)作出B地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度

(不要求计算出具体值,给出结论即可);

(2)根据用户满意度评分,将用户的满意度分为三个等级:

估计哪个地区用户的满意度等级为不满意的概率大,说明理由.

解析(1)

通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.

(2)A地区用户的满意度等级为不满意的概率大.

记C A表示事件:“A地区用户的满意度等级为不满意”;C B表示事件:“B地区用户的满意度等级为不满意”.

由直方图得P(C A)的估计值为(0.01+0.02+0.03)×10=0.6,

P(C B)的估计值为(0.005+0.02)×10=0.25.

所以A地区用户的满意度等级为不满意的概率大.

7.(2015安徽,17,12分)某企业为了解下属某部门对本企业职工的服务情况,随机访问50名职工,根据这50名职工对该部门的评分,绘制频率分布直方图(如图所示),其中样本数据分组区间为:[40,50),[50,60),…,[80,90),[90,100].

(1)求频率分布直方图中a的值;

(2)估计该企业的职工对该部门评分不低于80的概率;

(3)从评分在[40,60)的受访职工中,随机抽取2人,求此2人的评分都在[40,50)的概率.

解析(1)因为(0.004+a+0.018+0.022×2+0.028)×10=1,所以a=0.006.

(2)由所给频率分布直方图知,50名受访职工评分不低于80的频率为(0.022+0.018)×10=0.4,

所以该企业职工对该部门评分不低于80的概率的估计值为0.4.

(3)受访职工中评分在[50,60)的有50×0.006×10=3(人),记为A1,A2,A3;

受访职工中评分在[40,50)的有50×0.004×10=2(人),记为B1,B2.

从这5名受访职工中随机抽取2人,所有可能的结果共有10种,它们是{A1,A2},{A1,A3},{A1,B1},{A1,B2},{A2,A3},{A2,B1},{A2,B2},{A3,B1},{A3,B2},{B1,B2},又因为所抽取2人的评分都在[40,50)的结果有1种,即{B1,B2},故所求的概率为P=.

教师用书专用(8—13)

8.(2013山东,10,5分)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x表示:

则7个剩余分数的方差为( )

A. B. C.36 D.

答案B

9.(2013辽宁,5,5分)某班的全体学生参加英语测试,成绩的频率分布直方图如图.数据的分组依次为:[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是( )

A.45

B.50

C.55

D.60

答案B

10.(2013重庆,6,5分)如图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的频率为( )

189

212279

3003

A.0.2

B.0.4

C.0.5

D.0.6

答案B

11.(2013四川,7,5分)某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示.以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是( )

答案A

12.(2014福建,20,12分)根据世行2013年新标准,人均GDP低于1 035美元为低收入国家;人均GDP为1 035~ 4 085美元为中等偏下收入国家;人均GDP为4 085~ 12 616美元为中等偏上收入国家;人均GDP不低于12 616美元为高收入国家.某城市有5个行政区,各区人口占该城市人口比例及人均GDP如下表:

(1)判断该城市人均GDP是否达到中等偏上收入国家标准;

(2)现从该城市5个行政区中随机抽取2个,求抽到的2个行政区人均GDP都达到中等偏上收入国家标准的概率.

解析(1)设该城市人口总数为a,则该城市人均GDP为

(8 000×0.25a+4000×0.30a+6000×0.15a+3000×0.10a+10000×0.20a)=6 400.因为6 400∈[4 085,12 616), 所以该城市人均GDP达到了中等偏上收入国家标准.

(2)“从5个行政区中随机抽取2个”的所有的基本事件是{A,B},{A,C},{A,D},{A,E},{B,C},{B,D},{B,E},

{C,D},{C,E},{D,E},共10个.

设事件“抽到的2个行政区人均GDP都达到中等偏上收入国家标准”为M,

则事件M包含的基本事件是{A,C},{A,E},{C,E},共3个,所以所求概率为P(M)=.

13.(2014重庆,17,13分)20名学生某次数学考试成绩(单位:分)的频率分布直方图如下:

(1)求频率分布直方图中a的值;

(2)分别求出成绩落在[50,60)与[60,70)中的学生人数;

(3)从成绩在[50,70)的学生中任选2人,求此2人的成绩都在[60,70)中的概率.

解析(1)据题中直方图知组距=10,由(2a+3a+6a+7a+2a)×10=1,解得a==0.005.

(2)成绩落在[50,60)中的学生人数为2×0.005×10×20=2.

成绩落在[60,70)中的学生人数为3×0.005×10×20=3.

(3)记成绩落在[50,60)中的2人为A1,A2,成绩落在[60,70)中的3人为B1,B2,B3,则从成绩在[50,70)的学生中任选2人的基本事件共有10个:

(A1,A2),(A1,B1),(A1,B2),(A1,B3),(A2,B1),(A2,B2),(A2,B3),(B1,B2),(B1,B3),(B2,B3),

其中2人的成绩都在[60,70)中的基本事件有3个:

(B1,B2),(B1,B3),(B2,B3),故所求概率为P=.

考点三样本的数字特征

1.(2017课标全国Ⅰ,2,5分)为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,x n,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( )

A.x1,x2,…,x n的平均数

B.x1,x2,…,x n的标准差

C.x1,x2,…,x n的最大值

D.x1,x2,…,x n的中位数

答案B

2.(2017山东,8,5分)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为( )

A.3,5

B.5,5

C.3,7

D.5,7

答案A

3.(2016江苏,4,5分)已知一组数据

4.7,4.8,

5.1,5.4,5.5,则该组数据的方差是.

答案0.1

4.(2016课标全国Ⅰ,19,12分)某公司计划购买1台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购

进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图:

记x表示1台机器在三年使用期内需更换的易损零件数,y表示1台机器在购买易损零件上所需的费用(单位:元),n表示购机的同时购买的易损零件数.

(1)若n=19,求y与x的函数解析式;

(2)若要求“需更换的易损零件数不大于n”的频率不小于0.5,求n的最小值;

(3)假设这100台机器在购机的同时每台都购买19个易损零件,或每台都购买20个易损零件,分别计算这100台机器在购买易损零件上所需费用的平均数,以此作为决策依据,购买1台机器的同时应购买19个还是20个易损零件?

解析(1)当x≤19时,y=3 800;

当x>19时,y=3 800+500(x-19)=500x-5 700,

所以y与x的函数解析式为

y=

-(x∈N).(4分)

(2)由柱状图知,需更换的零件数不大于18的频率为0.46,不大于19的频率为0.7,故n的最小值为19.(5分)

(3)若每台机器在购机同时都购买19个易损零件,则这100台机器中有70台在购买易损零件上的费用为3 800元,20台的费用为4 300元,10台的费用为4 800元,因此这100台机器在购买易损零件上所需费用的平均数为

(3 800×70+4300×20+

4 800×10)=4 000(元).(7分)

若每台机器在购机同时都购买20个易损零件,则这100台机器中有90台在购买易损零件上的费用为4 000

元,10台的费用为

4 500元,因此这100台机器在购买易损零件上所需费用的平均数为(4 000×90+4500×10)=4 050(元).(10分) 比较两个平均数可知,购买1台机器的同时应购买19个易损零件.(12分)

5.(2016四川,16,12分)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.

(1)求直方图中a的值;

(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;

(3)估计居民月均用水量的中位数.

解析(1)由频率分布直方图可知:月均用水量在[0,0.5)的频率为0.08×0.5=0.04.

同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5)等组的频率分别为0.08,0.21,

0.25,0.06,0.04,0.02.

由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a+0.5×a,解得a=0.30.

(2)由(1)知,100位居民月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12,

由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000.

(3)设中位数为x吨.

因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5,

而前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5,

所以2≤x<2.5.

由0.50×(x-2)=0.5-0.48,解得x=2.04.

故可估计居民月均用水量的中位数为2.04吨.

6.(2014课标Ⅰ,18,12分)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:

(1)作出这些数据的频率分布直方图;

(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);

(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?

解析(1)

(2)质量指标值的样本平均数为

=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.

质量指标值的样本方差为s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.

所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.

(3)质量指标值不低于95的产品所占比例的估计值为

0.38+0.22+0.08=0.68.

由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定.

教师用书专用(7—17)

7.(2015重庆,4,5分)重庆市2013年各月的平均气温(℃)数据的茎叶图如下:

0 8 9

1 2 5 8

2 0 0

3 3 8

3 1 2

则这组数据的中位数是( )

A.19

B.20

C.21.5

D.23

答案B

8.(2014陕西,9,5分)某公司10位员工的月工资(单位:元)为x1,x2,…,x10,其均值和方差分别为和s2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为( )

A.,s2+1002

B.+100,s2+1002

C.,s2

D.+100,s2

答案D

9.(2015广东,12,5分)已知样本数据x1,x2,…,x n的均值=5,则样本数据2x1+1,2x2+1,…,2x n+1的均值为.

答案11

10.(2013湖北,12,5分)某学员在一次射击测试中射靶10次,命中环数如下:

7,8,7,9,5,4,9,10,7,4

则(1)平均命中环数为;

(2)命中环数的标准差为.

答案(1)7 (2)2

11.(2013辽宁,16,5分)为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据.已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为.

答案10

12.(2015广东,17,12分)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),

[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.

(1)求直方图中x的值;

(2)求月平均用电量的众数和中位数;

(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?

解析(1)由已知得,20×(0.002+0.009 5+0.011+0.012 5+x+0.005+0.002 5)=1,解得x=0.007 5.

(2)由题图可知,面积最大的矩形对应的月平均用电量区间为[220,240),所以月平均用电量的众数的估计值为230;

因为20×(0.002+0.009 5+0.011)=0.45<0.5,

20×(0.002+0.009 5+0.011+0.012 5)=0.7>0.5,所以中位数在区间[220,240)内.

设中位数为m,则20×(0.002+0.009 5+0.011)+0.012 5×(m-220)=0.5,解得m=224.

所以月平均用电量的中位数为224.

(3)由题图知,月平均用电量为[220,240)的用户数为(240-220)×0.0125×100=25,同理可得,月平均用电量为[240,260),[260,280),[280,300]的用户数分别为15,10,5.

故用分层抽样的方式抽取11户居民,月平均用电量在[220,240)的用户中应抽取11×=5(户).

13.(2014课标Ⅱ,19,12分)某市为了考核甲、乙两部门的工作情况,随机访问了50位市民.根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:

(1)分别估计该市的市民对甲、乙两部门评分的中位数;

(2)分别估计该市的市民对甲、乙两部门的评分高于90的概率;

(3)根据茎叶图分析该市的市民对甲、乙两部门的评价.

解析(1)由所给茎叶图知,50位市民对甲部门的评分由小到大排序,排在第25,26位的是75,75,故样本中位数为75,所以该市的市民对甲部门评分的中位数的估计值是75.50位市民对乙部门的评分由小到大排序,排在第25,26位的是66,68,故样本中位数为=67,所以该市的市民对乙部门评分的中位数的估计值是67.

(2)由所给茎叶图知,50位市民对甲、乙部门的评分高于90的比率分别为=0.1,=0.16,故该市的市民对甲、乙部门的评分高于90的概率的估计值分别为0.1,0.16.

(3)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大.

14.(2014广东,17,13分)某车间20名工人年龄数据如下表:

年龄(岁)工人数(人)

excel2010应用统计数据案例回归分析

########实验报告 实验名称:回归分析

专业班级:333 姓名:#### 学号:#####实验日期: 33### 一、实验目的: 掌握相关系数的求解方法,能够熟练运用回归分析工具进行一元与多元线性回归分析,了解单因素方差分析工具的使用。 二、实验内容: (1)相关系数的计算 (2)单因素方差分析 (3)一元线性回归分析 三、实验过程: 1、利用图表进行回归分析 ①打开“饭店”工作表 ②插入“图表”,选择XY散点图。 ③在数据区域中输入B2:C11,选择“系列产生在——列”,单击“下一步”按钮。 ④打开“图例”页面,取消图例,省略标题。 ⑤单击“完成”按钮。 ⑥点击“趋势线”选项,选择“线性”选项,Excel将显示一条拟合数据点的直线。 ⑦打开“选项”页面,在对话框下部选择“显示公式”与“显示R平方根”选项,单击“确定”按钮,便得到趋势回归图。

⑦打开“选项”页面,在对话框下部选择“显示公式”与“显示R平方根”选项,单击“确定”按钮,便得到趋势回归图。

专业班级:¥¥¥姓名:### 学号: #### 实验日期:##### 2、利用工作表函数进行回归分析 ①打开“简单线性回归、xls”工作簿,选择“成本产 量”工作表。 ②在单元格A19、A20、A21与A22中分别输入“截距 b0”、“斜率b1”、“估计标准误差”与“测定系 数” 。 ③在单元格B19中输入公 式:“=INTERCEPT(C2:C15,B2:B15)” ,单击回车键。 ④在单元格B20中输入公式: “=SLOPE(C2:C15,B2:B15)”,单击回车键。 ⑤在单元格B21中输入公式: “=STEYX(C2:C15,B2:B15)”,单击回车键。 ⑥在单元格B22中输入公式: “=RSQ(C2:C15,B2:B15)”,单击回车键。 3、Excel 回归分析工具 ①打开“简单线性回归、xls”工作簿,选择“住房”工作表。 ②在“工具”菜单中选择“数据分析”选项,打开“数据分析”对话框。 ③在“分析工具”列表中选择“回归”选项,单击“确定”按钮,打开“回归”对话框。

多元统计分析实例汇总

多元统计分析实例 院系:商学院 学号: 姓名:

多元统计分析实例 本文收集了2012年31个省市自治区的农林牧渔和相关农业数据,通过对对收集的数据进行比较分析对31个省市自治区进行分类.选取了6个指标农业产值,林业产值.牧业总产值,渔业总产值,农村居民家庭拥有生产性固定资产原值,农村居民家庭经营耕地面积. 数据如下表: 一.聚类法

设定4个群聚,采用了系统聚类法.下表为spss分析之后的结果.

Rescaled Distance Cluster Combine C A S E 0 5 10 15 20 25 Label Num +---------+---------+---------+---------+---------+ 内蒙 5 -+ 吉林 7 -+ 云南 25 -+-+ 江西 14 -+ +-+ 陕西 27 -+-+ | 新疆 31 -+ +-+ 安徽 12 -+-+ | | 广西 20 -+ +-+ +-------+ 辽宁 6 ---+ | | 浙江 11 -+-----+ | 福建 13 -+ | 重庆 22 -+ +---------------------------------+ 贵州 24 -+ | | 山西 4 -+---+ | | 甘肃 28 -+ | | | 北京 1 -+ | | | 青海 29 -+ +---------+ | 天津 2 -+ | | 上海 9 -+ | | 宁夏 30 -+---+ | 西藏 26 -+ | 海南 21 -+ | 河北 3 ---+-----+ | 四川 23 ---+ | | 黑龙江 8 -+-+ +-------------+ | 湖南 18 -+ +---+ | | | 湖北 17 -+-+ +-+ +-------------------------+ 广东 19 -+ | | 江苏 10 -------+ | 山东 15 -----------+-----------+ 河南 16 -----------+

统计案例试题及答案

10-4统计案例 基 础 巩 固 一、选择题 1.对于事件A 和事件B ,通过计算得到χ2的观测值χ2≈4.514,下列说法正确的是( ) A .有99%的把握说事件A 和事件 B 有关 B .有95%的把握说事件A 和事件B 有关 C .有99%的把握说事件A 和事件B 无关 D .有95%的把握说事件A 和事件B 无关 [答案] B [解析] 由独立性检验知有95%的把握说事件A 与B 有关. 2.r 是相关系数,则下列叙述中正确的个数为( ) ①r ∈[-1,-0.75]时,两变量负相关很强; ②r ∈[0.75,1]时,两变量正相关很强; ③r ∈(-0.75,-0.3]或[0.3,0.75)时,两变量相关性一般; ④r =0.1时,两变量相关性很弱. A .1 B .2 C .3 D .4 [答案] D 3.某化工厂为预测某产品的回收率y ,需要研究它和原料有效成分含量x 之间的相关关系,现取了8对观察值,计算得∑i =1 8 x i =52,∑i =1 8 y i =228,∑ i =18 x 2 i =478,∑ i =1 n x i y i =1849,则 y 与x 的回归方程是( ) A.y ^ =11.47+2.62x B.y ^ =-11.47+2.62x

C.y ^ =2.62+11.47x D.y ^ =11.47-2.62x [答案] A 4.(2011·湖南理,4)通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表: 由K 2=(a +b )(c +d )(a +c )(b +d ) 算得,K 2= 110×(40×30-20×20)2 60×50×60×50≈7.8. 附表: A .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关” B .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关” C .有99%以上的把握认为“爱好该项运动与性别有关” D .有99%以上的把握认为“爱好该项运动与性别无关” [答案] C [解析] 本小题考查内容为独立性检验.

2017-2018年高考真题解答题专项训练概率与统计(理科)学生版

2017------2018年高考真题解答题专项训练:概率与统计(理科)学生版 1.已知某单位甲、乙、丙三个部门的员工人数分别为24,16,16.现采用分层抽样的方法从中抽取7人,进行睡眠时间的调查. (I)应从甲、乙、丙三个部门的员工中分别抽取多少人? (II)若抽出的7人中有4人睡眠不足,3人睡眠充足,现从这7人中随机抽取3人做进一步的身体检查. (i)用X表示抽取的3人中睡眠不足 ..的员工人数,求随机变量X的分布列与数学期望;(ii)设A为事件“抽取的3人中,既有睡眠充足的员工,也有睡眠不足的员工”,求事件A发生的概率. 2.电影公司随机收集了电影的有关数据,经分类整理得到下表: 电影类型第一类第二类第三类第四类第五类第六类 电影部数140 50 300 200 800 510 好评率0.4 0.2 0.15 0.25 0.2 0.1 好评率是指:一类电影中获得好评的部数与该类电影的部数的比值. 假设所有电影是否获得好评相互独立. (Ⅰ)从电影公司收集的电影中随机选取1部,求这部电影是获得好评的第四类电影的概率; (Ⅱ)从第四类电影和第五类电影中各随机选取1部,估计恰有1部获得好评的概率;(Ⅲ)假设每类电影得到人们喜欢的概率与表格中该类电影的好评率相等,用“”表示第k类电影得到人们喜欢,“”表示第k类电影没有得到人们喜欢(k=1,2,3,4,5,6).写出方差,,,,,的大小关系.

3.某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图: (1)根据茎叶图判断哪种生产方式的效率更高?并说明理由; (2)求40名工人完成生产任务所需时间的中位数,并将完成生产任务所需时间超过和不超过的工人数填入下面的列联表: 超过不超过 第一种生产方式 第二种生产方式 (3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附:, 4.下图是某地区2000年至2016年环境基础设施投资额(单位:亿元)的折线图.

应用统计学案例——市场调查分析

市场调查分析案例 市场调查分析是市场调查的重要组成部分。通过市场调查收集到的原始资料,是处于一种零散、模糊、浅显的状态,只有经过进一步的处理和分析,才能使零散变为系统、模糊走向清晰、浅显发展为深刻,分析研究其规律性,达到正确认识社会现象目的,为准确的市场预测提供参考依据,最终为调查者正确决策提供有力的依据。 市场调查分析的原则:从全部事实出发,坚持事实求实的观点;全面分析问题,坚持一分为二的观点;必须从事物的相互联系,相互制约中分析问题; 市场调查分析方法:单变量统计量分析、单变量频数分析、多变量统计量分析、多变量频数分析、相关分析、聚类分析、判别分析、因子分析等。 案例:某市家用汽车消费情况调查分析案例 随着居民生活水平的提高,私车消费人群的职业层次正在从中高层管理人员和私营企业主向中层管理人员和一般职员转移,汽车正从少数人拥有的奢侈品转变为能够被更多普通家庭所接受的交通工具。了解该市家用汽车消费者的构成、消费者购买时对汽车的关注因素、消费者对汽车市场的满意程度等对汽车产业的发展具有重要意义。 本次调研活动中共发放问卷400份,回收有效问卷368份,根据整理资料分析如下。 一、消费者构成分析 1 、有车用户家庭月收入分析

5000元以上8.69 100.00 目前该市有车用户家庭月收入在2000?3000元间的最多;有车用户平均月收入为2914.55元,与该市民平均月收入相比,有车用户普遍属于收入较高人群。61.96%的有车用户月收入在3000元以下,属于高收入人群中的中低收入档次。因此,目前该市用户的需求一般是每辆10?15万元的经济车型。 2、有车用户家庭结构分析 表2: 有车用户家庭结构 Di nk家庭(double in come no kid ),即夫妻二人无小孩的家庭,占有车家 庭的比重大,为36.96%。其家庭收入较高,负担较轻、支付能力较强,文化层次高、观念前卫,因此Dink家庭成为有车族中最为重要的家庭结构模式。核心家庭,即夫妻二人加上小孩的家庭,比重为34.78%。核心家庭是当前社会中最普遍的家庭结构模式,因此比重较高不足为奇。联合家庭,即与父母同住的家庭, 仅有8.70%。单身族占17.39%,这部分人个人收入高,且时尚前卫,在有车用户中占据一定比重。另外已婚用户比重达到了81.5%,而未婚用户仅为18.5%。 3、有车用户职业分析 调查显示有29%勺消费者在企业工作,20%勺消费者是公务员,另外还有自由职业者、机关工作人员和教师等。目前企业单位的从业人员,包括私营业主、高级主管、白领阶层仍是最主要的汽车使用者。而自由职业者由于收入较高及其工作性质,也在有车族中占据了较 高比重。详见图1。

统计案例的应用就在身边

统计案例的应用就在身边 224100 江苏省盐城市大丰区南阳中学 潘锦明 统计是与生活关系最为密切的一门学科, 统计知识的学习更侧重于体会,理解统计学的基本概念、方法、原理及其相应的实际意义,突出了统计中分析处理问题的基本思想方法.同学们只有亲自实践并与实际问题进行对比,才能有深刻而真实的体会. 一.环保问题 例1 有人统计了同一个省的6个城市某一年的人均国内生产总值(即人均GDP )和这一年各城市患白血病的儿童数量,如下表: (1)画出散点图; (2)求y 对x 的回归直线方程; (3)如果这个省的某一城市同时期年人均GDP 为12万元,估计这个城市一年患白血病的儿童数目; 分析:利用公式分别求出∧ ∧a b ,的值,即可确定回归直线方程,然后再进行预测. 解:(1)作x 与y 对应的散点图,如右图所示; (2)计算得67.1286)()(, 17.226,33.56 1 =--==∑ =y y x x y x i i i 33.55)(6 1 2=-∑ =i i x x , ∴25.2333.5567 .1286≈=∧ b ,25.10233.525.2317.226≈?-=∧a , ∴y 对x 的回归直线方程是25.10225.23+=∧ x y ; (3)将12=x 代入25.10225.23+=∧ x y 得38125.1021225.23≈+?=∧ y ,估计这个城市一年患白血病的儿童数目约为381. 评注:本题涉及的是一个和我们生活息息相关,也是一个愈来愈严峻的问题——环保问题.本题告诉了我们一个沉痛的事实:现如今,一个城市愈发达,这个城市患白血病的儿童愈多.原因在于,城市的经济发展大都以牺牲环境为代价的,经济发展造成了大面积的环境污染,空气、水源中含有的大量的有害物质是导致白血病患者增多的罪魁祸首,所以,我们一定要增强自我保护意识和环境保护意识. 二.互联网问题 例2 寒假中,某同学为组织一次爱心捐款,于2010年2月1日在网上给网友发了张帖子,并号召网友转发,下表是发帖后一段时间的收到帖子的人数统计: 人均G

18统计.题库学生版

内容 基本要求 略高要求 较高要求 数据的收集 了解普查和抽样调查的区别;知道抽样的必要性及不同的抽样可能得到不同的结果 总体、个体、样本、样本容量 能指出总体、个体、样本、样本容量;理解用样本估计总体的思想 能根据有关资料,获得数据信息,说出自己的看法 能通过收集、描述、分析数据的过程作出合理的判断和预测,认识到统计对决策的作用,能表达自己的观点 平均数、众数、中位数 理解平均数的意义,会求一组数据的平均数(包括加权平均数)、众数与中位数 能用样本的平均数估计总体的平均数;根据具体问题,能选择适合的统计量表示数据的集中程度 统计表、统计图 会用扇形统计图表示数据 会列频数分布表,画频数分布直方图和频数折线图 能利用统计图、表 解决简单的实际问题 极差、方差 会求一组数据的极差、方差 在具体问题中,会用极差、方差表示数据的离散程度;能用样本的方差估计总体的方差 频数、频率 理解频数、频率的概念;了解频数分布的意义和作用;能通过实验、获得事件发生的频率 能利用频数、频率解决简单的实际问题 板块一、数据的收集、整理及表示 1、数据处理的基本过程:收集、整理、描述和分析数据. 2、数据的收集的一般过程:明确调查问题、确定调查对象、选择调查方法、展开调查、记录结果、得出结论. 3、收集数据常用方法:一般有全面调查和抽样调查两种,实际中常常采用抽样调查的方式,调查时,可以用不同的方式获得数据,除了问卷调查、访问调查等外,查阅文献资料和实验也是获得数据的有效方法. 4、总体与个体:为了一定的目的而对考察对象进行全面调查,叫普查,其中要考察对象的全体叫总体,组成总体的每一个考察对象叫个体. 5、抽样调查、样本与样本容量: 从总体中抽取部分个体进行调查称为抽样调查,其中从总体中抽样取的一部分个体叫做总体的一个样本,样本中个体的数量叫样本容量. 抽样调查是一种非全面的调查,它是按照随机原则从总体中抽取一部分作为样本进行调查,并依据样本的数据对总体的数量特征作出具有一定可靠性的估计和推断的一种统计方法.抽样调查具有以下几个特点: 中考要求 18统计

统计学 统计学-——典型案例、问题和思想

经济管理类“十二五”规划教材统计学 -基于典型案例、问题和思想 主讲林海明

第一章绪论 【引言】我们从如下9个重要事例,说明统计学有什么用。 事例1:二次世界大战中,最激烈的空战是英国抗击德国的空战,英军为了提高战斗力,急需找到英军战机空战中的危险区域加固钢板,统计学家瓦尔德用统计学方法找到了危险区域,英军用钢板加固了

这些危险区域,使英军取得了空战的胜利。 事例2:上世纪20-30年代,为了找到中国革命的主力军和道路,政治家毛泽东悟出了统计学的频数方法,用此找到了中国革命的主力军是农民,中国革命的道路是农村包围城市。由此不屈不饶的奋斗,由弱变强,建立了独立自主的中华人民共和国,他还发现了“没有调查,就没有发言权”的科学论断。

事例3:1998年,美国博耶研究型大学本科生教育委员会发表了题为《重建本科生教育:美国研究型大学发展蓝图》的报告,该报告指出:为了培养科学、技术、学术、政治和富于创造性的领袖,研究型大学必须“植根于一种深刻的、永久性的核心:探索、调查和发现”。这说明了统计学中调查的重要性。 事例4:在居民收入贫富差距的测度方

面,美国统计学家洛仑兹(1907)、意大利经济学家基尼(1922)找到了统计学的洛仑兹曲线、基尼系数,由此给出了居民收入贫富差距的划分结果,为政府改进居民收入贫富不均的问题提供了政策依据。 事例5:二战后产品质量差的日本,以田口玄一为代表的质量管理学者用统计学方法找到了3σ质量管理原则,用其大幅提高了企业的产品质量,其产品畅销海内外,

日本因此成为当时的第二经济强国。该学科现已发展到了6σ质量管理原则。 事例6:在第二次世界大战的苏联卫国战争中,专家们用英国统计学家费歇尔(1 925)的最大似然法、无偏性,帮助苏军破解了德军坦克产量的军事秘密,由此苏军组织了充足的军事力量并联合盟军,打败了德军的疯狂进攻并占领了柏林。 事例7:在产品质量检验方面,英国统

[高考专项训练]统计与统计案例

[高考专项训练]统计与统计案例

小题押题16—14??统计与统计案例 卷别年 份 考题位 置 考查内 容 命题规律分析 全 国卷Ⅱ201 5 选择题 第3题 条形图、 两变量 间的相 关性 统计与统计案 例部分,抽样方法考 查较少,且考查时题 目较简单;回归分析 与独立性检验在客 观题中单独考查时 较少;随机抽样、用 样本估计总体以及 全国卷Ⅲ201 7 选择题 第3题 折线图 的应用201 6 选择题 第4题 统计图 表的应

用 变量的相关性是命 题热点,难度较低. 江苏 201 8 第3题 平均数、茎叶图 考查点一 抽样方法 1.(2015·北京高考)某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为( ) 类别 人 数

老年 教师 900 中年教师 1 800 青年教师 1 600 合计 4 300 A.90B.100 C.180 D.300 解析:选C设该样本中的老年教师人数为 x,由题意及分层抽样的特点得 x 900= 320 1 600,解 得x=180. 2.(2015·四川高考)某学校为了了解三年级、六年级、九年级这三个年级之间的学生视力是否存在显著差异,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是

() A.抽签法B.系统抽样法 C.分层抽样法D.随机数法 解析:选C根据年级不同产生差异及按人数比例抽取易知应为分层抽样法. 3.已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为(). A.89 B.91 C.90 D.900 解析:选C考察平均数的计算与茎叶图的转换关系 考查点二用样本估计总体 4.(2017·全国卷Ⅰ)为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,x n,下面给出的指标中可以用来评估这种农作物亩产量稳定

应用统计学案例统计调查方案设计

统计调查方案设计案例 ▲统计调查方案的内容和撰写: 一、统计调查方案的主要内容 1、确定统计调查目的和任务 2、确定调查对象和调查单位调查对象是指依据调查的任务和目的,确定本次调查的范围及需要调查的那些现象的总体。 调查单位是指所要调查的现象总体所组成的个体,也就是调查对象中所要调查的具体单位,即我们在调查中要进行调查研究的一个个具体的承担者。 3、确定调查内容和调查表 (1)调查课题如何转化为调查内容调查课题转化为调查内容是把已经确定了的调查课题进行概念化和具体化。 (2)调查内容如何转化为调查表如何把调查内容设计为调查表,这一问题会在下一章中专门介绍。 4、调查方式和调查方法 5、调查项目定价与预算 6、统计数据分析方案 7、其他内容 包括确定调查时间,安排调查进度,确定提交报告的方式,调查人员的选择、培训和组织等。 二、统计调查方案的撰写 1、统计调查方案的格式 包括摘要、前言、统计调查的目的和意义、统计调查的内容和范围、调查采用方式和方法、调查进度安排和有关经费开支预算、附件等部分。 2、撰写统计调查方案应注意的问题 (1)一份完整的统计调查方案,上述1—7 部分的内容均应涉及,不能有遗漏。否则就是不完整的。 (2)统计调查方案的制订必须建立在对调查课题的背景的深刻认识上。 (3)统计调查方案要尽量做到科学性与经济性的结合。 (4)统计调查方案的格式方面可以灵活,不一定要采用固定格式。 (5)统计调查方案的书面报告是非常重要的一项工作。一般来说,统计调查方案的起草与撰写应由课题的负责人来完成。

三、统计调查方案的可行性研究 (一)统计调查方案的可行性研究的方法 1、逻辑分析法逻辑分析法是指从逻辑的层面对统计调查方案进行把关,考察其是否符合逻辑和情 理。 2、经验判断法经验判断法是指通过组织一些具有丰富市场调查经验的人士,对设计出来的统计调查方案进行初步研究和判断,以说明统计调查方案的合理性和可行性。 3、试点调查法 试点调查法是通过在小范围内选择部分单位进行试点调查,对统计调查方案进行实地检验,以说明调查方案的可行性的方法。 (二)统计调查方案的模拟实施统计调查方案的模拟实施是只对那些调查内容很重要,调查规模又很大的调查项目才采用模拟调查,并不是所有的统计调查方案都需要进模拟调查。模拟调查的形式很多,如客户论证会和专家评审会等形式。 (三)统计调查方案的总体评价统计调查方案的总体评价可以从不同角度来衡量。但是,一般情况下,对统计调查方案进行评价应包括四个方面的内容,即:统计调查方案是否体现调查目的和要求;统计调查方案是否具有可操作性;统计调查方案是否科学和完整;统计调查方案是否具有调查质量高、效果好。 ▲案例:湘潭大学单放机市场调查计划书 一、前言 单放机——又称随身听,是一种集娱乐性和学习性于一体的小型电器,因其方便实用而在大学校园内广为流行。目前各高校都大力强调学习英语的重要性,湘潭大学已经把学生英语能否过四级和学位证挂钩,为了练好听力,湘大学子几乎人人都需要单方机,市场容量巨大。 为配合某单放机产品扩大在湘大的市场占有率,评估湘大单放机行销环境,制定响应的营销策略,预先进行湘大单放机市场调查大有必要。 本次市场调查将围绕市场环境、消费者、竞争者为中心来进行。 二、统计调查目的和任务 要求详细了解湘大单放机市场各方面情况,为该产品在湘大的扩展制定科学合理的营销方案提供依据,特撰写此市场调研计划书。

8-7-1统计与概率.题库学生版

8-7概率与统计 教学目标 1. 能准确判断事件发生的等可能性以及游戏规则的公平性问 题. 2. 运用排列组合知识和枚举等计数方法求解概率问题. 3. 理解和运用概率性质进行概率的运算 知识点拨 知识点说明 在抛掷一枚硬币时,究竟会出现什么样的结果事先是不能确定的,但是当我们在相同的条件下,大量重复地抛掷同一枚均匀硬币时,就会发现“出现正面”或“出现反面”的次数大约各占总抛掷次数的一半左右.这里的“大量重复”是指多少次呢? 历史上不少统计学家,例如皮尔逊等人作过成千上万次抛掷硬币的试验,随着试验次数的增加,出现正面的频率波动越来越小,频率在这

个定值附近摆动的性质是出现正面这一现象的内在必然性规律的表现,恰恰就是刻画出现正面可能性大小的数值,就是抛掷硬币时出现正面的概率.这就是概率统计定义的思想,这一思想也给出了在实际问题中估算概率的近似值的方法,当试验次数足够大时,可将频率作为概率的近似值. 在统计里,我们把所要考察对象的全体叫做总体,其中的每一个考察对象叫做个体。 从总体中所抽取的一部分个体叫做总体的一个样本。样本中个体的数目叫做样本的容量。 总体中所有个体的平均数叫做总体平均数,把样本中所有个体的平均数叫做样本平均数。 概率的古典定义: 如果一个试验满足两条: ⑴试验只有有限个基本结果: ⑵试验的每个基本结果出现的可能性是一样的. 这样的试验,称为古典试验. 对于古典试验中的事件,它的概率定义为: ,表示该试验中所有可能出现的基本结果的总数目,表示事件包含的试验基本结果数.小学奥数中,所涉及的问题都属于古典概率.其中的和需要我们用枚举、加乘原理、排列组合等方法求出. 相互独立事件: 事件是否发生对事件发生的概率没有影响,这样的两个事件叫做相互独立事件. 公式含义:如果事件和为独立事件,那么和都发生的概率等于事件发生的概率与事件发生的概率之积. 举例: ⑴明天是否晴天与明天晚餐是否有煎鸡蛋相互没有影响,因此两个事件为相互独立事件.所以明天天晴,并且晚餐有煎鸡蛋的概率等于明天天晴的概率乘以明天晚餐有煎鸡蛋的概率. ⑵第一次抛硬币掉下来是正面向上与第二次抛硬币是正面向上是两个相互独立事件.所以第一次、第二次抛硬币掉下来后都是正面向上的概率等于两次分别抛硬币掉下来后是正面向上的概率之积,即. ⑶掷骰子,骰子是否掉在桌上和骰子的某个数字向上是两个相互独立的事件,如果骰子掉在桌上的概率为,那么骰子掉在桌上且数 字“”向上的概率为.

【案例】应用统计学案例

应用统计学案例分析 一、背景: 建筑施工业是目前国内的一个比较大的产业群体。对于建筑施工企业来讲,项目利润率是衡量一个项目是否成功的一个重要指标。然而影响项目利润率的因素有很多,人员、机械、材料、管理等等。随着建筑施工业的不断发展,机械化施工以及电脑辅助应用软件的应用在建筑施工业中逐渐普及开来。 某市就机械化施工以及电脑辅助应用软件对本市各建筑施工企业的应用进行了调研,供采集了50家建筑施工企业的数据,反馈的有效数据为48组。本案例就电脑计提工程量、施工人员数量和大型施工机械数量与项目利润率等数据进行展开分析,从统计学角度分析其中的关联。 案例数据:

二、描述及分析 1、首先制作使用电脑计提工程量的项目部比例的图表:

数值和图示的概述: 如果设使用电脑计提工程量的项目部比例为x ,则755.7291666=x 。 从图表(条形图)中可以看出,使用电脑计提工程量的项目部比例都很高,平均水平在50%以上,约等于55.73%,最高达到了77%,最小值为29%,可以看出大部分企业都在积极推行电脑计提工程量工作,并卓有成效。 2、其次制作施工人员数量与大型施工机械数量比例的图表: 数值和图示的概述: 如果设施工人员数量与大型施工机械数量比例为x ,则711.5416666=x 。 从图表(饼图)中可以得出这样的结论,施工人员数量与大型施工机械数量比例平均在11倍左右,而且各企业之间的差异也不是很大(最大值为23,最小值为3)。

3、最后制作完成利润在10%以上的项目部比例的图表: 数值和图示的概述: 如果设完成利润在10%以上的项目部比例的比例为x ,则329.2708333 x 。 从图表(柱状图)中可以看出各学校之间的完成利润情况差异很大,最大值为67%,最小值为7%。

多元统计分析案例分析.docx

精品资料 一、对我国30个省市自治区农村居民生活水平作聚类分析 1、指标选择及数据:为了全面分析我国农村居民的生活状况,主要考虑从收入、消费、就业等几个方面对农村居民的生活状况进行考察。因此选取以下指标:农村产品价格指数、农村住宅投资、农村居民消费水平、农村居民消费支出、农村居民家庭人均纯收入、耕地面积及农村就业人数。现从2010年的调查资料中

2、将数据进行标准化变换:

3、用K-均值聚类法对样本进行分类如下:

分四类的情况下,最终分类结果如下: 第一类:北京、上海、浙江。 第二类:天津、、辽宁、、福建、甘肃、江苏、广东。 第三类:浙江、河北、内蒙古、吉林、黑龙江、安徽、山东、河南、湖北、四川、云南。 第四类:山西、青海、宁夏、新疆、重庆、贵州、陕西、湖南、广西、江西、。从分类结果上看,根据2010年的调查数据,第一类地区的农民生活水平较高,第二类属于中等水平,第三类、第四类属于较低水平。 二、判别分析 针对以上分类结果进行判别分析。其中将新疆作作为待判样本。判别结果如下:

**. 错误分类的案例 从上可知,只有一个地区判别组和原组不同,回代率为96%。 下面对新疆进行判别: 已知判别函数系数和组质心处函数如下: 判别函数分别为:Y1=0.18x1 +0.493x2 + 0.087x3 + 1.004x4 + 0.381x5 -0.041x6 -0.631x7 Y2=0.398x1+0.687x2 + 0.362x3 + 0.094x4 -0.282x5 + 1.019x6 -0.742x7 Y3=0.394x1-0.197x2 + 0.243x3-0.817x4 + 0.565x5-0.235x6 + 0.802x7 将西藏的指标数据代入函数得:Y1=-1.08671 Y2=-0.62213 Y3=-0.84188 计算Y值与不同类别均值之间的距离分别为:D1=138.5182756 D2=12.11433124 D3=7.027544292 D4=2.869979346 经过判别,D4最小,所以新疆应归于第四类,这与实际情况也比较相符。 三,因子分析: 分析数据在上表的基础上去掉两个耕地面积和农村固定资产投资两个指标。经spss软件分析结果如下:

统计和统计案例(教师版)

高三 年级 数学 科辅导讲义(第 讲) 学生姓名: 授课教师: 授课时间: 第一部分 基础知识梳理 1.随机抽样 (1)简单随机抽样特点是从总体中逐个抽取.适用范围:总体中的个体较少. (2)系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取.适用范围:总体中的个体数较多. (3)分层抽样特点是将总体分成几层,分层进行抽取.适用范围:总体由差异明显的几部分组成. 2.常用的统计图表 (1)频率分布直方图 ①小长方形的面积=组距× 频率 组距 =频率; ②各小长方形的面积之和等于1; ③小长方形的高=频率组距,所有小长方形的高的和为1 组距. (2)茎叶图 在样本数据较少时,用茎叶图表示数据的效果较好. 3.用样本的数字特征估计总体的数字特征 (1)众数、中位数、平均数 (2)方差:s 2=1 n [(x 1-x )2+(x 2-x )2+…+(x n -x )2].

标准差: s = 1 n [(x 1-x )2+(x 2-x )2+…+(x n -x )2]. 4.独立性检验 对于取值分别是{x 1,x 2}和{y 1,y 2}的分类变量X 和Y ,其样本频数列联表是 则K 2 (χ2 )=n (ad -bc )2 (a +b )(c +d )(a +c )(b +d ) (其中n =a +b +c +d 为样本容量). 第二部分 考点解析 热点一 抽样方法 例1 (1)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为( ) A .11 B .12 C .13 D .14 (2)某学校共有师生3 200人,现用分层抽样的方法,从所有师生中抽取一个容量为160的样本,已知从学生中抽取的人数为150,那么该学校的教师人数是________. 思维启迪 (1)系统抽样时需要抽取几个个体,样本就分成几组,且抽取号码的间隔相同;(2)分层抽样最重要的是各层的比例. 答案 (1)B (2)200 解析 (1)由840 42=20,即每20人抽取1人,所以抽取编号落入区间[481,720]的人数为720-48020=24020=12. (2)本题属于分层抽样,设该学校的教师人数为x ,所以 1603 200=160-150 x ,所以x =200. 思维升华 (1)随机抽样各种方法中,每个个体被抽到的概率都是相等的;(2)系统抽样又称“等距”抽样,被抽到的各个号码间隔相同;分层抽样满足:各层抽取的比例都等于样本容量在总体容量中的比例. (1)某校高一、高二、高三分别有学生人数为495,493,482,现采用系统抽样方法,抽取49人 做问卷调查,将高一、高二、高三学生依次随机按1,2,3,…,1 470编号,若第1组有简单随机抽样方法抽取的号码为23,则高二应抽取的学生人数为( ) A .15 B .16 C .17 D .18 (2)(2014·广东)已知某地区中小学生人数和近视情况分别如图①和图②所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( )

概率统计专项(一)(学生版)

概率统计专项(一)(学生版) 1、(2018?佛山二模)单位计划组织55名职工进行一种疾病的筛查,先到本单位医务室进行 血检,血检呈阳性者再到医院进一步检测.己知随机一人血检呈阳性的槪率为1%,且每个人血检是否呈阳性相互独立. (1)根据经验,采用分组检测法可有效减少工作量,具体操作如下:将待检人员随机等分成若干组,先将每组的血样混在一起化验,若结果呈阴性,则可断定本组血样全部为阴性,不必再化验;若结果呈阳性,则本组中至少有一人呈阳性,再逐个化验.现有两个分组方案: 方案一:将55人分成11组,每组5人; 方案二:将55人分成5组,每组11人. 试分析,哪一个方案工作量最少? (2)若该疾病的患病率为0.4%,且患该疾病者血检呈阳性的概率为99%,该单位有一职工血检呈阳性.求该职工确实患该疾病的概率.(参考数据:0.995=0.951,0.9911=0.895.)

裹收费10元;重量超过1kg的包裹,除1kg收费10元之外,超过1kg的部分,每超出1kg(不足1kg,按1kg计算)需再收5元. 该公司对近60天,每天揽件数量统计如表: (1)某人打算将A(0.3kg),B(1.8kg),C(1.5kg)三件礼物随机分成两个包裹寄出,求该人支付的快递费不超过30元的概率; (2)该公司从收取的每件快递的费用中抽取5元作为前台工作人员的工资和公司利润,剩余的作为其他费用.前台工作人员每人每天揽件不超过150件,工资100元,目前前台有工作人员3人,那么,公司将前台工作人员裁员1人对提高公司利润是否更有利?

车牌竞价的基本规则是:①“盲拍”,即所有参与竞拍的人都是网络报价,每个人并不知晓其他人的报价,也不知道参与当期竞拍的总人数;②竞价时间截止后,系统根据当期车牌配额,按照竞拍人的出价从高到低分配名额.某人拟参加2018年4月份的车牌竞拍,他为了预测最低成交价,根据竞拍网站的公告,统计了最近5个月参与竞拍的人数(如表): (1)由收集数据的散点图发现,可用线性回归模型拟合竞拍人数y (万人)与月份编号t 之间的相关关系.请用最小二乘法求y 关于t 的线性回归方程:,并预测2018 年4月份参与竞拍的人数; (2)某市场调研机构对200 位拟参加2018年4月份车牌竞拍人员的报价价格进行了一个抽样调查,得到如表一份频数表: (i )求这200位竞拍人员报价X 的平均值和样本方差s 2 (同一区间的报价可用该价格区间的中点值代替); (ii )假设所有参与竞价人员的报价X 可视为服从正态分布N (μ,σ2 ),且μ与σ2 可分别由(i )中所求的样本平均数及s 2 估值.若2018年4月份实际发放车牌数量为3174,请你合理预测(需说明理由)竞拍的最低成交价. 参考公式及数据:①回归方程,其中,; ②,, ; ③若随机变量Z 服从正态分布N (μ,σ2 ),则P (μ﹣σ<Z <μ+σ)=0.6826,P (μ

统计与统计案例(文科)教程文件

统计与统计案例(文科)

统计与统计案例 第一节随机抽样 1.下面的抽样方法是简单随机抽样的是( ) A.在某年明信片销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式确定号码的后四位为2709的为三等奖 B.某车间包装一种产品,在自动包装的传送带上,每隔30分钟抽一包产品,称其重量是否合格 C.某学校分别从行政人员、教师、后勤人员中抽取2人、14人、4人了解对学校机构改革的意见 D.用抽签方法从10件产品中选取3件进行质量检验 答案:D 2.总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为( ) 答案:D 3.为了解1 000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为( ) A.50 B.40 C.25 D.20 答案: C 4.某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为( ) A.11 B.12 C.13 D.14 答案:B 5.在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示. 若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是________. 答案:4 6.某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,

在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为( ) A.90 B.100 C.180 D.300 答案:C 7.某校高一年级有900名学生,其中女生400名,按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为________. 答案:5 8.某工厂生产甲、乙、丙三种型号的产品,产品数量之比为3∶5∶7,现用分层抽样的方法抽出容量为n的样本,其中甲种产品有18件,则样本容量n=() A.54 B.90 C.45 D.126 答案:B 9.某学校三个兴趣小组的学生人数分布如下表(每名同学只参加一个小组)(单位:人). 个兴趣小组的学生中抽取30人,结果篮球组被抽出12人,则a的值为________. 答案:30 10.甲、乙两套设备生产的同类型产品共4 800件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测.若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为________件. 答案:1800 11.某市有A、B、C三所学校,共有高三文科学生1 500人,且A、B、C三所学校的高三文科学生人数成等差数列,在三月进行全市联考后,准备用分层抽样的方法从所有高三文科学生中抽取容量为120的样本,进行成绩分析,则应从B校学生中抽取________人. 答案:40

2018年度各地高考真题分类汇编概率统计学生版

概率统计 1.(2018年全国一·文科3)某地区经过一年的新农村建设,农村的经济收入增加了一倍.实 现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例.得到如下饼图: 则下面结论中不正确的是 A.新农村建设后,种植收入减少 B.新农村建设后,其他收入增加了一倍以上 C.新农村建设后,养殖收入增加了一倍 D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半 2.(2018年全国二·文科5)从2名男同学和3名女同学中任选2人参加社区服务,则选中的2人都是女同学的概率为 A.0.6B.0.5C.0.4D.0.3 3.(2018年全国三·文科5)若某群体中的成员只用现金支付的概率为,既用现金支付也用 非现金支付的概率为,则不用现金支付的概率为 A.B.C.D. 4.(2018年全国三·文科14)某公司有大量客户,且不同年龄段客户对其服务的评价有较 大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是________. 5.(2018年全国一·文科19)某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下: 未使用节水龙头50天的日用水量频数分布表 日用水[) 00.1 ,[) 0.10.2 ,[) 0.20.3 ,[) 0.30.4 ,[) 0.40.5 ,[) 0.50.6 ,[) 0.60.7 ,

量 频 数 1 3 2 4 9 26 5 使用了节水龙头50天的日用水量频数分布表 日用水量[) 00.1 ,[) 0.10.2 ,[) 0.20.3 ,[) 0.30.4 ,[) 0.40.5 ,[) 0.50.6 , 频数 1 5 13 10 16 5 (1)在答题卡上作出使用了节水龙头50天的日用水量数据的频率分布直方图: (2)估计该家庭使用节水龙头后,日用水量小于m3的概率; (3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表.)

统计与统计案例 专题

统计与统计案例专题 [考情考向分析] 1.以选择题、填空题的形式考查随机抽样、样本的数字特征、统计图表、回归方程、独立性检验等.2.在概率与统计的交汇处命题,以解答题中档难度出现. 热点一抽样方法 1.简单随机抽样特点是从总体中逐个抽取.适用范围:总体中的个体数较少. 2.系统抽样特点是将总体平均分成几部分,按事先确定的规则在各部分中抽取.适用范围:总体中的个体数较多. 3.分层抽样特点是将总体分成几层,分层进行抽取.适用范围:总体由差异明显的几部分组成. 例1(1)某学校在高一新生入学后为了解学生的体质情况,决定从该校的1 000名高一新生中采用系统抽样的方法抽取50名学生进行体质分析,已知样本中第一个号为007号,则抽取的第10个学生的编号为() A.107 B.097 C.207 D.187 (2)已知某高级中学高一、高二、高三学生人数分别为880,860,820,现用分层抽样的方法从该校抽调128人,则在高二年级中抽调的人数为________. 思维升华(1)随机抽样的各种方法中,每个个体被抽到的概率都是相等的. (2)系统抽样又称“等距”抽样,被抽到的各个号码间隔相同. (3)分层抽样满足:各层抽取的比例都等于样本容量在总体容量中的比例. 跟踪演练1(1) 为了解某地区的“微信健步走”活动情况,拟从该地区的人群中抽取部分

人员进行调查,事先已了解到该地区老、中、青三个年龄段人员的“微信健步走”活动情况有较大差异,而男女“微信健步走”活动情况差异不大.在下面的抽样方法中,最合理的抽样方法是( ) A .简单随机抽样 B .按性别分层抽样 C .按年龄段分层抽样 D .系统抽样 (2)(2018·永州模拟)现从已编号(1~50)的50位同学中随机抽取5位了解他们的数学学习状况,用每部分选取的号码间隔一样的系统抽样方法所选取的5位同学的编号可能是( ) A .5,10,15,20,25 B .3,13,23,33,43 C .1,2,3,4,5 D .2,10,18,26,34 热点二 用样本估计总体 1.频率分布直方图中横坐标表示组距,纵坐标表示频率组距,频率=组距×频率组距. 2.频率分布直方图中各小长方形的面积之和为1. 3.利用频率分布直方图求众数、中位数与平均数 利用频率分布直方图求众数、中位数和平均数时易出错,应注意区分这三者.在频率分布直方图中: (1)最高的小长方形底边中点的横坐标即众数. (2)中位数左边和右边的小长方形的面积和相等. (3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和. 例2 (1)一组数据共有7个数,记得其中有10,2,5,2,4,2,还有一个数没记清,但知道这组数的平均数、中位数、众数依次成等差数列,这个数的所有可能值的和为( ) A .-11 B .3 C .9 D .17 (2)某高校调查了320名学生每周的自习时间(单位:小时),制成了下图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据频率分布直方图可知,这320名学生中每周的自习时间不足22.5小时的人数约是( )

相关文档
最新文档