高中数学统计案例分析及知识点归纳总结

高中数学统计案例分析及知识点归纳总结
高中数学统计案例分析及知识点归纳总结

统计

一、知识点归纳

1、抽样方法:

①简单随机抽样(总体个数较少) ②系统抽样(总体个数较多) ③分层抽样(总体中差异明显)

注意:在N 个个体的总体中抽取出n 个个体组成样本,每个个体被抽到的机会(概率)均为N

n 。 2、总体分布的估计: ⑴一表二图:

①频率分布表——数据详实 ②频率分布直方图——分布直观

③频率分布折线图——便于观察总体分布趋势 注:总体分布的密度曲线与横轴围成的面积为1。 ⑵茎叶图:

①茎叶图适用于数据较少的情况,从中便于看出数据的分布,以及中位数、众位数等。 ②个位数为叶,十位数为茎,右侧数据按照从小到大书写,相同的数据重复写。 3、总体特征数的估计:

⑴平均数:n

x x x x x n

++++=

321;

取值为n x x x ,,,21 的频率分别为n p p p ,,,21 ,则其平均数为n n p x p x p x +++ 2211;

注意:频率分布表计算平均数要取组中值。 ⑵方差与标准差:一组样本数据n x x x ,,,21 方差:2

1

2)(1

∑=-=

n

i i

x x

n

s ; 标准差:2

1

)(1∑=-=

n

i i

x x

n

s

注:方差与标准差越小,说明样本数据越稳定。

平均数反映数据总体水平;方差与标准差反映数据的稳定水平。 ⑶线性回归方程

①变量之间的两类关系:函数关系与相关关系; ②制作散点图,判断线性相关关系

③线性回归方程:a bx y +=∧

(最小二乘法)

1

221n

i i i n

i

i x y nx y b x nx a y bx

==?

-?

?=??-??=-??∑∑ 注意:线性回归直线经过定点),(y x 。

二、典例分析

§11.1 抽样方法

1.为了了解所加工的一批零件的长度,抽取其中200个零件并测量了其长度,在这个问题

中,总体的一个样本是 .

答案 200个零件的长度

2.某城区有农民、工人、知识分子家庭共计2 004户,其中农民家庭1 600户,工人家庭

303户,现要从中抽取容量为40的样本,则在整个抽样过程中,可以用到下列抽样方法:①简单随机抽样,②系统抽样,③分层抽样中的 .

答案①②③

3.某企业共有职工150人,其中高级职称15人,中级职称45人,初级职称90人.现采用

分层抽样抽取容量为30的样本,则抽取的各职称的人数分别为 .

答案3,9,18

4.某工厂生产A、B、C三种不同型号的产品,其相应产品数量之比为2∶3∶5,现用分层

抽样方法抽出一个容量为n的样本,样本中A型号产品有16件,那么此样本的容量n= .

答案80

例1某大学为了支援我国西部教育事业,决定从2007应届毕业生报名的18名志愿者中,选取6人组成志愿小组.请

用抽签法和随机数表法设计抽样方案.

解抽签法:

第一步:将18名志愿者编号,编号为1,2,3, (18)

第二步:将18个号码分别写在18张外形完全相同的纸条上,并揉成团,制成号签;

第三步:将18个号签放入一个不透明的盒子里,充分搅匀;

第四步:从盒子中逐个抽取6个号签,并记录上面的编号;

第五步:所得号码对应的志愿者,就是志愿小组的成员.

随机数表法:

第一步:将18名志愿者编号,编号为01,02,03, (18)

第二步:在随机数表中任选一数作为开始,按任意方向读数,比如第8行第29列的数7开始,向右读;

第三步:从数7开始,向右读,每次取两位,凡不在01—18中的数,或已读过的数,都跳过去不作记录,依次可得到12,07,15,13,02,09.

第四步:找出以上号码对应的志愿者,就是志愿小组的成员.

例2某工厂有1 003名工人,从中抽取10人参加体检,试用系统抽样进行具体实施.

解(1)将每个人随机编一个号由0001至1003.

(2)利用随机数法找到3个号将这3名工人剔除.

(3)将剩余的1 000名工人重新随机编号由0001至1000. (4)分段,取间隔k =10

0001

=100将总体均分为10段,每段含100个工人.

(5)从第一段即为0001号到0100号中随机抽取一个号l .

(6)按编号将l ,100+l ,200+l ,…,900+l 共10个号码选出,这10个号码所对应的工人组成样本. 例3 (14分)某一个地区共有5个乡镇,人口3万人,其中人口比例为3∶2∶5∶2∶3,从3万人中抽取一个300人

的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程.

解 应采取分层抽样的方法. 3分 过程如下:

(1)将3万人分为五层,其中一个乡镇为一层. 5分 (2)按照样本容量的比例随机抽取各乡镇应抽取的样本. 300×153=60(人);300×

15

2

=40(人); 300×155=100(人);300×15

2

=40(人); 300×

15

3=60(人),

10分

因此各乡镇抽取人数分别为60人,40人,100人,40人,60人. 12分

(3)将300人组到一起即得到一个样本.

14分

练习:

一、填空题

1.某校高中生共有900人,其中高一年级300人,高二年级200人,高三年级400人,现分层抽取容量为45的样本,那么高一、高二、高三年级抽取的人数分别为 . 答案 15,10,20

2.某牛奶生产线上每隔30分钟抽取一袋进行检验,则该抽样方法为①;从某中学的30名数学爱好者中抽取3人了解学习负担情况,则该抽样方法为②.那么①,②分别为 .

答案 系统抽样,简单随机抽样

3.下列抽样实验中,最适宜用系统抽样的是 (填序号).

①某市的4个区共有2 000名学生,且4个区的学生人数之比为3∶2∶8∶2,从中抽取200人入样

②某厂生产的2 000个电子元件中随机抽取5个入样 ③从某厂生产的2 000个电子元件中随机抽取200个入样 ④从某厂生产的20个电子元件中随机抽取5个入样 答案 ③

4.某校高三年级有男生500人,女生400人,为了解该年级学生的健康情况,从男生中任

意抽取25人,从女生中任意抽取20人进行调查,这种抽样方法是 . 答案 分层抽样法

5.某中学有高一学生400人,高二学生300人,高三学生200人,学校团委欲用分层抽样的方法抽取18名学生进行问卷调查,则下列判断不正确的是 (填序号). ①高一学生被抽到的概率最大 ②高三学生被抽到的概率最大 ③高三学生被抽到的概率最小 ④每名学生被抽到的概率相等 答案 ①②③

6.某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40种、10种、30种、20种,现从中抽取一个容量为20的样本进行食品安全检测,若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是 . 答案 6

7.一个单位共有职工200人,其中不超过45岁的有120人,超过45岁的有80人.为了调查职工的健康状况,用分层抽样的方法从全体职工中抽取一个容量为25的样本,应抽取超过45岁的职工 人. 答案 10

8.将参加数学竞赛的1 000名学生编号如下0001,0002,0003,…,1000,打算从中抽取一个容量为50的样本,按系统抽样的方法分成50个部分,如果第一部分编号为0001,0002,…,0020,从第一部分随机抽取一个号码为0015,则第40个号码为 . 答案 0795

9.某政府机关有在编人员100人,其中副处级以上干部10人,一般干部70人,工人20人,上级机关为了了解政府机构改革意见,要从中抽取一个容量为20的样本,试确定用何种方法抽取,如何抽取? 解 用分层抽样抽取. (1)∵20∶100=1∶5, ∴5

10=2,5

70=14,5

20=4

∴从副处级以上干部中抽取2人,一般干部中抽取14人,从工人中抽取4人.

(2)因副处级以上干部与工人人数较少,可用抽签法从中分别抽取2人和4人;对一般干部可用随机数表法抽取14人.

(3)将2人、4人、14人编号汇合在一起就得到了容量为20的样本.

10.某单位有工程师6人,技术员12人,技工18人,要从这些人中抽取一个容量为n 的样本.如果采用系统抽样法和分层抽样法抽取,不用剔除个体;如果样本容量增加一个,则在采用系统抽样时,需要在总体中先剔除1个个体,求样本容量n . 解 总体容量为6+12+18=36.当样本容量是n 时,由题意知,系统抽样的间隔为n

36,分层

抽样的比例是36

n ,抽取工程师

36

n ×6=6

n (人),

抽取技术人员36

n ×12=3

n (人),

抽取技工

36

n

×18=2

n (人).

所以n 应是6的倍数,36的约数即n =6,12,18,36.

当样本容量为(n +1)时,在总体中剔除1人后还剩35人,系统抽样的间隔为

1

35+n ,因为

1

35+n 必须是整数,所以n 只能取6,即样本容量为6.

总体分布的估计与总体特征数的估计

1.一个容量为20的样本,已知某组的频率为0.25,则该组的频数为 . 答案 5

2.右图是根据《山东统计年鉴2007》中的资料作成的1997年至2006年我省城镇居民百户家庭人口数的茎叶图.图中左边的数字从左到右分别表示城镇居民百户家庭人口数的百位数字和十位数字,右边的数字表示城镇居民百户家庭人口数的个位数字.从图中可以得到1997年至2006年我省城镇居民百户家庭人口数的平均数为 . 答案 30

3.6

3.在抽查产品的尺寸过程中,将其尺寸分成若干组,[a ,b )是其中的一组,抽查出的个体在该组上的频率为m ,该组在频率分布直方图的高为h ,则|a -b |= . 答案 h

m

4.从某项综合能力测试中抽取100人的成绩,统计如表,则这100人成绩的标准差为 .

答案 5

10

2

5.为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁~18岁的男生体重(kg ),得到频率分布直方图如下:

根据上图可得这100名学生中体重在[56.5,64.5)的学生人数是 . 答案 40

典型例题:

例1 在学校开展的综合实践活动中,某班进行了小制作评比,作品上交时间为5月1日至30日,评委会把同学们上交 作品的件数按5天一组分组统计,绘制了频率分布直方

图(如图所示),已知从左到右各长方形高的比为2∶3∶4∶6∶4∶1,第三组的频数为12,请解答下列问题:

(1)本次活动共有多少件作品参加评比? (2)哪组上交的作品数量最多?有多少件? (3)经过评比,第四组和第六组分别有10件、2件作品获奖,问这两组哪组获奖率高? 解 (1)第三组的频率为1464324

+++++=5

1

又因为第三组的频数为12,∴参评作品数为5

1

12=60.

(2)根据频率分布直方图,可以看出第四组上交的作品数量最多,共有60×

1

464326

+++++=18(件).

(3)第四组的获奖率是18

10=9

5,第六组上交的作品数量为60×1

464321

+++++=3(件),

∴第六组的获奖率为3

2=9

6,显然第六组的获奖率高.

例4(14分)某化肥厂甲、乙两个车间包装肥料,在自动包装传送带上每隔30 min 抽取

一包产品,称其重量,分别 记录抽查数据如下:

甲:102, 101, 99, 98, 103, 98, 99; 乙:110, 115, 90, 85, 75, 115, 110. (1)这种抽样方法是哪一种? (2)将这两组数据用茎叶图表示;

(3)将两组数据比较,说明哪个车间产品较稳定.

解 (1)因为间隔时间相同,故是系统抽样. 2分 (2)茎叶图如下:

5分

(3)甲车间: 平均值:

1x =7

1(102+101+99+98+103+98+99)=100,

7分

方差:s 12=7

1[(102-100)2+(101-100)2+…+(99-100)2]≈3.428 6.

9分

乙车间:

平均值:2x =7

1(110+115+90+85+75+115+110)=100,

11分 方差:s 22=7

1[(110-100)2+(115-100)2+…+(110-100)2]≈228.571 4.

13分

∵1x =2x ,s 12<s 22,∴甲车间产品稳定.

14分

练习:

1.为了了解小学生的体能情况,抽取了某小学同年级部分学生进行跳绳测试,将所得数据整理后,画出频率分布直方图如图所示,已知图中从左到右前三个小组的频率分别是0.1,0.3,0.4,第一小组的频数为5.

(1)求第四小组的频率;

(2)参加这次测试的学生人数是多少?

(3)在这次测试中,学生跳绳次数的中位数落在第几小组内? 解 (1)第四小组的频率=1-(0.1+0.3+0.4)=0.2. (2)设参加这次测试的学生人数是n , 则有n =第一小组频率

第一小组频数=5÷0.1=50(人).

(3)因为0.1×50=5,0.3×50=15,0.4×50=20,0.2×50=10,即第一、第二、第三、第四小组的频数分别为5、15、20、10,所以学生跳绳次数的中位数落在第三小组内.

练习:

一、填空题

1.下列关于频率分布直方图的说法中不正确的是 . ①直方图的高表示取某数的频率

②直方图的高表示该组上的个体在样本中出现的频率 ③直方图的高表示该组上的个体数与组距的比值

④直方图的高表示该组上的个体在样本中出现的频率与组距的比值 答案 ①②③

2.甲、乙两名新兵在同样条件下进行射击练习,每人打5发子弹,命中环数如下:甲:6,8,9,9,8;乙:10,7,7,7,9.则这两人的射击成绩 比 稳定. 答案 甲 乙

4.某班50名学生在一次百米测试中,成绩全部介于13秒与19秒之间,将测试结果分成六组:右图是得到的频率分布直方图.

设成绩小于17秒的学生人数占全班总人数的百分比为x ,成绩大于等于15秒且小于17

秒的学生人数为y ,则从频率分布直方图中可分析出x 和y 分别为 . 答案 0.9, 35

6.甲、乙两名同学在5次体育测试中的成绩统计的茎叶图如图所示,若甲、乙两人的平均成绩

分别是x 甲、x 乙,则x 甲 x 乙, 比 稳定. 答案 < 乙 甲

7.已知总体的各个体的值由小到大依次为2,3,3,7,a ,b ,12,13.7,18.3,20,且总体的中位数为10.5.若要使该总体的方差最小,则a 、b 的取值分别是 . 答案 10.5、10.5

二、解答题

10.为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.

(1)第二小组的频率是多少?样本容量是多少?

(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?

(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.

解 (1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小, 因此第二小组的频率为:

3

91517424

+++++=0.08.

又因为频率=样本容量

第二小组频数,

所以样本容量=第二小组频率第二小组频数=

08

.012

=150. (2)由图可估计该学校高一学生的达标率约为

3

91517423

91517++++++++×100%=88%.

(3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内.

线性回归方程

1.下列关系中,是相关关系的为(填序号).

①学生的学习态度与学习成绩之间的关系;

②教师的执教水平与学生的学习成绩之间的关系;

③学生的身高与学生的学习成绩之间的关系;

④家庭的经济条件与学生的学习成绩之间的关系.

答案①②

2.为了考察两个变量x、y之间的线性相关关系,甲、乙两同学各自独立地做10次和15

次试验,并利用最小二乘法求得回归直线分别为l

1和l

2

.已知在两人的试验中发现变量

x的观测数据的平均值恰好相等,都为s,变量y的观测数据的平均值也恰好相等,都为t,那么下列说法中正确的是(填序号).

①直线l

1,l

2

有交点(s,t)

②直线l

1,l

2

相交,但是交点未必是(s,t)

③直线l

1,l

2

由于斜率相等,所以必定平行

④直线l

1,l

2

必定重合

答案①

3.下列有关线性回归的说法,正确的是(填序号).

①相关关系的两个变量不一定是因果关系

②散点图能直观地反映数据的相关程度

③回归直线最能代表线性相关的两个变量之间的关系

④任一组数据都有回归直线方程

答案①②③

4.下列命题:

①线性回归方法就是由样本点去寻找一条贴近这些样本点的直线的数学方法;

②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示;

③通过回归直线y?=b?x+a?及回归系数b?,可以估计和预测变量的取值和变化趋势.

其中正确命题的序号是 .

答案①②③

5.已知回归方程为y?=0.50x-0.81,则x=25时,y?的估计值为 .

答案11.69

例1下面是水稻产量与施化肥量的一组观测数据:

施化肥量15 20 25 30 35 40 45

水稻产量320 330 360 410 460 470 480

(1)将上述数据制成散点图;

(2)你能从散点图中发现施化肥量与水稻产量近似成什么关系吗?水稻产量会一直随施化肥量的增加而增长吗?

解(1)散点图如下:

(2)从图中可以发现施化肥量与水稻产量具有线性相关关系,当施化肥量由小到大变化时,水稻产量由小变大,图中的数据点大致分布在一条直线的附近,因此施化肥量和水稻产量近似成线性相关关系,但水稻产量只是在一定范围内随着化肥施用量的增加而增长. 例2(14分)随着我国经济的快速发展,城乡居民的生活水平不断提高,为研究某市家庭平均收入与月平均生活支出

(1)判断家庭平均收入与月平均生活支出是否相关?

(2)若二者线性相关,求回归直线方程.

解(1)作出散点图:

5分

观察发现各个数据对应的点都在一条直线附近,所以二者呈线性相关关系.

7分

(2)x=

10

1 (0.8+1.1+1.3+1.5+1.5+1.8+2.0+2.2+2.4+2.8)=1.74,

y=

10

1(0.7+1.0+1.2+1.0+1.3+1.5+1.3+1.7+2.0+2.5)=1.42,

9分

b?=

=

=

-

?

-

n

i

i

n

i

i

i

x n

x

y

x n

y

x

1

2

2

1≈0.813 6,

a?=1.42-1.74×0.813 6≈0.004 3,13

∴回归方程y

?=0.813 6x +0.004 3. 14

例3 下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨)标准煤的几组对照数据.

(1)请画出上表数据的散点图;

(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y

?=b ?x +a ?; (3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤? (参考数值:3×2.5+4×3+5×4+6×4.5=66.5) 解 (1)散点图如下图:

(2)x =4

6543+++=4.5,y =4

5.4435.2+++=3.5

∑=4

1i i

i y

x =3×2.5+4×3+4×5+6×4.5=66.5.

∑=4

1

2i i

x

=32+42+52+62=86

∴b

?=2

4

1

24

1

44x x y

x y

x i i i

i

i -?-∑

∑===25

.44865.45.345.66?-??-=0.7

a

? =y -b

?x =3.5-0.7×4.5=0.35. ∴所求的线性回归方程为y

?=0.7x +0.35. (3)现在生产100吨甲产品用煤

y =0.7×100+0.35=70.35,

∴降低90-70.35=19.65(吨)标准煤.

1.科研人员为了全面掌握棉花新品种的生产情况,查看了气象局对该地区年降雨量与年平

1(2)判断两个变量是否具有相关关系. 解 (1)作出散点图如图所示,

(2)由散点图可知,各点并不在一条直线附近,所以两个变量是非线性相关关系. 2.在研究硝酸钠的可溶性程度时,对于不同的温度观测它在水中的溶解度,得观测结果如下:

由资料看解 x =30,y =5

0.1283.1120.850.767.66++++=93.6.

b

?=2

5

1

25

1

55x x

y

x y

x i i

i i

i -?-∑∑==≈0.880 9.

a

?=y -b

?x =93.6-0.880 9×30=67.173. ∴回归方程为y

?=0.880 9x +67.173.

3.

(1)求出线性回归方程;

(2)指出产量每增加1 000件时,单位成本平均变动多少? (3)假定产量为6 000件时,单位成本为多少元? 解 (1)n =6,∑=6

1

i i x =21,∑=6

1

i i y =426,x =3.5,y =71,

=6

1

2

i i x =79,∑=6

1

i i i y x =1 481,

b

?=2

6

1

26

1

66x x

y

x y

x i i

i i

i -?-∑∑===2

5.3679715.364811

?-??-=-1.82.

a

?=y -b

?x =71+1.82×3.5=77.37. 回归方程为y

?=a ?+b ?x =77.37-1.82x . (2)因为单位成本平均变动b ?=-1.82<0,且产量x 的计量单位是千件,所以根据回归系

b 的意义有:

产量每增加一个单位即1 000件时,单位成本平均减少1.82元. (3)当产量为6 000件时,即x =6,代入回归方程:

y

?=77.37-1.82×6=66.45(元) 当产量为6 000件时,单位成本为66.45元.

一、填空题

1.观察下列散点图,则①正相关;②负相关;③不相关.它们的排列顺序与图形对应顺序是 .

答案 a ,c ,b

2.回归方程y

?=1.5x -15,则下列说法正确的有 个.

①y =1.5x -15 ②15是回归系数a ③1.5是回归系数a ④x =10时,y =0 答案 1

3.某地区调查了2~9岁儿童的身高,由此建立的身高y (cm)与年龄x (岁)的回归模型为y

?=8.25x +60.13,下列叙述正确的是 .

①该地区一个10岁儿童的身高为142.63 cm

②该地区2~9岁的儿童每年身高约增加8.25 cm ③该地区9岁儿童的平均身高是134.38 cm

④利用这个模型可以准确地预算该地区每个2~9岁儿童的身高 答案 ②

4.三点(3,10),(7,20),(11,24)的回归方程是 .

答案 y

?=1.75x +5.75 5.某人对一地区人均工资x (千元)与该地区人均消费y (千元)进行统计调查,y 与x 有

相关关系,得到回归直线方程y

?=0.66x +1.562.若该地区的人均消费水平为7.675千元,估计该地区的人均消费额占人均工资收入的百分比约为 .

答案 83%

6.某化工厂为预测产品的回收率y ,需要研究它和原料有效成分含量x 之间的相关关系,现

取8对观测值,计算,得∑=8

1

i i x =52, ∑=8

1

i i y =228, ∑

=8

1

2

i i x =478, ∑=8

1

i i i y x =1 849,则其线性回归

方程为 .

答案 y

?=11.47+2.62x 7.有下列关系:①人的年龄与他(她)拥有的财富之间的关系;②曲线上的点与该点的坐

标之间的关系;③苹果的产量与气候之间的关系;④森林中的同一种树木,其断面直径与高度之间的关系.其中,具有相关关系的是 . 答案 ①③④

8.

若y 对x 呈线性相关关系,则回归直线方程y

?=b ?x +a ?表示的直线一定过定点 . 答案 (4,5)

二、解答题

9.

(1)数学成绩和物理成绩具有相关关系吗?

(2)请你画出两科成绩的散点图,结合散点图,认识(1)的结论的特点. 解 (1)数学成绩和物理成绩具有相关关系.

(2)以x 轴表示数学成绩,y 轴表示物理成绩,可得相应的散点图如下:

由散点图可以看出,物理成绩和数学成绩对应的点不分散,大致分布在一条直线附近. 10.

(1(2)求线性回归方程,并在散点图中加上回归直线. 解 (1)数据对应的散点图如图所示:

(2)x =109,y =23.2,∑=5

12i i x =60 975,

∑=5

1

i i

i

y x

=12 952,

b

?=2

5

1

25

1

55x x

y

x y

x i i

i i

i -?-∑∑==

0.196 2

a

?=y -b

?x ≈1.814 2 ∴所求回归直线方程为

y

?=0.196 2x +1.814 2. 11.

(1(2)求回归直线方程;

(3)估计销售总额为24千万元时的利润. 解 (1)散点图如图所示:

(2)x =7

1(10+15+17+20+25+28+32)=21,

y

=7

1(1+1.3+1.8+2+2.6+2.7+3.3)=2.1,

∑=7

12i i

x

=102+152+172+202+252+282+322=3 447,

∑=7

1

i i

i

y x

=10×1+15×1.3+17×1.8+20×2+25×2.6+28×2.7+32×3.3=346.3,

b

?=2

7

1

27

1

77x x y

x y

x i i i i

i -?-∑

∑===2

21

744731

.22173.346?-??-≈0.104, a

?=y -b

?x =2.1-0.104×21=-0.084, ∴y

?=0.104x -0.084. (3)把x =24(千万元)代入方程得,

y

?=2.412(千万元). ∴估计销售总额为24千万元时,利润为2.412千万元.

12.

(1)画出散点图;

(2)求回归直线方程;

(3)试预测广告费支出为10百万元时,销售额多大? 解 (1)根据表中所列数据可得散点图如下:

(2

因此,x =5

25=5,y =5

250 =50,

=5

1

2

i i x =145, ∑

=5

1

2

i i y =13 500, ∑=

5

1

i i i y x =1 380.

于是可得:b

?=2

5

1

25

1

55x x

y

x y

x i i

i i

i -?-∑∑===5

5514550553801

??-??-=6.5;

a

?=y -b

?x =50-6.5×5=17.5. 因此,所求回归直线方程为:y

?=6.5x +17.5. (3)根据上面求得的回归直线方程,当广告费支出为10百万元时,y

?=6.5×

10+17.5=82.5(百万元),即这种产品的销售收入大约为82.5百万元.

§11.4 统计案例

1.对有线性相关关系的两个变量建立的回归直线方程y

?=a ?+b ?x 中,回归系数b ?与0的大小关系为 .(填序号)

①大于或小于 ②大于 ③小于 ④不小于

答案 ①

2.如果有90%的把握说事件A 和B 有关系,那么具体计算出的数据χ2 2.706.(用“>”,“<”,“=”填空) 答案 >

3.对两个变量y 与x 进行回归分析,分别选择不同的模型,它们的相关系数r 如下,其中拟合效果最好的模型是 . ①模型Ⅰ的相关系数r 为0.98 ②模型Ⅱ的相关系数r 为0.80 ③模型Ⅲ的相关系数r 为0.50 ④模型Ⅳ的相关系数r 为0.25 答案 ①

4.下列说法中正确的有:①若r >0,则x 增大时,y 也相应增大;②若r <0,则x 增大时,y 也相应增大;③若r =1或r =-1,则x 与y 的关系完全对应(有函数关系),在散点图上各个点均在一条直线上 . 答案 ①③

例1 (14分)

试问:(1(2)用假设检验的思想给予证明. (1)解 根据列联表的数据,得到

χ2

=

)

)()()(()(2

c d b d c a b a bc ad n ++++-

2分 =134

28356205)1316212143(3392

????-??=7.469>6.635

6分 所以有99%的把握认为“吸烟与患慢性气管炎有关”.

9分

(2)证明 假设“吸烟与患慢性气管炎之间没有关系”,由于事件A ={χ2≥6.635}≈0.01,即A 为小概率事件,而小概率事件发生了,进而得假设错误,这种推断出错的可能性约有1%. 14分

例2 一台机器使用时间较长,但还可以使用.它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有 缺点零件的多少,随机器运转的速度而变化,下表为抽样

试验结果:

(1(2)如果y 与x 有线性相关关系,求回归直线方程;

(3)若实际生产中,允许每小时的产品中有缺点的零件最多为10个,那么,机器的运转速度应控制在什么范围内? 解 (1)x =12.5,y =8.25,

∑=4

1i i

i

y x

=438,4x y =412.5,

=4

1

2

i i x =660,∑=4

1

2i i y =291,

所以r =

)

4)(

4(

424

1

224

1

24

1

y y

x x

y

x y

x i i

i i

i i

i --?-∑∑∑===

=)25.272291()625660(5.412438-?--

=

25

.6565.25≈62

.2550.25≈0.995 4.

因为r >r 0.05,所以y 与x 有很强的线性相关关系.

(2)y

?=0.728 6x -0.857 1. (3)要使y

?≤10?0.728 6x -0.857 1≤10, 所以x ≤14.901 3.

所以机器的转速应控制在14.901 3转/秒以下.

例3 下表是某年美国旧轿车价格的调查资料,今以x 表示轿车的使用年数,y 表示相应的年均价格,求y 关于x 的回归 方程

y 解

可以发现,各点并不是基本处于一条直线附近,因此,y与x之间应是非线性相关关系.与已学函数图象比较,用y?=e a x b?

? 来刻画题中模型更为合理,令z?=ln y?,则z?=b?x+a?,题

可以用线性回归方程拟合.

由表中数据可得r≈-0.996.|r|>r

0.05

.认为x与z之间具有线性相关关系,由表中数据得b?≈-0.298,a?≈8.165,所以z?=-0.298x+8.165,最后回代z?=ln y?,即y?=e-0.298x+8.165为所求.

1.某班主任对全班50名学生学习积极性和对待班级工作的态度进行了调查,统计数据如下表所示:

(1

抽到不太主动参加班级工作且学习积极性一般的学生的概率是多少?

(2)试运用独立性检验的思想方法分析:学生的学习积极性与对待班级工作的态度是否有关系?说明理由.

解(1)随机抽查这个班的一名学生,有50种不同的抽查方法,由于积极参加班级工作的学生有18+6=24人,所以有24种不同的抽法,因此由古典概型的计算公式可得抽到积

极参加班级工作的学生的概率是P

1=

50

24=

25

12,又因为不太主动参加班级工作且学习积极

性一般的学生有19人,所以抽到不太主动参加班级工作且学习积极性一般的学生的概率

高中数学统计、统计案例知识点总结和典例说课讲解

统计 一.简单随机抽样:抽签法和随机数法 1.一般地,设一个总体含有N个个体(有限),从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等(n/N),就把这种抽样方法叫做简单随机抽样。 2.一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本,这种抽样方法叫做抽签法。 抽签法的一般步骤:a、将总体的个体编号。 b、连续抽签获取样本号码。 3. 利用随机数表、随机数骰子或计算机产生的随机数进行抽样,叫随机数表法。 随机数表法的步骤:a、将总体的个体编号。b、在随机数表中选择开始数字。c、读数获取样本号码。 4. 抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力,又不方便,如果标号的签搅拌得不均匀,会导致抽样不公平,随机数表法的优点与抽签法相同,缺点上当总体容量较大时,仍然不是很方便,但是比抽签法公平,因此这两种方法只适合总体容量较少的抽样类型。 二.系统抽样: 1.一般地,要从容量为N的总体中抽取容量为n的样本,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样的方法叫做系统抽样。 系统抽样的一般步骤: (1)采用随机抽样的方法将总体中的N个个编号。 (2)将整体按编号进行分段,确定分段间隔k=N/n。(k∈N,L≤k). (3)在第一段用简单随机抽样确定起始个体的编号L(L∈N,L≤k)。 (4)按照一定的规则抽取样本,通常是将起始编号L加上间隔k得到第2个个体编号L+K,再加上K得到第3个个体编号L+2K,这样继续下去,直到获取整个样本。 在确定分段间隔k时应注意:分段间隔k为整数,当N/n不是整数时,应采用等可能剔除的方剔除部分个体,以获得整数间隔k。 三.分层抽样: 1.一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样的方法叫分层抽样。 分层抽样的步骤: (1)分层:按某种特征将总体分成若干部分。(2)按比例确定每层抽取个体的个数。 (3)各层分别按简单随机抽样的方法抽取。(4)综合每层抽样,组成样本。 2.分层抽样是当总体由差异明显的几部分组成时采用的抽样方法,进行分层抽样时应注意以下几点: (1)分层抽样中分多少层、如何分层要视具体情况而定,总的原则是,层内样本的差异要小,面层之间的样本差异要大,且互不重叠。 (2)为了保证每个个体等可能入样,所有层应采用同一抽样比等可能抽样。 (3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样。 四.用样本的频率分布估计总体分布: 1.频率分布是指一个样本数据在各个小范围内所占比例的大小。一般用频率分布直方图反映样本的频率分布。 其一般步骤为:(1)计算一组数据中最大值与最小值的差,即求极差(2)决定组距与组数(3)将数据分组(4)列频率分布表(5)画频率分布直方图 2.频率分布折线图、总体密度曲线 频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图。

高中数学 专题 统计与统计案例

一、选择题 1.利用系统抽样法从编号分别为1,2,3,…,80的80件不同产品中抽出一个容量为16的样本,如果抽出的产品中有一件产品的编号为13,则抽到产品的最大编号为( ) A .73 B .78 C .77 D .76 解析:样本的分段间隔为80 16=5,所以13号在第三组,则最大的编号为13+(16-3)×5 =78.故选B. 答案:B 2.某课外小组的同学们在社会实践活动中调查了20户家庭某月的用电量如下表所示: 则这20A .180,170 B .160,180 C .160,170 D .180,160 解析:用电量为180度的家庭最多,有8户,故这20户家庭该月用电量的众数是180,排除B ,C ;将用电量按从小到大的顺序排列后,处于最中间位置的两个数是160,180,故这20户家庭该月用电量的中位数是170.故选A. 答案:A 3.(2017·高考全国卷Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了如图所示的折线图,根据该折线图,下列结论错误的是( ) A .月接待游客量逐月增加 B .年接待游客量逐年增加 C .各年的月接待游客量高峰期大致在7,8月 D .各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳

解析:根据折线图可知,2014年8月到9月、2014年10月到11月等月接待游客量都在减少,所以A 错误.由图可知,B 、C 、D 正确. 答案:A 4.(2018·宝鸡质检)对一批产品的长度(单位:毫米)进行抽样检测,样本容量为200,如图为检测结果的频率分布直方图,根据产品标准,单件产品长度在区间[25,30)的为一等品,在区间[20,25)和[30,35)的为二等品,其余均为三等品,则该样本中三等品的件数为( ) A .5 B .7 C .10 D .50 解析:根据题中的频率分布直方图可知,三等品的频率为1-(0.050 0+0.062 5+0.037 5)×5=0.25,因此该样本中三等品的件数为200×0.25=50. 答案:D 5.(2018·兰州模拟)已知某种商品的广告费支出x (单位:万元)与销售额y (单位:万元)之间有如下对应数据: 根据表中提供的全部数据,用最小二乘法得出y 与x 的线性回归方程为y ^ =6.5x +17.5,则表中m 的值为( ) A .45 B .50 C .55 D .60 解析:∵x =2+4+5+6+8 5=5, y = 30+40+50+m +705=190+m 5 , ∴当x =5时,y =6.5×5+17.5=50, ∴190+m 5=50,解得m =60. 答案:D

(典型题)高考数学二轮复习-知识点总结-统计与统计案例

统计和统计案例 1.该部分常考内容:样本数字特征的计算、各种统计图表、线性回归方程、独立性检验等;有时也会在知识交汇点处命题,如概率和统计交汇等. 2.从考查形式上来看,大部分为选择题、填空题,重在考查基础知识、基本技能,有时在知识交汇点处命题,也会出现解答题,都属于中低档题. 1. 随机抽样 (1)简单随机抽样特点为从总体中逐个抽取,适用范围:总体中的个体较少. (2)系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取,适用范围:总体中的个体数较多. (3)分层抽样特点是将总体分成几层,分层进行抽取,适用范围:总体由差异明显的几部分组成. 2. 常用的统计图表 (1)频率分布直方图 ①小长方形的面积=组距× 频率 组距 =频率; ②各小长方形的面积之和等于1; ③小长方形的高=频率组距,所有小长方形的高的和为1 组距. (2)茎叶图 在样本数据较少时,用茎叶图表示数据的效果较好. 3. 用样本的数字特征估计总体的数字特征 (1)众数、中位数、平均数 数字特征 样本数据 频率分布直方图 众数 出现次数最多的数据 取最高的小长方形底边中点的横坐标 中位数 将数据按大小依次排列,处在最 中间位置的一个数据(或最中间两个数据的平均数) 把频率分布直方图划分左右两个面积相等的分界线和x 轴交点的横坐标 平均数 样本数据的算术平均数 每个小矩形的面积乘以小矩形底边中点的横坐标之和 (2)方差:s 2=n [(x 1-x )2+(x 2-x )2+…+(x n -x )2 ]. 标准差:

s = 1n [ x 1-x 2 +x 2-x 2 +…+x n -x 2 ]. 4. 变量的相关性和最小二乘法 (1)相关关系的概念、正相关和负相关、相关系数. (2)最小二乘法:对于给定的一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),通过求Q = i =1 n (y i -a -bx i )2 最小时,得到线性回归方程y ^ =b ^ x +a ^ 的方法叫做最小二乘法. 5. 独立性检验 对于取值分别是{x 1,x 2}和{y 1,y 2}的分类变量X 和Y ,其样本频数列联表是: y 1 y 2 总计 x 1 a b a +b x 2 c d c +d 总计 a +c b +d n 则K 2 = n ad -bc 2a +b c + d a +c b +d (其中n =a +b +c +d 为样本容量). 考点一 抽样方法 例1 (2012·山东)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C .则抽到的人中,做问卷B 的人数为 ( ) A .7 B .9 C .10 D .15 答案 C 分析 由系统抽样的特点知:抽取号码的间隔为 960 32 =30,抽取的号码依次为9,39,69,…,939.落入区间[451,750]的有459,489,…,729,这些数构成首项为459,公差为30的等差数列,设有n 项,显然有729=459+(n -1)×30,解得n =10.所以做问卷B 的有10人. 在系统抽样的过程中,要注意分段间隔,需要抽取几个个体,样本就需要分 成几个组,则分段间隔即为N n (N 为样本容量),首先确定在第一组中抽取的个体的号码数,再从后面的每组中按规则抽取每个个体.解决此类题目的关键是深刻理解各种抽样

高中数学专题――概率统计专题.

专题二概率统计专题 【命题趋向】概率与统计是高中数学的重要学习内容,它是一种处理或然问题的方法,在工农业生产和社会生活中有着广泛的应用,渗透到社会的方方面面,概率与统计的基础知识成为每个公民的必备常识.概率与统计的引入,拓广了应用问题取材的范围,概率的计算、离散型随机变量的分布列和数学期望的计算及应用都是考查应用意识的良好素材.在高考试卷中,概率与统计的内容每年都有所涉及,以解答题形式出现的试题常常设计成包含离散型随机变量的分布列与期望、统计图表的识别等知识为主的综合题,以考生比较熟悉的实际应用问题为载体,以排列组合和概率统计等基础知识为工具,考查对概率事件的识别及概率计算.解答概率统计试题时要注意分类与整合、化归与转化、或然与必然思想的运用.由于中学数学中所学习的概率与统计内容是最基础的,高考对这一部分内容的考查注重考查基础知识和基本方法.该部分在高考试卷中,一般是2—3个小题和一个解答题. 【考点透析】概率统计的考点主要有:概率与统计包括随机事件,等可能性事件的概率,互斥事件有一个发生的概率,古典概型,几何概型,条件概率,独立重复试验与二项分布,超几何分布,离散型随机变量的分布列,离散型随机变量的期望和方差,抽样方法,总体分布的估计,正态分布,线性回归等.【例题解析】 题型1 抽样方法 -)中,在公证部门监督下按照随机抽取的方法确【例1】在1000个有机会中奖的号码(编号为000999 定后两位数为的号码为中奖号码,该抽样运用的抽样方法是() A.简单随机抽样B.系统抽样C.分层抽样D.以上均不对 分析:实际“间隔距离相等”的抽取,属于系统抽样. 解析:题中运用了系统抽样的方法采确定中奖号码,中奖号码依次为:088,188,288,388,488,588,688,788,888,988.答案B. 点评:关于系统抽样要注意如下几个问题:(1)系统抽样是将总体分成均衡几个部分,然按照预先定出的规则从每一部分抽取一个个体,得到所需要的样本的一种抽样方法.(2)系统抽样的步骤:①将总体中的个体随机编号;②将编号分段;③在第一段中用简单随机抽样确定起始的个体编号;④按事先研究的规则抽取样本.(3)适用范围:个体数较多的总体. 例2(2008年高考广东卷理3)某校共有学生2000名,各年级男、女生人数如表.已知在全校学生中随机抽取1名,抽到二年级女生的概率是0.19.现用分层抽样的方法在全校抽取64名学生,则应在三年级抽取的学生人数为() A.24B.18C.16D.12 Array 分析:根据给出的概率先求出x的值,这样就可以知道三年级的学生人数,问题就解决了. x=?=,这样一年级和二年级学生的解析:C 二年级女生占全校学生总数的19%,即20000.19380 +++=,三年级学生有500人,用分层抽样抽取的三年级学生应是总数是3733773803701500 64 50016 ?=.答案C. 2000 点评:本题考查概率统计最基础的知识,还涉及到一点分析问题的能力和运算能力,题目以抽样的等可能性为出发点考查随机抽样和分层抽样的知识. 例3.(2009江苏泰州期末第2题)一个社会调查机构就某地居民的月收入调查了10000人,并根据所得数据画了样本的频率分布直方图(如下图).为了分析居民的收入与年龄、学历、职业等方面的关系, 2500,3500(元)月收入段应抽要从这10000人中再用分层抽样方法抽出100人作进一步调查,则在[) 出人.

高中数学知识点之统计及统计案例分析

高中数学知识点之统计及统计案例分析 第十一编统计、统计案例 §11.1 抽样方法 1.为了了解所加工的一批零件的长度,抽取其中200个零件并测量了其长度,在这个 问题中,总体的一个样本是 . 答案 200个零件的长度 2.某城区有农民、工人、知识分子家庭共计2 004户,其中农民家庭1 600户,工人 家庭303户,现要从中抽取容量为40的样本,则在整个抽样过程中,可以用到下列抽样 方法:①简单随机抽样,②系统抽样,③分层抽样中的 . 答案①②③ 3.某企业共有职工150人,其中高级职称15人,中级职称45人,初级职称90人.现 采用分层抽样抽取容量为30的样本,则抽取的各职称的人数分别为 . 答案 3,9,18 4.(2019·广东理)某校共有学生2 000名,各年级男、女生人数如下表.已知在全 校学生中随机抽取1名,抽到二年级女生的概率是0.19.现用分层抽样的方法在全校抽取 64名学生,则应在三年级抽取的学生人数为 . 女生男生 答案 16 5.某工厂生产A、B、C三种不同型号的产品,其相应产品数量之比为2∶3∶5,现用 分层抽样方法抽出一个容量为n的样本,样本中A型号产品有16件,那么此样本的容量 n= .答案 80 例1 某大学为了支援我国西部教育事业,决定从2019应届毕业生报名的18名志愿者中,选取6人组成志愿小组.请用抽签法和随机数表法设计抽样方案.解抽签法:第一步:将18名志愿者编号,编号为1,2,3, (18) 第二步:将18个号码分别写在18张外形完全相同的纸条上,并揉成团,制成号签; 第三步:将18个号签放入一个不透明的盒子里,充分搅匀;第四步:从盒子中逐个抽取 6个号签,并记录上面的编号;第五步:所得号码对应的志愿者,就是志愿小组的成员. 随机数表法: 第一步:将18名志愿者编号,编号为01,02,03, (18) 第二步:在随机数表中任选一数作为开始,按任意方向读数,比如第8行第29列的 数7开始,向右读; 第三步:从数7开始,向右读,每次取两位,凡不在01—18中的数,或已读过的数,都跳过去不作记录,依次可得到12,07,15,13,02,09.

高中数学统计案例分析及知识点归纳总结

统计 一、知识点归纳 1、抽样方法: ①简单随机抽样(总体个数较少) ②系统抽样(总体个数较多) ③分层抽样(总体中差异明显) 注意:在N 个个体的总体中抽取出n 个个体组成样本,每个个体被抽到的机会(概率)均为N n 。 2、总体分布的估计: ⑴一表二图: ①频率分布表——数据详实 ②频率分布直方图——分布直观 ③频率分布折线图——便于观察总体分布趋势 注:总体分布的密度曲线与横轴围成的面积为1。 ⑵茎叶图: ①茎叶图适用于数据较少的情况,从中便于看出数据的分布,以及中位数、众位数等。 ②个位数为叶,十位数为茎,右侧数据按照从小到大书写,相同的数据重复写。 3、总体特征数的估计: ⑴平均数:n x x x x x n ++++= 321; 取值为n x x x ,,,21 的频率分别为n p p p ,,,21 ,则其平均数为n n p x p x p x +++ 2211; 注意:频率分布表计算平均数要取组中值。 ⑵方差与标准差:一组样本数据n x x x ,,,21 方差:2 1 2)(1 ∑=-= n i i x x n s ; 标准差:2 1 )(1∑=-= n i i x x n s 注:方差与标准差越小,说明样本数据越稳定。 平均数反映数据总体水平;方差与标准差反映数据的稳定水平。 ⑶线性回归方程 ①变量之间的两类关系:函数关系与相关关系; ②制作散点图,判断线性相关关系 ③线性回归方程:a bx y +=∧ (最小二乘法) 1 221n i i i n i i x y nx y b x nx a y bx ==? -? ?=??-??=-??∑∑ 注意:线性回归直线经过定点),(y x 。

高中数学统计与概率知识点(原稿)

高中数学统计与概率知识点(文) 第一部分:统计 一、什么是众数。 一组数据中出现次数最多的那个数据,叫做这组数据的众数。 众数的特点。 ①众数在一组数据中出现的次数最多;②众数反映了一组数据的集中趋势,当众数出现的次数越多,它就越能代表这组数据的整体状况,并且它能比较直观地了解到一组数据的大致情况。但是,当一组数据大小不同,差异又很大时,就很难判断众数的准确值了。此外,当一组数据的那个众数出现的次数不具明显优势时,用它来反映一组数据的典型水平是不大可靠的。 3.众数与平均数的区别。 众数表示一组数据中出现次数最多的那个数据;平均数是一组数据中表示平均每份的数量。 二、.中位数的概念。 一组数据按大小顺序排列,位于最中间的一个数据(当有偶数个数据时,为最中间两个数据的平均数)叫做这组数据的中位数。 三 .众数、中位数及平均数的求法。 ①众数由所给数据可直接求出;②求中位数时,首先要先排序(从小到大或从大到小),然后根据数据的个数,当数据为奇数个时,最中间的一个数就是中位数;当数据为偶数个时,最中间两个数的平均数就是中位数。③求平均数时,就用各数据的总和除以数据的个数,得数就是这组数据的平均数。 四、中位数与众数的特点。 ⑴中位数是一组数据中唯一的,可能是这组数据中的数据,也可能不是这组数据中的数据; ⑵求中位数时,先将数据有小到大顺序排列,若这组数据是奇数个,则中间的数据是中位数;若这组数据是偶数个时,则中间的两个数据的平均数是中位数; ⑶中位数的单位与数据的单位相同; ⑷众数考察的是一组数据中出现的频数; ⑸众数的大小只与这组数的个别数据有关,它一定是一组数据中的某个数据,其单位与数据的单位相同; (6)众数可能是一个或多个甚至没有; (7)平均数、众数和中位数都是描述一组数据集中趋势的量。

高中数学统计与统计案例概率知识点上课讲义

高中数学统计与统计案例概率知识点

统计与统计案例概率(文科) 知识点 1.抽样调查 (1)抽样调查 通常情况下,从调查对象中按照一定的方法抽取一部分,进行______,获取数据,并以此对调查对象的某项指标作出______,这就是抽样调查. (2)总体和样本 调查对象的称为总______体,被抽取的称为样______本. (3)抽样调查与普查相比有很多优点,最突出的有两点: ①______ ②节约人力、物力和财力. 2.简单随机抽样 (1)简单随机抽样时,要保证每个个体被抽到的概率. (2)通常采用的简单随机抽样的方法:_____ 3.分层抽样 (1)定义:将总体按其属性特征分成若干类型(有时称作层),然后在每个类型中按照所占比例随机抽取一定的样本.这种抽样方法通常叫作分层抽样,有时也称为类型抽样. (2)分层抽样的应用范围: 当总体是由差异明显的几个部分组成时,往往选用分层抽样. 4.系统抽样 系统抽样是将总体中的个体进行编号,等距分组,在第一组中按照简单随机抽样抽取第一个样本,然后按______(称为抽样距)抽取其他样本.这种抽样方法有时也叫等距抽样或机

械抽样. 5.统计图表 统计图表是______数据的重要工具,常用的统计图表有______ 6.数据的数字特征 (1)众数、中位数、平均数 众数:在一组数据中,出现次数最多的数据叫作这组数据的众数. 中位数:将一组数据按大小依次排列,把处在______位置的一个数据(或最中间两个数据的平均数)叫作这组数据的中位数. 平均数:样本数据的算术平均数,即x =1n (x 1+x 2+…+x n ). 在频率分布直方图中,中位数左边和右边的直方图的面积应该______ (2)样本方差 标准差s = 1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2], 其中x n 是样本数据的第n 项,n 是,______x 是______ 标准差是刻画数据的离散程度的特征数,样本方差是标准差的______.通常用样本方差估计总体方差,当______时,样本方差很接近总体方差. 7.用样本估计总体 (1)通常我们对总体作出的估计一般分成两种,一种是______,另一种______. (2)在频率分布直方图中,纵轴表示,______数据落在各小组内的频率用______表示,各小长方形的面积总和等于.______ (3)在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间.从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,称之为频率折线图. (4)当样本数据较少时,用茎叶图表示数据的效果较好,它没有信息的缺失,而且______,方便表示与比较.

(最全)高中数学概率统计知识点总结

概率与统计 一、普通的众数、平均数、中位数及方差 1、 众数:一组数据中,出现次数最多的数。 2、平均数:①、常规平均数:12n x x x x n ++???+= ②、加权平均数:112212n n n x x x x ωωωωωω++???+=++???+ 3、中位数:从大到小或者从小到大排列,最中间或最中间两个数的平均数。 4、方差:2222121 [()()()]n s x x x x x x n = -+-+???+- 二、频率直方分布图下的频率 1、频率 =小长方形面积:f S y d ==?距;频率=频数/总数 2、频率之和:121n f f f ++???+=;同时 121n S S S ++???+=; 三、频率直方分布图下的众数、平均数、中位数及方差 1、众数:最高小矩形底边的中点。 2、平均数: 112233n n x x f x f x f x f =+++???+ 112233n n x x S x S x S x S =+++???+ 3、中位数:从左到右或者从右到左累加,面积等于0.5时x 的值。 4、方差:22221122()()()n n s x x f x x f x x f =-+-+???+- 四、线性回归直线方程:???y bx a =+ 其中:1 1 2 22 1 1 ()() ?() n n i i i i i i n n i i i i x x y y x y nxy b x x x nx ====---∑∑== --∑∑ , ??a y bx =- 1、线性回归直线方程必过样本中心(,)x y ; 2、?0:b >正相关;?0:b <负相关。 3、线性回归直线方程:???y bx a =+的斜率?b 中,两个公式中分子、分母对应也相等;中间可以推导得到。 五、回归分析 1、残差:??i i i e y y =-(残差=真实值—预报值)。分析:?i e 越小越好; 2、残差平方和:21?()n i i i y y =-∑, 分析:①意义:越小越好; ②计算:222211221 ????()()()()n i i n n i y y y y y y y y =-=-+-+???+-∑ 3、拟合度(相关指数):221 2 1 ?()1() n i i i n i i y y R y y ==-∑=- -∑,分析:①.(]20,1R ∈的常数; ②.越大拟合度越高; 4、相关系数 :()() n n i i i i x x y y x y nx y r ---?∑∑= = 分析:①.[r ∈-的常数; ②.0:r >正相关;0:r <负相关 ③.[0,0.25]r ∈;相关性很弱; (0.25,0.75)r ∈;相关性一般; [0.75,1]r ∈;相关性很强; 六、独立性检验 1、2×2列联表: 2、独立性检验公式 ①.2 2() ()()()() n ad bc k a b c d a c b d -= ++++ ②.犯错误上界P 对照表 3、独立性检验步骤

高考知识点变量间的相关关系与统计案例

第3节变量间的相关关系与统计案例 最新考纲 1.会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系;2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(线性回归方程系数公式不要求记忆);3.了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用;4.了解回归分析的基本思想、方法及其简单应用. 知识梳理 1.相关关系与回归分析 回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法;判断相关性的常用统计图是:散点图;统计量有相关系数与相关指数. (1)在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关. (2)在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关. (3)如果散点图中点的分布从整体上看大致在一条直线附近,称两个变量具有线性相关关系. 2.线性回归方程 (1)最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法. (2)回归方程:两个具有线性相关关系的变量的一组数据:(x1,y1),(x2,y2),…,(x n,y n),其回归方程为y^=b^x+a^,则 ^是回归方程的斜率,a^是在y轴上的截距. 其中,b 回归直线一定过样本点的中心(x,y). 3.回归分析

(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法. (2)样本点的中心:对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其中(x ,y )称为样本点的中心. (3)相关系数 当r >0时,表明两个变量正相关; 当r <0时,表明两个变量负相关. r 的绝对值越接近于1,表明两个变量的线性相关性越强. r 的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r |大于0.75时,认为两个变量有很强的线性相关性. (4)相关指数: 其中21()n i i i y y =-∑是残差平方和,其值越小, 则R 2越大(接近1),模型的拟合效果越好. 4.独立性检验 (1)利用随机变量K 2来判断“两个分类变量有关系”的方法称为独立性检验. (2)列联表:列出的两个分类变量的频数表,称为列联表.假设有两个分类变量X 和Y ,它们的可能取值分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(2×2列联表)为 则随机变量K 2 =n (ad -bc )2 (a +b )(a +c )(b +d )(c +d ),其中n =a +b +c +d 为样 本容量. [常用结论与微点提醒] 1.求解回归方程的关键是确定回归系数a ^,b ^,应充分利用回归直线过样本中心点 (x ,y ). 2.根据K 2的值可以判断两个分类变量有关的可信程度,若K 2越大,则两分类变

高中数学:统计与统计案例练习

高中数学:统计与统计案例练习 A组 一、选择题 1.某校为了解学生平均每周的上网时间(单位:h),从高一年级1 000名学生中随机抽取100名进行了调查,将所得数据整理后,画出频率分布直方图(如图),其中频率分布直方图从左到右前3个小矩形的面积之比为1∶3∶5,据此估计该校高一年级学生中平均每周上网时间少于4 h的学生人数为() A.200 B.240 C.400 D.480 解析:选C设频率分布直方图中从左到右前3个小矩形的面积分别为P,3P,5P.由频率分布直方图可知,最后2个小矩形的面积之和为(0.015+0.035)×2=0.1.因为频率分布直方图中各个小矩形的面积之和为1,所以P+3P+5P=0.9,即P=0.1.所以平均每周上网时间少于4 h的学生所占比例为P+3P=0.4,由此估计学生人数为0.4×1 000=400. 2.AQI(Air Quality Index,空气质量指数)是报告每日空气质量的参数,描述了空气清洁或污染的程度.AQI共分六级,一级优(0~50),二级良(51~100),三级轻度污染(101~150),四级中度污染(151~200),五级重度污染(201~300),六级严重污染(大于300).如图是昆明市2019年4月份随机抽取的10天的AQI茎叶图,利用该样本估计昆明市2020年4月份空气质量优的天数为() A.3 B.4 C.12 D.21

解析:选C从茎叶图知,10天中有4天空气质量为优,所以空气质量为优的频率为4 10= 2 5, 所以估计昆明市2020年4月份空气质量为优的天数为30×2 5=12,故选C. 3.(成都模拟)某城市收集并整理了该市2018年1月份至10月份各月最低气温与最高气温(单位:℃)的数据,绘制了下面的折线图. 已知该城市各月的最低气温与最高气温具有较好的线性关系,则根据折线图,下列结论错误的是() A.最低气温与最高气温为正相关 B.10月的最高气温不低于5月的最高气温 C.月温差(最高气温减最低气温)的最大值出现在1月 D.最低气温低于0 ℃的月份有4个 解析:选D在A中,最低气温与最高气温为正相关,故A正确;在B中,10月的最高气温不低于5月的最高气温,故B正确;在C中,月温差(最高气温减最低气温)的最大值出现在1月,故C正确;在D中,最低气温低于0 ℃的月份有3个,故D错误.故选D. 4.(承德模拟)为了解户籍、性别对生育二胎选择倾向的影响,某地从育龄人群中随机抽取了容量为100的样本,其中城镇户籍与农村户籍各50人;男性60人,女性40人,绘制不同群体中倾向选择生育二胎与倾向选择不生育二胎的人数比例图(如图所示),其中阴影部分表示倾向选择生育二胎的对应比例,则下列叙述中错误的是() A.是否倾向选择生育二胎与户籍有关 B.是否倾向选择生育二胎与性别无关

高考数学二轮复习-统计与统计案例知识点总结

统计与统计案例 1.该部分常考内容:样本数字特征的计算、各种统计图表、线性回归方程、独立性检验等;有时也会在知识交汇点处命题,如概率与统计交汇等. 2.从考查形式上来看,大部分为选择题、填空题,重在考查基础知识、基本技能,有时在知识交汇点处命题,也会出现解答题,都属于中低档题. 1.随机抽样 (1)简单随机抽样特点为从总体中逐个抽取,适用范围:总体中的个体较少. (2)系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取,适用范围:总体中的个体数较多. (3)分层抽样特点是将总体分成几层,分层进行抽取,适用范围:总体由差异明显的几部分组成. 2.常用的统计图表 (1)频率分布直方图 ①小长方形的面积=组距× 频率 组距 =频率; ②各小长方形的面积之和等于1; ③小长方形的高=频率组距,所有小长方形的高的和为1 组距. (2)茎叶图 在样本数据较少时,用茎叶图表示数据的效果较好. 3.用样本的数字特征估计总体的数字特征 (1)众数、中位数、平均数 (2)方差:s 2=n [(x 1-x )2+(x 2-x )2+…+(x n -x )2 ]. 标准差:

s = 1n [ x 1-x 2+ x 2-x 2+…+ x n -x 2 ]. 4.变量的相关性与最小二乘法 (1)相关关系的概念、正相关和负相关、相关系数. (2)最小二乘法:对于给定的一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),通过求Q = i =1 n (y i -a -bx i )2 最小时,得到线性回归方程y ^ =b ^ x +a ^ 的方法叫做最小二乘法. 5.独立性检验 对于取值分别是{x 1,x 2}和{y 1,y 2}的分类变量X 和Y ,其样本频数列联表是: 则K 2 =n a +b c +d a +c b +d (其中n =a +b +c +d 为样本容量). 考点一 抽样方法 例1 (2012·山东)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机 编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C .则抽到的人中,做问卷B 的人数为 ( ) A .7 B .9 C .10 D .15 答案 C 解析 由系统抽样的特点知:抽取号码的间隔为 960 32 =30,抽取的号码依次为9,39,69,…,939.落入区间[451,750]的有459,489,…,729,这些数构成首项为459,公差为30的等差数列,设有n 项,显然有729=459+(n -1)×30,解得n =10.所以做问卷B 的有10人. 在系统抽样的过程中,要注意分段间隔,需要抽取几个个体,样本就需要分 成几个组,则分段间隔即为N n (N 为样本容量),首先确定在第一组中抽取的个体的号码数,再从后面的每组中按规则抽取每个个体.解决此类题目的关键是深刻理解各种抽样方法的特点和适用范围.但无论哪种抽样方法,每一个个体被抽到的概率都是相等的,

高中数学必修三 概率与统计

高中数学必修三:概率与统计 1.要从已编号(1-50)的50枚最新研制的某型号导弹中随机抽取5枚来进行发射试验,用每部分选取的号码间隔一样的系统抽样方法确定所选取的5枚导弹的编号可能是( ). A.5,10,15,20,25B.3,13,23,33,43C.1,2,3,4,5D.2,4,8,16,32 2.从鱼塘捕得同一时间放养的草鱼240尾,从中任选9尾,称得每尾鱼的质量分别是1.5,1.6,1.4,1.6,1.3,1.4,1.2,1.7,1.8(单位:千克).依此估计这240尾鱼的总质量大约是( ).A.300克B.360千克C.36千克D.30千克 3.以下茎叶图记录了甲.乙两组各五名学生在一次英语听力测试中的成绩(单位:分) 已知甲组数据的中位数为15,乙组数据的平均数为16.8,则,x y的值分别为()A.2,5B.5,5C.5,8D.8,8 4.为了考查两个变量x和y之间的线性关系,甲、乙两位同学各自独立作了10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1,l2,已知两人得的试验数据中,变量x和y的数据的平均值都分别相等,且值分别为s与t,那么下列说法正确的是( ). A.直线l1和l2一定有公共点(s,t)B.直线l1和l2相交,但交点不一定是(s,t) C.必有直线l1∥l2 D.直线l1和l2必定重合 5..设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(x i,y i)(i=1,2,…,n),用最小二乘法建立的回归方程为$y=0.85x-85.71,则下列结论中不正确的是( ).A.y与x具有正的线性相关关系B.回归直线过样本点的中心(x,y)C.若该大学某女生身高增加1cm,则其体重约增加0.85kgD.若该大学某女生身高为170cm,则可断定其体重比为58.79kg

高中数学选修1-2《统计案例》知识点讲义教学内容

第一章统计案例一、回归分析的基本思想及其初步应用 1、数学变量相关关系 的定义:当一个或几个相互联系的变量取一定的数值时,与之相对应的另一变量的值虽然不 确定,但它仍按某种规律在一定的范围内变化。变量间的这种相互关系,称为具有不确定性的相关关系. (1)按方向分类 ①正相关:两个变量的变化趋势相同,从散点图可以看出各点散布的位置是从左下角到右上角的区域,即一个变量的值由小变大时,另一个变量的值也由小变大。 ②负相关:两个变量的变化趋势相反,从散点图可以看出各点散布的位置是从左上角到右下角的区域,即一个变量的值由小变大时,另一个变量的值由大变小。 正相关负相关不相关 (2)相关性系数r(在《必修3》中有介绍) 用相关系数r来衡量两个变量之间的相关关系 ()() ()() 1 22 11 n i i i n n i i i i x x y y r x x y y = == -- = -- ∑ ∑∑

2、两变量之间的关系存在两种不同的类型 (1)相关关系——非确定性关系 (2)函数关系——确定性关系 3、回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法。 其基本步骤是:①画出两个变量的散点图; ②求回归直线方程; ③并用回归直线方程进行预报。 4、回归直线方程:∧ ∧∧+=a x b y ?? ?? ????? -=--=---=∧∧====∧∑∑∑∑x b y a x n x y x n y x x x y y x x b n i i n i i i n i i n i i i ,)())((1 221121 ()()()10.00,2,. b b r x y ≠==说明:回归系数因为当时,相关系数这时不具有线性相关关系. 称为样本点的中心,回归直线必定经过样本点的中心

高中数学概率与统计测试题

概率与统计 1.如果一个整数为偶数的 概率为 (1)a+b 为偶数的概率; (2)a+b+c 为偶数的概率。 0.6 ,且 a,b,c 均为整数,求 2.从 10 位同学 (其中 6 女,4 男)中随机选出 3 位参加测验,每位女同学能通过测验的概率 43 均为,每位男同学能通过测验的概率均为,求55 (1)选出的 3 位同学中,至少有一位男同学的概率; (2)10 位同学中的女同学甲和男同学乙同时被选中且通过测验的概率。 3.袋中有 6 个白球, 4 个红球,甲首先从中取出 3 个球,乙再从余下的 7 个球中取出 4 个球,凡取得红球多者获胜。试求 (1)甲获胜的概率; (2)甲,乙成平局的概率。 4.箱子中放着 3 个 1 元硬币, 3 个 5 角硬币, 4 个 1 角硬币,从中任取 3 个,求总钱数超过 1 元 8 角的概率。 5.有 10 张卡片,其号码分别位 1,2,3?,10,从中任取 3 张。 (1)求恰有 1 张的号码为 3 的倍数的概率; (2)记号码为 3 的倍数的卡片张数为ξ,求ξ的数学期望。 6.某种电子玩具按下按钮后,会出现白球或绿球,已知按钮第一次按下后,出现红球与绿球 1 的概率都是,从按钮第二次按下起,若前次出现红球,则下次出现红球、绿球的概率2 1 2 3 2 分别为, ;若前次出现绿球,则下次出现红球、绿球的概率分别为, ,记第 n(n ∈ 3 3 5 5 N,n ≥1) 次按下后,出现红球的概率为P n

(1)求P2的值; (2)当 n∈N,n ≥2 时,求用P n 1表示P n的表达式; (3)求P n关于 n 的表达式。 7.有甲、乙两个盒子 ,甲盒子中有 8 张卡片 ,其中两张写有数字 0,三张写有数字 1 ,三张写有数字 2 ;乙盒子中有 8 张卡片,其中三张写有数字 0,两张写有数字1,三张写有数字 2 , (1) 如果从甲盒子中取两张卡片,从乙盒子中取一张卡片,那么取出的 3 张卡片都写有 1 的概率是多少? (2)如果从甲、乙盒子中各取一张卡片,设取出的两张卡片数字之和为ξ,求ξ的分布列和期望。 8.甲、乙两位同学做摸球游戏,游戏规则规定:两人轮流从一个放有 1 个白球, 3 个黑球, 2 个红球且只有颜色不同的 6 个小球的暗箱中取球,每次每人只取一球,每取出一个后立即放回,另一个人接着取,取出后也立即放回,谁先取到红球,谁为胜者,现甲先取 (1) 求甲摸球次数不超过三次就获胜的概率; (2) 求甲获胜的概率。 9.设有均由 A,B,C 三个部件构成的两种型号产品甲和乙,当A或 B 是合格品并且 C 是合格 品时,甲是正品;当 A, B 都是合格品或者 C 是合格品时,乙是正品。若 A 、 B、C 合格的概率均是 P,这里 A ,B,C 合格性是互相独立的。 (1) 产品甲为正品的概率P1是多少? (2)产品乙为正品的概率P2 是多少? (3)试比较P1与P2的大小。 10.一种电路控制器在出厂时每四件一等品装成一箱,工人在装箱时不小心把两件二等品和两件一等品装入了一箱,为了找出该箱的二等品,我们对该箱中的产品逐一取出进行测试。 (1) 求前二次取出的都是二等品的概率; (2) 求第二次取出的是二等品的概率; (3)用随机变量ξ表示第二个二等品被取出时共取的件数,求ξ的分布列及数学

(完整版)数学知识点--考点14--统计与统计案例

极差 组数、组距 分组 列表 咼频率/组距 面积=频率= 频数 样本容量 小矩形面积和=1 统计与统计案例 1. 统计的基本思想是用部份来估计总体。 2. 统计中所考察的对象的全体构成的集合看做总体, 构成总体的每个元素作为个体,从总 体中抽取的一部份个体所组成的集合叫做样本,样本中个体的数目叫做样本容量。 一、抽样方法 2.图形特征 1) 茎叶图 2) 直方图 、用样本估计总体 1.数字特征 注意: 2 2 i am b ,贝U i 的平均数为ax b ,方差为a s

3)条形图与直方图的区别:直方图中矩形通常连续排列,条形图则是分开排开; 直方图是用面积表示各 组频率的多少, 高表示每一组的频率除以组距, 组距,条形图的高表示频数的多少,其宽是固定的,表示类别。 三、变量间的相关关系 确定关系:函数关系 2.样本相关系数r : r 0.75时,认为两个变量有很强的线性相关关系。 3. 最小二乘法:使得样本数据的点到回归直线的距离平方和最小的方法。 过样本中心X, y 2 2 6. 相关指数R : R 的值越大,说明残差平方和越小,即模型的拟合效果起好。 回归效果越好。 7. 回归方程:只适用于研究的样本的总体;具有时间性;样本的取值范围会影响总 体的范围;预报值与精 确值往往不一样。 8. 步骤 宽表示 关系 非确定:相关关系 回归分析 散点图 回归曲线 回归直线 y $x $b X i y i i 1 nxy -2 x y i y X i nx 5.随机误差 e y bX i a 估计值 残差 y i bX i $ 残差分析 形:残差图 数:R 2 0,1 线性回归模型中, R 2表示解释变量对预报变量的贡献率, R 2越接近于 1,表示

高中数学选修1-2《统计案例》知识点讲义汇编

第一章 统计案例 一、回归分析的基本思想及其初步应用 1、数学变量相关关系的定义:当一个或几个相互联系的变量取一定的数值时,与之相对应的另一变量的值虽然不确定,但它仍按某种规律在一定的范围内变化。变量间的这种相互关系,称为具有不确定性的相关关系. (1)按方向分类 ①正相关:两个变量的变化趋势相同,从散点图可以看出各点散布的位置是从左下角到右上角的区域,即一个变量的值由小变大时,另一个变量的值也由小变大。 ②负相关:两个变量的变化趋势相反,从散点图可以看出各点散布的位置是从左上角到右下角的区域,即一个变量的值由小变大时,另一个变量的值由大变小。 正相关 负相关 不相关 (2)相关性系数r (在《必修3》中有介绍) 用相关系数r 来衡量两个变量之间的相关关系 ()() ()() 1 2 2 1 1 n i i i n n i i i i x x y y r x x y y ===--= --∑∑∑

2、两变量之间的关系存在两种不同的类型 (1)相关关系——非确定性关系 (2)函数关系——确定性关系 3、回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法。 其基本步骤是:①画出两个变量的散点图; ②求回归直线方程; ③并用回归直线方程进行预报。 4、回归直线方程:∧ ∧∧+=a x b y ?? ?? ????? -=--=---=∧∧====∧∑∑∑∑x b y a x n x y x n y x x x y y x x b n i i n i i i n i i n i i i ,)())((1 221121 ()()()10.00,2,. b b r x y ≠==说明:回归系数因为当时,相关系数这时不具有线性相关关系. 称为样本点的中心,回归直线必定经过样本点的中心

相关文档
最新文档