2019高中数学专题复习统计、统计案例

2019高中数学专题复习统计、统计案例
2019高中数学专题复习统计、统计案例

(十八) 统计、统计案例(注意命题点的区分度)

一、选择题

1.(2017·福州质检)在检测一批相同规格共500 kg 航空用耐热垫片的品质时,随机抽取了280片,检测到有5片非优质品,则这批航空用耐热垫片中非优质品约为( )

A .2.8 kg

B .8.9 kg

C .10 kg

D .28 kg

解析:选B 由题意可知,抽到非优质品的概率为5

280,所以这批航空用耐热垫片中非

优质品约为500×5280=125

14

≈8.9 kg.

2.(2017·全国卷Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.

根据该折线图,下列结论错误的是( ) A .月接待游客量逐月增加 B .年接待游客量逐年增加

C .各年的月接待游客量高峰期大致在7,8月

D .各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳 解析:选A 根据折线图可知,2014年8月到9月、2014年10月到11月等月接待游客量都在减少,所以A 错误.由图可知,B 、C 、D 正确.

3.一次数学考试后,某老师从自己所带的两个班级中各抽取5人,记

录他们的考试成绩,得到如图所示的茎叶图.已知甲班5名同学成绩的平均数为81,乙班5名同学成绩的中位数为73,则x -y 的值为( )

A .2

B .-2

C .3

D .-3

解析:选D 由题意得,72+77+80+x +86+905=81,解得x =0,易知y =3,∴x -y

=-3.

4.采用系统抽样方法从 1 000人中抽取50人做问卷调查,为此将他们随机编号为1,2,…,1 000,适当分组后在第一组采用简单随机抽样的方法抽到的号码为8.抽到的50人中,编号落入区间[1,400]的人做问卷A ,编号落入区间[401,750]的人做问卷B ,其余的

人做问卷C ,则抽到的人中,做问卷C 的人数为( )

A .12

B .13

C .14

D .15

解析:选A 由题意组距为1 000

50=20,故抽到的号码构成以8为首项,以20为公差的

等差数列,且此等差数列的通项公式为a n =8+(n -1)×20=20n -12.由751≤20n -12≤1 000,解得38.15≤n ≤50.6.再由n ∈N *

,可得39≤n ≤50,故做问卷C 的人数为50-39+1=12.

5.已知x ,y 的取值如下表所示:

若y 与x 呈线性相关,且线性回归方程为y ^=b ^x +2,则b ^

=( )

A.12 B .-12 C .2 D .-2

解析:选B 由表中数据得x =3,y =5,线性回归方程一定过样本中心点(x ,y ),所以5=3b ^+132,解得b ^

=-12

.

6.(2017·广州模拟)为了了解某校高三美术生的身体状况,抽查了部分美术生的体重,将所得数据整理后,作出了如图所示的频率分布直方图.已知图中从左到右的前3个小组的频率之比为1∶3∶5,第2个小组的频数为15,则被抽查的美术生的人数是( )

A .35

B .48

C .60

D .75

解析:选C 设被抽查的美术生的人数为n ,因为后2个小组的频率之和为(0.037 5+0.012 5)×5=0.25,所以前3个小组的频率之和为0.75.又前3个小组的频率之比为1∶3∶5,第2个小组的频数为15,所以前3个小组的频数分别为5,15,25,所以n =5+15+25

0.75=

60.

7.为了研究高中学生对乡村音乐的态度(喜欢和不喜欢两种态度)与性别的关系,运用

2×2列联表进行独立性检验,计算得K 2

的观测值k =8.01,若推断“喜欢乡村音乐与性别有关系”,则这种推断犯错误的概率不超过( )

A .0.01

B .0.025

C .0.005

D .0.001

解析:选C 由K 2

的观测值k =8.01,观测值同临界值进行比较可知,这种推断犯错误的概率不超过0.005.

8.在某次测量中得到的A 样本数据如下:42,43,46,52,42,50,若B 样本数据恰好是A 样本数据每个都减5后所得数据,则A ,B 两样本的下列数字特征对应相同的是( )

A .平均数

B .标准差

C .众数

D .中位数

解析:选B A 样本数据的平均数x =275

6,B 样本数据的平均数x ′=x -5.A 样本

数据的方差s 2=16[(42-x )2+(43-x )2+…+(50-x )2],B 样本数据的方差s ′2

16[(42-x )2

+(43-x )2

+…+(50-x )2

],所以A ,B 两样本的标准差相同.

9.某同学将全班某次数学考试成绩整理成频率分布直方图后,并将每个小矩形上方线段的中点连接起来得到频率分布折线图(如图所示).据此估计此次考试成绩的众数是( )

A .100

B .110

C .115

D .120

解析:选C 众数是一组数据中出现次数最多的数,结合题中频率分布折线图可以看出,数据“115”对应的纵坐标最大,所以相应的频率最大,频数最大,据此估计此次考试成绩的众数是115.

10.以模型y =c e kx

去拟合一组数据时,为了求出回归方程,设z =ln y ,其变换后得到线性回归方程z =0.3x +4,则c =( )

A .0.3

B .e 0.3

C .4

D .e 4

解析:选D 因为z =ln y =ln(c e kx

)=ln c +kx ,又z =0.3x +4,所以ln c =4,c =e 4

.

11.在样本的频率分布直方图中,共有4个小长方形,这4个小长方形的面积由小到大依次构成等比数列{a n },已知a 2=2a 1,且样本容量为300,则对应小长方形面积最小的一组的频数为( )

A .20

B .40

C .30

D .无法确定

解析:选A 在等比数列{a n }中,a 2=2a 1,则q =2,由题意S 4=a 11-24

1-2

=15a 1=1,

a 1=115

,即小长方形面积最小的一组的面积为115

,所以频数为300×115

=20,故选A.

12.为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据.已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为( )

A .9

B .10

C .11

D .12

解析:选B 不妨设样本数据为x 1,x 2,x 3,x 4,x 5,且x 1

+(x 2-7)2

+(x 3-7)2

+(x 4-7)2

+(x 5-7)2

=20.若5个整数的平方和为20,则这5个整数的平方只能在0,1,4,9,16中选取(每个数最多出现2次),当这5个整数的平方中最大的数为16时,分析可知,总不满足和为20;当这5个整数的平方中最大的数为9时,0,1,1,9,9这组数满足要求,此时对应的样本数据为x 1=4,x 2=6,x 3=7,x 4=8,x 5=10;当这5个整数的平方中最大的数不超过4时,总不满足和为20,因此不存在满足条件的另一组数据.故选B.

二、填空题

13.具有线性相关关系的变量x ,y 满足如下表所示的一组数据.若y 与x 的线性回归方程为y ^

=3x -32

,则m 的值是________.

解析:由已知得x =14×(0+1+2+3)=2,y =4×(-1+1+m +8)=m

4

+2,又点(x ,

y )在线性回归直线上,所以m 4

+2=3×32-3

2

,解得m =4.

答案:4

14.(2017·江苏高考)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取________件.

解析:应从丙种型号的产品中抽取 60×300

200+400+300+100=18(件).

答案:18

15.从某居民区随机抽取10个家庭,获得第i 个家庭的月收入x i (单位:千元)与月储

蓄y i (单位:千元)的数据资料,计算得∑i =1

10

x i =80,∑i =1

10

y i =20,∑i =1

10

x i y i =184,∑i =1

10

x 2

i =720.已知

家庭的月储蓄y 关于月收入x 的线性回归方程为y ^=b ^x +a ^

,则变量x 与y ________(填“正相关”或“负相关”);若该居民区某家庭月收入为7千元,预测该家庭的月储蓄是________千元.

解析:由题意知n =10,x =110∑i =110x i =8,y =110∑i =110y i =2,∴b ^=184-10×8×2

720-10×82=0.3,

a ^

=2-0.3×8=-0.4,

∴y ^

=0.3x -0.4,∵0.3>0,∴变量x 与y 正相关. 当x =7时,y ^

=0.3×7-0.4=1.7(千元). 答案:正相关 1.7

16.(2017·石家庄质检)设样本数据x 1,x 2,…,x 2 017的方差是4,若y i =2x i -1(i =1,2,…,2 017),则y 1,y 2,…,y 2 017的方差为________.

解析:设样本数据的平均数为x , 则y i =2x i -1的平均数为2x -1,

则y 1,y 2,…,y 2 017的方差为12 017

[(2x 1-1-2x +1)2+(2x 2-1-2x +1)2

+…+(2x 2

017

-1-2x +1)2

]=4×12 017

[(x 1-x )2+(x 2-x )2+…+(x 2 017-x )2

]=4×4=16. 答案:16 三、解答题

17.对甲、乙两名自行车赛手在相同条件下进行了6次测试,测得他们的最大速度(m/s)的数据如下表.

(1)画出茎叶图,由茎叶图判断哪位选手的成绩较稳定;

(2)分别求出甲、乙两名自行车赛手最大速度(m/s)数据的平均数、中位数、标准差,并判断选谁参加比赛更合适.

解:(1)茎叶图如图所示:

由茎叶图可知,乙的成绩较稳定.

(2)因为v 甲=1

6

(27+38+30+37+35+31)=33,

v 乙=16

(33+29+38+34+28+36)=33.

甲的中位数:33,乙的中位数:33.5.

s 2甲=1

6[]-62

+52

-3

2

+42+22

+-2

2

473

, s 2乙=

16

[]02+-42

+52

+12

-5

2

+32

383

, 故s 甲=

1413,s 乙=114

3

, 所以选乙参赛更合适.

18.某校拟在高一年级开设英语口语选修课,该年级男生600人,女生480人.按性别分层抽样,抽取90名同学做意向调查.

(1)求抽取的90名同学中的男生人数;

(2)将下列2×2列联表补充完整,并判断能否在犯错误的概率不超过0.025的前提下认为“该校高一学生是否愿意选修英语口语课程与性别有关”?

附:K 2

n ad -bc 2a +b

c +

d a +c

b +d

,其中n =a +b +c +d .

解:(1)该校高一年级的男、女生之比为600∶480=5∶4,所以按照分层抽样,男生应抽取50名.

(2)2×2列联表如下:

由K 2

=n ad -bc 2a +b

c +

d a +c

b +d

,代入数据得

K 2

90×

25×10-25×30

2

50×40×55×35

450

77

≈5.844>5.024. 所以在犯错误的概率不超过0.025的前提下可以认为“该校高一学生是否愿意选修英语口语课程与性别有关”.

19.(2017·北京高考)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如下频率分布直方图:

(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;

(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数; (3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.

解:(1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6,

所以样本中分数小于70的频率为1-0.6=0.4.

所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计值为0.4. (2)根据题意,样本中分数不小于50的频率为 (0.01+0.02+0.04+0.02)×10=0.9, 故样本中分数小于50的频率为0.1,

故分数在区间[40,50)内的人数为100×0.1-5=5. 所以总体中分数在区间[40,50)内的人数估计为 400×

5

100

=20. (3)由题意可知,样本中分数不小于70的学生人数为 (0.02+0.04)×10×100=60,

所以样本中分数不小于70的男生人数为60×1

2=30.

所以样本中的男生人数为30×2=60, 女生人数为100-60=40,

男生和女生人数的比例为60∶40=3∶2.

所以根据分层抽样原理,总体中男生和女生人数的比例估计为3∶2.

20.下表是高三某位文科生连续5次月考的历史、政治的成绩,结果统计如下:

(1)求该生5次月考历史成绩的平均分和政治成绩的方差;

(2)一般来说,学生的历史成绩与政治成绩有较强的线性相关关系,根据上表提供的数据,求两个变量x ,y 的线性回归方程y ^ =b ^x +a ^

.

(附:b ^

∑i =1

n

x i -x

y i -y

∑i =1

n

x i -x

2

∑i =1

n

x i y i -n x y

∑i =1

n

x 2i -n x

2

,a ^=y -b ^

x )

解:(1)x =1

5×(79+81+83+85+87)=83,

∵y =1

5

×(77+79+79+82+83)=80,

∴s 2y =15

× [(77-80)2+(79-80)2+(79-80)2+(82-80)2+(83-80)2

]=4.8.

(2)由(1)知x =83,y =80,

则∑i =1

5

(x i -x )(y i -y )=(-4)×(-3)+(-2)×(-1)+0×(-1)+2×2+4×3=

30,

∑i =1

5

(x i -x )2=(-4)2+(-2)2+02+22+42=40,

∴b ^=3040=0.75,a ^

=80-0.75×83=17.75.

故所求的线性回归方程为y ^

=0.75x +17.75.

高三数学概率统计知识点归纳

高三数学概率统计知识 点归纳 内部编号:(YUUT-TBBY-MMUT-URRUY-UOOY-DBUYI-0128)

概率统计知识点归纳 平均数、众数和中位数 平均数、众数和中位数.要描述一组数据的集中趋势,最重要也是最常见的方法就是用这“三数”来说明. 一、正确理解平均数、众数和中位数的概念 平均数平均数是反映一组数据的平均水平的特征数,反映一组数据的集中趋势.平均数的大小与一组数据里的每一个数据都有关系,任何一个数据的变化都会引起平均数的变化. 2.众数在一组数据中出现次数最多的数据叫做这一组数据的众数.一组数据中的众数有时不唯一.众数着眼于对各数出现的次数的考察,这就告诉我们在求一组数据的众数时,既不需要排列,又不需要计算,只要能找出样本中出现次数最多的那一个(或几个)数据就可以了.当一组数据中有数据多次重复出现时,它的众数也就是我们所要关心的一种集中趋势. 3.中位数中位数就是将一组数据按大小顺序排列后,处在最中间的一个数(或处在最中间的两个数的平均数).一组数据中的中位数是唯一的. 二、注意区别平均数、众数和中位数三者之间的关系 平均数、众数和中位数都是描述一组数据的集中趋势的量,但它们描述的角度和适用的范围又不尽相同.在具体问题中采用哪种量来描述一组数据的集中趋势,那得看数据的特点和要关注的问题. 三、能正确选用平均数、众数和中位数来解决实际问题 由于平均数、众数和中位数都是描述一组数据的集中趋势的量,所以利用平均数、众数和中位数可以来解决现实生活中的问题.

极差、方差、标准差 极差、方差和标准差都是用来研究一组数据的离散程度的,反映一组数据的波动范围或波动大小的量. 极差 一组数据中最大值与最小值的差叫做这组数据的极差,即极差=最大值-最小值.极差能够反映数据的变化范围,差是最简单的一种度量数据波动情况的量,它受极端值的影响较大. 二、方差 方差是反映一组数据的整体波动大小的特征的量.它是指一组数据中各个数据与这组数据的平均数的差的平方的平均数,它反映的是一组数据偏离平均值的情况.方差越大,数据的波动越大;方差越小,数据的波动越小. 求一组数据的方差可以简记先求平均,再求差,然后平方,最后求平均数.一组数据x1、x2、x3、…、xn 的平均数为x ,则该组数据方差的计算公式为: ])()()[(1222212x x x x x x n S n -++-+-= . 三、标准差 在计算方差的过程中,可以看出方差的数量单位与原数据的单位不一致,在实际的应用时常常将求出的方差再开平方,此时得到量为这组数据的标准差. 即标准差=方差. 四、极差、方差、标准差的关系 方差和标准差都是用来描述一组数据波动情况的量,常用来比较两组数据的波动大小.两组数据中极差大的那一组并不一定方差也大.在实际问题中有时用到标准差,是因为标准差的单位和原数据的单位一致,且能缓解方差过大或过小的现象.

高中数学统计与概率知识点(原稿)

高中数学统计与概率知识点(文) 第一部分:统计 一、什么是众数。 一组数据中出现次数最多的那个数据,叫做这组数据的众数。 众数的特点。 ①众数在一组数据中出现的次数最多;②众数反映了一组数据的集中趋势,当众数出现的次数越多,它就越能代表这组数据的整体状况,并且它能比较直观地了解到一组数据的大致情况。但是,当一组数据大小不同,差异又很大时,就很难判断众数的准确值了。此外,当一组数据的那个众数出现的次数不具明显优势时,用它来反映一组数据的典型水平是不大可靠的。 3.众数与平均数的区别。 众数表示一组数据中出现次数最多的那个数据;平均数是一组数据中表示平均每份的数量。 二、.中位数的概念。 一组数据按大小顺序排列,位于最中间的一个数据(当有偶数个数据时,为最中间两个数据的平均数)叫做这组数据的中位数。 三 .众数、中位数及平均数的求法。 ①众数由所给数据可直接求出;②求中位数时,首先要先排序(从小到大或从大到小),然后根据数据的个数,当数据为奇数个时,最中间的一个数就是中位数;当数据为偶数个时,最中间两个数的平均数就是中位数。③求平均数时,就用各数据的总和除以数据的个数,得数就是这组数据的平均数。 四、中位数与众数的特点。 ⑴中位数是一组数据中唯一的,可能是这组数据中的数据,也可能不是这组数据中的数据; ⑵求中位数时,先将数据有小到大顺序排列,若这组数据是奇数个,则中间的数据是中位数;若这组数据是偶数个时,则中间的两个数据的平均数是中位数; ⑶中位数的单位与数据的单位相同; ⑷众数考察的是一组数据中出现的频数; ⑸众数的大小只与这组数的个别数据有关,它一定是一组数据中的某个数据,其单位与数据的单位相同; (6)众数可能是一个或多个甚至没有; (7)平均数、众数和中位数都是描述一组数据集中趋势的量。

2019年高考数学理科全国三卷

2019年高考数学理科 全国三卷 -CAL-FENGHAI-(2020YEAR-YICAI)_JINGBIAN

2019年普通高等学校招生全国统一考试 理科数学(全国三卷) 一、选择题:(本题共12小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的。) 1.已知集合{}1,0,1,2A =-,{} 2|1B x x =≤,则A B =() A. {1,0,1}- B.{0,1} C.{1,1}- D. {0,1,2} 2.若(1)2z i i +=,则z =() A. 1i -- B. 1i -+ C. 1i - D. 1i + 3.《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著,某中学为了解本校学生阅读四大名著的情况,随机调查了100名学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为() A. 0.5 B. 0.6 C. 0.7 D. 0.8 4.24(12)(1)x x ++的展开式中x 3的系数为() A. 12 B. 16 C. 20 D. 24 5.已知各项均为正数的等比数列{a n }的前4项和为15,且a 5=3a 3+4a 1,则a 3=() A. 16 B. 8 C. 4 D. 2 6.已知曲线ln x y ae x x =+在(1,)ae 处的切线方程为y =2x +b ,则() A.,1a e b ==- B.,1a e b == C.1,1a e b -== D.1,1a e b -==- 7.函数3 222 x x x y -=+在[6,6]-的图像大致为() A. B. C. D.

高中数学专题――概率统计专题.

专题二概率统计专题 【命题趋向】概率与统计是高中数学的重要学习内容,它是一种处理或然问题的方法,在工农业生产和社会生活中有着广泛的应用,渗透到社会的方方面面,概率与统计的基础知识成为每个公民的必备常识.概率与统计的引入,拓广了应用问题取材的范围,概率的计算、离散型随机变量的分布列和数学期望的计算及应用都是考查应用意识的良好素材.在高考试卷中,概率与统计的内容每年都有所涉及,以解答题形式出现的试题常常设计成包含离散型随机变量的分布列与期望、统计图表的识别等知识为主的综合题,以考生比较熟悉的实际应用问题为载体,以排列组合和概率统计等基础知识为工具,考查对概率事件的识别及概率计算.解答概率统计试题时要注意分类与整合、化归与转化、或然与必然思想的运用.由于中学数学中所学习的概率与统计内容是最基础的,高考对这一部分内容的考查注重考查基础知识和基本方法.该部分在高考试卷中,一般是2—3个小题和一个解答题. 【考点透析】概率统计的考点主要有:概率与统计包括随机事件,等可能性事件的概率,互斥事件有一个发生的概率,古典概型,几何概型,条件概率,独立重复试验与二项分布,超几何分布,离散型随机变量的分布列,离散型随机变量的期望和方差,抽样方法,总体分布的估计,正态分布,线性回归等.【例题解析】 题型1 抽样方法 -)中,在公证部门监督下按照随机抽取的方法确【例1】在1000个有机会中奖的号码(编号为000999 定后两位数为的号码为中奖号码,该抽样运用的抽样方法是() A.简单随机抽样B.系统抽样C.分层抽样D.以上均不对 分析:实际“间隔距离相等”的抽取,属于系统抽样. 解析:题中运用了系统抽样的方法采确定中奖号码,中奖号码依次为:088,188,288,388,488,588,688,788,888,988.答案B. 点评:关于系统抽样要注意如下几个问题:(1)系统抽样是将总体分成均衡几个部分,然按照预先定出的规则从每一部分抽取一个个体,得到所需要的样本的一种抽样方法.(2)系统抽样的步骤:①将总体中的个体随机编号;②将编号分段;③在第一段中用简单随机抽样确定起始的个体编号;④按事先研究的规则抽取样本.(3)适用范围:个体数较多的总体. 例2(2008年高考广东卷理3)某校共有学生2000名,各年级男、女生人数如表.已知在全校学生中随机抽取1名,抽到二年级女生的概率是0.19.现用分层抽样的方法在全校抽取64名学生,则应在三年级抽取的学生人数为() A.24B.18C.16D.12 Array 分析:根据给出的概率先求出x的值,这样就可以知道三年级的学生人数,问题就解决了. x=?=,这样一年级和二年级学生的解析:C 二年级女生占全校学生总数的19%,即20000.19380 +++=,三年级学生有500人,用分层抽样抽取的三年级学生应是总数是3733773803701500 64 50016 ?=.答案C. 2000 点评:本题考查概率统计最基础的知识,还涉及到一点分析问题的能力和运算能力,题目以抽样的等可能性为出发点考查随机抽样和分层抽样的知识. 例3.(2009江苏泰州期末第2题)一个社会调查机构就某地居民的月收入调查了10000人,并根据所得数据画了样本的频率分布直方图(如下图).为了分析居民的收入与年龄、学历、职业等方面的关系, 2500,3500(元)月收入段应抽要从这10000人中再用分层抽样方法抽出100人作进一步调查,则在[) 出人.

高中数学概率统计专题

高中数学概率统计专题文档编制序号:[KKIDT-LLE0828-LLETD298-POI08]

高三文科数学:概率与统计专题 一、选择题: 1.为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,x n,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是 A.x1,x2,…,x n的平均数B.x1,x2,…,x n的标准差C.x1,x2,…,x n的最大值D.x1,x2,…,x n的中位数2.有3个兴趣小组,甲、乙两位同学各自参加其中一个小组,每位同学参加各个小组的可能性相同,则这两位同学参加同一个兴趣小组的概率为 A.1 3 B. 1 2 C. 2 3 D. 3 4 3、在一组样本数据(x1,y1),(x2,y2),…,(x n,y n)(n≥2,x1,x2,…,x n不全相 等)的散点图中,若所有样本点(x i,y i)(i=1,2,…,n)都在直线y=1 2x+1上,则这组样本 数据的样本相关系数为 (A)-1 (B)0 (C)1 2(D)1 4.如果3个整数可作为一个直角三角形三条边的边长,则称这3个数为一组勾股数,从1,2,3,4,5中任取3个不同的数,则3个数构成一组勾股数的概率为 (A)10 3 (B) 1 5 (C) 1 10 (D) 1 20 5.如图,正方形ABCD内的图形来自中国古代的太极图.正方形内切圆中的黑色部分和白色部分关于正方形的中心成中心对称.在正方形内随机取一点,学科&网则此点取自黑色部分的概率是 A.1 4B. π 8 C.1 2 D.π4

6.如图所示的茎叶图表示的是甲、乙两人在5次综合测评中的成绩,其中一个数字被污损,则甲的平均成绩超过乙的平均成绩的概率是( ) 二、填空题: 7、从1,2,3,4,5中任意取出两个不同的数,其和为5的概率是_______。 8、将2本不同的数学书和1本语文书在书架上随机排成一行,则2本数学书相邻的概率为_____. 9.某单位为了了解用电量y (度)与气温x (℃)之间的关系,随机统计了某4天的用电量与当天气温,制作了对照表: 方程y ^=b ^x +a ^由表中数据得回归直线 中的b ^=-2,预测当气温为-4 ℃时,用电量约为________度. 三、解答题 10.某花店每天以每枝5元的价格从农场购进若干枝玫瑰花,然后以每枝10元的价格出售。如果当天卖不完,剩下的玫瑰花做垃圾处理。 (Ⅰ)若花店一天购进17枝玫瑰花,求当天的利润y (单位:元)关于当天需求量n (单位:枝,n ∈N )的函数解析式。 (Ⅱ)花店记录了100天玫瑰花的日需求量(单位:枝),整理得下表: 日需求量 n 14 15 16 17 18 19 20 频数 10 20 16 16 15 13 10 (1)假设花店在这100天内每天购进17枝玫瑰花,求这100天的日利润(单位:元)的平均数; (2)若花店一天购进17枝玫瑰花,以100天记录的各需求量的频率作为各需求量 气温(℃) 18 13 10 -1 用电量(度) 24 34 38 64

(最全)高中数学概率统计知识点总结

概率与统计 一、普通的众数、平均数、中位数及方差 1、 众数:一组数据中,出现次数最多的数。 2、平均数:①、常规平均数:12n x x x x n ++???+= ②、加权平均数:112212n n n x x x x ωωωωωω++???+=++???+ 3、中位数:从大到小或者从小到大排列,最中间或最中间两个数的平均数。 4、方差:2222121 [()()()]n s x x x x x x n = -+-+???+- 二、频率直方分布图下的频率 1、频率 =小长方形面积:f S y d ==?距;频率=频数/总数 2、频率之和:121n f f f ++???+=;同时 121n S S S ++???+=; 三、频率直方分布图下的众数、平均数、中位数及方差 1、众数:最高小矩形底边的中点。 2、平均数: 112233n n x x f x f x f x f =+++???+ 112233n n x x S x S x S x S =+++???+ 3、中位数:从左到右或者从右到左累加,面积等于0.5时x 的值。 4、方差:22221122()()()n n s x x f x x f x x f =-+-+???+- 四、线性回归直线方程:???y bx a =+ 其中:1 1 2 22 1 1 ()() ?() n n i i i i i i n n i i i i x x y y x y nxy b x x x nx ====---∑∑== --∑∑ , ??a y bx =- 1、线性回归直线方程必过样本中心(,)x y ; 2、?0:b >正相关;?0:b <负相关。 3、线性回归直线方程:???y bx a =+的斜率?b 中,两个公式中分子、分母对应也相等;中间可以推导得到。 五、回归分析 1、残差:??i i i e y y =-(残差=真实值—预报值)。分析:?i e 越小越好; 2、残差平方和:21?()n i i i y y =-∑, 分析:①意义:越小越好; ②计算:222211221 ????()()()()n i i n n i y y y y y y y y =-=-+-+???+-∑ 3、拟合度(相关指数):221 2 1 ?()1() n i i i n i i y y R y y ==-∑=- -∑,分析:①.(]20,1R ∈的常数; ②.越大拟合度越高; 4、相关系数 :()() n n i i i i x x y y x y nx y r ---?∑∑= = 分析:①.[r ∈-的常数; ②.0:r >正相关;0:r <负相关 ③.[0,0.25]r ∈;相关性很弱; (0.25,0.75)r ∈;相关性一般; [0.75,1]r ∈;相关性很强; 六、独立性检验 1、2×2列联表: 2、独立性检验公式 ①.2 2() ()()()() n ad bc k a b c d a c b d -= ++++ ②.犯错误上界P 对照表 3、独立性检验步骤

2019年高考理科全国1卷数学(含答案解析)

2019年普通高等学校招生全国统一考试 理科数学 本试卷共4页,23小题,满分150分,考试用时120分钟。 注意事项: 1.答卷前,考生务必将自己的姓名、考生号、考场号和座位号填写在答题卡上。用2B 铅笔将试卷类型(B )填涂在答题卡的相应位置上。 2.作答选择题时,选出每小题答案后,用2B 铅笔在答题卡上对应题目选项的答案信息点涂黑;如需改动,用橡皮擦干净后,再选涂其它答案。答案不能答在试卷上。 3.非选择题必须用黑色字迹的钢笔或签字笔作答,答案必须写在答题卡各题目指定区域内相应位置上;如需改动,先划掉原来的答案,然后再写上新答案;不准使用铅笔和涂改液。不按以上要求作答无效。 4.考生必须保证答题卡的整洁。考试结束后,将试卷和答题卡一并交回。 一、选择题:本题共12小题,每小题5分,共60分。在每小题给出的四个选项中,只有一项是符合题目要求的。 1.已知集合{} }2 42{60M x x N x x x =-<<=--<,,则M N ?=( ) A. }{43x x -<< B. }{42x x -<<- C. }{22x x -<< D. }{23x x << 2.设复数z 满足=1i z -,z 在复平面内对应的点为(x ,y ),则( ) A. 2 2 +11()x y += B. 22 (1)1x y -+= C. 22 (1)1x y +-= D. 2 2(+1)1y x += 3.已知0.20.3 2log 0.2,2,0.2a b c ===,则( ) A. a b c << B. a c b << C. c a b << D. b c a << 4. ≈0.618,称为黄金分割比例),著名的“断臂维纳斯”便是如此.此外,最美人体 .若某人满足上述两个黄金分割

概率统计-历届全国高中数学联赛真题专题分类汇编

概率统计 1、(2009一试8)某车站每天8 00~900∶∶,900~1000∶∶都恰有一辆客车到站,但到站的时刻是随机的,且两者到站的时间是相互独立的,其规律为 一旅客820∶【答案】27 【解析】旅客候车的分布列为 候车时间的数学期望为10305070902723361218 ?+?+?+?+?= 2、(2010一试6)两人轮流投掷骰子,每人每次投掷两颗,第一个使两颗骰子点数和大于6者为胜,否则轮由另一人投掷.先投掷人的获胜概率是 . 【答案】 12 17 3、(2012一试8)某情报站有,,,A B C D 四种互不相同的密码,每周使用其中的一种密码,且每周都是从上周未使用的三种密码中等可能地随机选用一种.设第1周使用A种密码,那么第7周也使用A种密码的概率是.(用最简分数表示) 【答案】 61 243 【解析】用k P 表示第k 周用 A 种密码的概率,则第k 周末用A 种密码的概率为 1k P -.于是,有11(1),3k k P P k N *+=-∈,即1111()434k k P P +-=--由11P =知,14k P ? ?-???? 是首项为34,公

比为13-的等比数列.所以1131()443k k P --=-,即1311()434k k P -=-+,故761243 P = 4、(2014一试8)设D C B A ,,,是空间四个不共面的点,以 2 1 的概率在每对点之间连一条边,任意两点之间是否连边是相互独立的,则B A ,可用(一条边或者若干条边组成的)空间折线连接的概率是__________. 【答案】 3 4 2221219B C D -?-=点相连,且与,中至少一点相连,这样的情况数为()() 22(3)AB AD DB 无边,也无CD 边,此时AC,CB 相连有2种情况,,相连也有2种情况, ,,,,AC CB AD DB A B 但是其中均相连的情况被重复了一次,故可用折线连接的情况数为 222+2-1=7. 483++==.644以上三类情况数的总和为329748,故A,B 可用折线连接的概率为 5、(2015一试5)在正方体中随机取三条棱,它们两两异面的概率为. 【答案】 2 55 【解析】设正方体为ABCD-EFGH ,它共有12条棱,从中任意选出3条棱的方法共有3 12C =220种. 下面考虑使3条棱两两异面的取法数,由于正方体的棱共确定3个互不平行的方向(即AB 、AD 、AE 的方向),具有相同方向的4条棱两两共面,因此取出的3条棱必属于3个不同的方向.可先取定AB 方向的棱,这有4种取法.不妨设取的棱就是AB ,则AD 方向只能取棱EH 或棱FG ,共2种可能,当AD 方向取棱是EH 或FG 时,AE 方向取棱分别只能是CG 或DH. 由上可知,3条棱两两异面的取法数为4×2=8,故所求的概率为82 22055 =.

高考数学概率与统计知识点汇编

高中数学之概率与统计 求等可能性事件、互斥事件和相互独立事件的概率 解此类题目常应用以下知识: (1)等可能性事件(古典概型)的概率:P(A)=)()(I card A card =n m ; 等可能事件概率的计算步骤: 计算一次试验的基本事件总数n ; 设所求事件A ,并计算事件A 包含的基本事件的个数m ; 依公式 ()m P A n = 求值; 答,即给问题一个明确的答复. (2)互斥事件有一个发生的概率:P(A +B)=P(A)+P(B); 特例:对立事件的概率:P(A)+P(A )=P(A +A )=1. (3)相互独立事件同时发生的概率:P(A ·B)=P(A)·P(B); 特例:独立重复试验的概率:Pn(k)=k n k k n p p C --)1(.其中P 为事件A 在一次试验中发生的 概率,此式为二项式[(1-P)+P]n 展开的第k+1项. (4)解决概率问题要注意“四个步骤,一个结合”: 求概率的步骤是: 第一步,确定事件性质?? ?? ???等可能事件 互斥事件 独立事件 n 次独立重复试验 即所给的问题归结为四类事件中的某一种. 第二步,判断事件的运算 ?? ?和事件积事件 即是至少有一个发生,还是同时发生,分别运用相加或相乘事件. 第三步,运用公式()()()()()()()()(1) k k n k n n m P A n P A B P A P B P A B P A P B P k C p p -? =???+=+? ??=??=-??等可能事件: 互斥事件: 独立事件: n 次独立重复试验:求解 第四步,答,即给提出的问题有一个明确的答复. 例1. 在五个数字12345,,,,中,。 例2. 若随机取出三个数字,则剩下两个数字都是奇数的概率是 (结果用数值表示). [解答过程]0.3提示:13 35C 33. 54C 10 2P ===?

高中数学概率统计教案

专题二 概率统计(文科) (一)统计 【背一背基础知识】 一.抽样方法 抽样方法包含简单随机抽样、系统抽样、分层抽样三种方法,三种抽样方法都是等概率抽样,体现了抽样的公平性,但又各有其特点和适用范围. 二.用样本估计总体 1.频率分布直方图:画一个只有横、纵轴正方向的直角坐标系,把横轴分成若干段,每一段对应一个组的组距,然后以此段为底作一矩形,它的高等于该组的 频率 组距 ,这样得出一系列的矩形,每个矩形的面积恰好是该组上的频率,这些矩形就构成了频率分布直方图.在频率分布直方图中,每个小矩形的面积等于相应数据的频率,各小矩形的面积之和等于 1; 2.茎叶图:茎叶图是一种将样本数据有条理地列出来,从中观察样本分布情况的图.在茎叶图中,“茎”表示数的高位部分,“叶”表示数的低位部分. 3.样本的数字特征: (1)众数:一组数据中,出现次数最多的数据就是这组数据的众数(一组数据中的众数可能只有一个,也可能有多个).在频率分布直方图中,最高的矩形的中点的横坐标即为该组数据的众数; (2)中位数:将一组数据由小到大(或由大到小)的顺序排列,如果数据的个数是奇数,则处于中间位置的数就是这组数据的中位数;如果数据的个数是偶数,则中间两个数据的平均数就是这组数据的中位数.在频率分布直方图中,中位数a 对应的直线x a =的左右两边的矩形面积之和均为0.5,可以根据这个特点求频率分布直方图中的中位数; (3)平均数:设n 个数分别为1x 、2x 、L 、n x ,则()121 n x x x x n = +++L 叫做这n 个数的算数平均数.在频率分布直方图中,它等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和; (4)方差:设n 个数分别为1x 、2x 、L 、n x ,则 ()()() 2222 121n s x x x x x x n ? ?=-+-++-????L 叫做这n 个数的方差,方差衡量样本的稳定

高中数学统计案例分析及知识点归纳总结

统计 一、知识点归纳 1、抽样方法: ①简单随机抽样(总体个数较少) ②系统抽样(总体个数较多) ③分层抽样(总体中差异明显) 注意:在N 个个体的总体中抽取出n 个个体组成样本,每个个体被抽到的机会(概率)均为N n 。 2、总体分布的估计: ⑴一表二图: ①频率分布表——数据详实 ②频率分布直方图——分布直观 ③频率分布折线图——便于观察总体分布趋势 注:总体分布的密度曲线与横轴围成的面积为1。 ⑵茎叶图: ①茎叶图适用于数据较少的情况,从中便于看出数据的分布,以及中位数、众位数等。 ②个位数为叶,十位数为茎,右侧数据按照从小到大书写,相同的数据重复写。 3、总体特征数的估计: ⑴平均数:n x x x x x n ++++= 321; 取值为n x x x ,,,21 的频率分别为n p p p ,,,21 ,则其平均数为n n p x p x p x +++ 2211; 注意:频率分布表计算平均数要取组中值。 ⑵方差与标准差:一组样本数据n x x x ,,,21 方差:2 1 2)(1 ∑=-= n i i x x n s ; 标准差:2 1 )(1∑=-= n i i x x n s 注:方差与标准差越小,说明样本数据越稳定。 平均数反映数据总体水平;方差与标准差反映数据的稳定水平。 ⑶线性回归方程 ①变量之间的两类关系:函数关系与相关关系; ②制作散点图,判断线性相关关系 ③线性回归方程:a bx y +=∧ (最小二乘法) 1 221n i i i n i i x y nx y b x nx a y bx ==? -? ?=??-??=-??∑∑ 注意:线性回归直线经过定点),(y x 。

2019年高考真题理科数学(全国II卷)

AB=(2,3),AC=(3,t),|BC|=1,则AB?BC=( ) M233 3

7.8.9.10.11. 12.13.设α,β为两个平面,则α∥β的充要条件是( ) α内有无数条直线与β平行 α内有两条相交直线与β平行α,β平行于同一条直线α,β垂直于同一平面 若抛物线y =2px(p>0)的焦点是椭圆x 23p +y 2p =1的一个焦点,则p=( ) 2348下列函数中,以π2为周期且在区间(π4,π2 )单调递增的是( )f(x)=|cos2x| f(x)=|sin2x|f(x)=cos|x|f(x)=sin|x|已知α∈(0,π2),2sin2α=cos2α+1,则sinα=( )15553325 5设F为双曲线C:x 2a 2-y 2b 2 =1(a>0,b>0)的右焦点,O为坐标原点,以OF为直径的圆与圆x +y =a 交于P,Q两点.若|PQ|=|OF|,则C的离心率为( )2325 设函数f(x)的定义域为R,满足f(x+1)=2f(x),且当x∈(0,1]时,f(x)=x(x-1).若对任意x∈(-∞,m],都有f(x)≥-89 ,则m的取值范围是( )(-∞,94](-∞,73](-∞,52](-∞,83 ]我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为 . A. B. C. D. 2A. B. C. D. A. B. C. D. A. B. C. D. 222A. B. C. D. A. B. C. D.

高中数学必修三 概率与统计

高中数学必修三:概率与统计 1.要从已编号(1-50)的50枚最新研制的某型号导弹中随机抽取5枚来进行发射试验,用每部分选取的号码间隔一样的系统抽样方法确定所选取的5枚导弹的编号可能是( ). A.5,10,15,20,25B.3,13,23,33,43C.1,2,3,4,5D.2,4,8,16,32 2.从鱼塘捕得同一时间放养的草鱼240尾,从中任选9尾,称得每尾鱼的质量分别是1.5,1.6,1.4,1.6,1.3,1.4,1.2,1.7,1.8(单位:千克).依此估计这240尾鱼的总质量大约是( ).A.300克B.360千克C.36千克D.30千克 3.以下茎叶图记录了甲.乙两组各五名学生在一次英语听力测试中的成绩(单位:分) 已知甲组数据的中位数为15,乙组数据的平均数为16.8,则,x y的值分别为()A.2,5B.5,5C.5,8D.8,8 4.为了考查两个变量x和y之间的线性关系,甲、乙两位同学各自独立作了10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1,l2,已知两人得的试验数据中,变量x和y的数据的平均值都分别相等,且值分别为s与t,那么下列说法正确的是( ). A.直线l1和l2一定有公共点(s,t)B.直线l1和l2相交,但交点不一定是(s,t) C.必有直线l1∥l2 D.直线l1和l2必定重合 5..设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(x i,y i)(i=1,2,…,n),用最小二乘法建立的回归方程为$y=0.85x-85.71,则下列结论中不正确的是( ).A.y与x具有正的线性相关关系B.回归直线过样本点的中心(x,y)C.若该大学某女生身高增加1cm,则其体重约增加0.85kgD.若该大学某女生身高为170cm,则可断定其体重比为58.79kg

2019年高考理科数学考试大纲

理科数学 Ⅰ.考核目标与要求 根据普通高等学校对新生思想道德素质和科学文化素质的要求,依据中华人民共和国教育部2003年颁布的《普通高中课程方案(实验)》和《普通高中数学课程标准(实验)》的必修课程、选修课程系列2和系列4的内容,确定理工类高考数学科考试内容. 一、知识要求 知识是指《普通高中数学课程标准(实验)》(以下简称《课程标准》)中所规定的必修课程、选修课程系列2和系列4中的数学概念、性质、法则、公式、公理、定理以及由其内容反映的数学思想方法,还包括按照一定程序与步骤进行运算、处理数据、绘制图表等基本技能. 各部分知识的整体要求及其定位参照《课程标准》相应模块的有关说明. 对知识的要求依次是了解、理解、掌握三个层次. 1.了解:要求对所列知识的含义有初步的、感性的认识,知道这一知识内容是什么,按照一定的程序和步骤照样模仿,并能(或会)在有关的问题中识别和认识它. 这一层次所涉及的主要行为动词有:了解,知道、识别,模仿,会求、会解等. 2.理解:要求对所列知识内容有较深刻的理性认识,知道知识间的逻辑关系,能够对所列知识做正确的描述说明并用数学语言表达,能够利用所学的知识内容对有关问题进行比较、判别、讨论,具备利用所学知识解决简单问题的能力. 这一层次所涉及的主要行为动词有:描述,说明,表达,推测、想象,比较、判别,初步应用等. 3.掌握:要求能够对所列的知识内容进行推导证明,能够利用所学知识对问题进行分析、研究、讨论,并且加以解决. 这一层次所涉及的主要行为动词有:掌握、导出、分析,推导、证明,研究、讨论、运用、解决问题等. 二、能力要求 能力是指空间想象能力、抽象概括能力、推理论证能力、运算求解能力、数据处理能力以及应用意识和创新意识. 1.空间想象能力:能根据条件作出正确的图形,根据图形想象出直观形象;能正确地分析出图形中的基本元素及其相互关系;能对图形进行分解、组合;会运用图形与图表等手段形象地揭示问题的本质. 空间想象能力是对空间形式的观察、分析、抽象的能力,主要表现为识图、画图和对图形的想象能力.识图是指观察研究所给图形中几何元素之间的相互关系;画图是指将文字语言和符号语言转化为图形语言以及对图形添加辅助图形或对图形进行各种变换;对图形的想象主要包括有图想图和无图想图两种,是空间想象能力高层次的标志. 2.抽象概括能力:抽象是指舍弃事物非本质的属性,揭示其本质的属性;概括是指把仅仅属于某一类对象的共同属性区分出来的思维过程.抽象和概括是相互联系的,没有抽象就不可能有概括,而概括必须在抽象的基础上得出某种观点或某个结论. 抽象概括能力是对具体的、生动的实例,经过分析提炼,发现研究对象的本质;从给定的大量信息材料中概括出一些结论,并能将其应用于解决问题或做出新的判断.

高中数学概率与统计测试题

概率与统计 1.如果一个整数为偶数的 概率为 (1)a+b 为偶数的概率; (2)a+b+c 为偶数的概率。 0.6 ,且 a,b,c 均为整数,求 2.从 10 位同学 (其中 6 女,4 男)中随机选出 3 位参加测验,每位女同学能通过测验的概率 43 均为,每位男同学能通过测验的概率均为,求55 (1)选出的 3 位同学中,至少有一位男同学的概率; (2)10 位同学中的女同学甲和男同学乙同时被选中且通过测验的概率。 3.袋中有 6 个白球, 4 个红球,甲首先从中取出 3 个球,乙再从余下的 7 个球中取出 4 个球,凡取得红球多者获胜。试求 (1)甲获胜的概率; (2)甲,乙成平局的概率。 4.箱子中放着 3 个 1 元硬币, 3 个 5 角硬币, 4 个 1 角硬币,从中任取 3 个,求总钱数超过 1 元 8 角的概率。 5.有 10 张卡片,其号码分别位 1,2,3?,10,从中任取 3 张。 (1)求恰有 1 张的号码为 3 的倍数的概率; (2)记号码为 3 的倍数的卡片张数为ξ,求ξ的数学期望。 6.某种电子玩具按下按钮后,会出现白球或绿球,已知按钮第一次按下后,出现红球与绿球 1 的概率都是,从按钮第二次按下起,若前次出现红球,则下次出现红球、绿球的概率2 1 2 3 2 分别为, ;若前次出现绿球,则下次出现红球、绿球的概率分别为, ,记第 n(n ∈ 3 3 5 5 N,n ≥1) 次按下后,出现红球的概率为P n

(1)求P2的值; (2)当 n∈N,n ≥2 时,求用P n 1表示P n的表达式; (3)求P n关于 n 的表达式。 7.有甲、乙两个盒子 ,甲盒子中有 8 张卡片 ,其中两张写有数字 0,三张写有数字 1 ,三张写有数字 2 ;乙盒子中有 8 张卡片,其中三张写有数字 0,两张写有数字1,三张写有数字 2 , (1) 如果从甲盒子中取两张卡片,从乙盒子中取一张卡片,那么取出的 3 张卡片都写有 1 的概率是多少? (2)如果从甲、乙盒子中各取一张卡片,设取出的两张卡片数字之和为ξ,求ξ的分布列和期望。 8.甲、乙两位同学做摸球游戏,游戏规则规定:两人轮流从一个放有 1 个白球, 3 个黑球, 2 个红球且只有颜色不同的 6 个小球的暗箱中取球,每次每人只取一球,每取出一个后立即放回,另一个人接着取,取出后也立即放回,谁先取到红球,谁为胜者,现甲先取 (1) 求甲摸球次数不超过三次就获胜的概率; (2) 求甲获胜的概率。 9.设有均由 A,B,C 三个部件构成的两种型号产品甲和乙,当A或 B 是合格品并且 C 是合格 品时,甲是正品;当 A, B 都是合格品或者 C 是合格品时,乙是正品。若 A 、 B、C 合格的概率均是 P,这里 A ,B,C 合格性是互相独立的。 (1) 产品甲为正品的概率P1是多少? (2)产品乙为正品的概率P2 是多少? (3)试比较P1与P2的大小。 10.一种电路控制器在出厂时每四件一等品装成一箱,工人在装箱时不小心把两件二等品和两件一等品装入了一箱,为了找出该箱的二等品,我们对该箱中的产品逐一取出进行测试。 (1) 求前二次取出的都是二等品的概率; (2) 求第二次取出的是二等品的概率; (3)用随机变量ξ表示第二个二等品被取出时共取的件数,求ξ的分布列及数学

高中数学统计、统计案例知识点总结和典例

统计 一.简单随机抽样:抽签法和随机数法 1.一般地,设一个总体含有N个个体(有限),从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等(n/N),就把这种抽样方法叫做简单随机抽样。 2.一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本,这种抽样方法叫做抽签法。 抽签法的一般步骤:a、将总体的个体编号。 b、连续抽签获取样本号码。 3. 利用随机数表、随机数骰子或计算机产生的随机数进行抽样,叫随机数表法。 随机数表法的步骤:a、将总体的个体编号。b、在随机数表中选择开始数字。c、读数获取样本号码。 4. 抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力,又不方便,如果标号的签搅拌得不均匀,会导致抽样不公平,随机数表法的优点与抽签法相同,缺点上当总体容量较大时,仍然不是很方便,但是比抽签法公平,因此这两种方法只适合总体容量较少的抽样类型。 二.系统抽样: 1.一般地,要从容量为N的总体中抽取容量为n的样本,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样的方法叫做系统抽样。 系统抽样的一般步骤: (1)采用随机抽样的方法将总体中的N个个编号。 (2)将整体按编号进行分段,确定分段间隔k=N/n。(k∈N,L≤k). (3)在第一段用简单随机抽样确定起始个体的编号L(L∈N,L≤k)。 (4)按照一定的规则抽取样本,通常是将起始编号L加上间隔k得到第2个个体编号L+K,再加上K得到第3个个体编号L+2K,这样继续下去,直到获取整个样本。 在确定分段间隔k时应注意:分段间隔k为整数,当N/n不是整数时,应采用等可能剔除的方剔除部分个体,以获得整数间隔k。 三.分层抽样: 1.一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样的方法叫分层抽样。 分层抽样的步骤: (1)分层:按某种特征将总体分成若干部分。(2)按比例确定每层抽取个体的个数。 (3)各层分别按简单随机抽样的方法抽取。(4)综合每层抽样,组成样本。 2.分层抽样是当总体由差异明显的几部分组成时采用的抽样方法,进行分层抽样时应注意以下几点: (1)分层抽样中分多少层、如何分层要视具体情况而定,总的原则是,层内样本的差异要小,面层之间的样本差异要大,且互不重叠。 (2)为了保证每个个体等可能入样,所有层应采用同一抽样比等可能抽样。 (3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样。 四.用样本的频率分布估计总体分布: 1.频率分布是指一个样本数据在各个小范围内所占比例的大小。一般用频率分布直方图反映样本的频率分布。 其一般步骤为:(1)计算一组数据中最大值与最小值的差,即求极差(2)决定组距与组数(3)将数据分组(4)列频率分布表(5)画频率分布直方图 2.频率分布折线图、总体密度曲线 频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图。

(完整版)高中数学必修2《统计》知识点讲义

第二章统计 一、三种抽样方法 1、统计的的基本思想是:用样本的某个量去估计总体的某个量 总体:在统计中,所有考察对象的全体。 个体:总体中的每一个考察对象。 样本:从总体中抽取的一部分个体叫做这个总体的一个样本。 样本容量:样本中个体的数目。 2、抽样方法:要求:总体中每个个体被抽取的机会相等 (1)简单随机抽样:抽签法和随机数表法 简单随机抽样的特点是:不放回、等可能. 抽签法步骤 (1)先将总体中的所有个体(共有N个)编号(号码可从1到N) (2)把号码写在形状、大小相同的号签上,号签可用小球、卡片、纸条等制作 (3)将这些号签放在同一个箱子里,进行均匀搅拌(4)抽签时,每次从中抽出一个号签,连续抽取n次(5)抽出样本 随机数表法步骤 (1)将总体中的个体编号(编号时位数要统一);(2)选定开始的数字;(3)按照一定的规则读取号码;(4)取出样本 (2)系统抽样 系统抽样特点:容量大、等距、等可能. 步骤: 1.编号,随机剔除多余个体,重新编号 2.分组 (段数等于样本容量),确定间隔长度 k=N/n 3.抽取第一个个体编号为i 4.依预定的规则抽取余下的个体编号为i+k, i+2k, … (3)分层抽样 分层抽样特点:总体差异明显、按所占比例抽取、等可能. 步骤:1.将总体按一定标准分层; 2.计算各层的个体数与总体的个体数的比; 3.按比例确定各层应抽取的样本数目 4.在每一层进行抽样 (可用简单随机抽样或系统抽样)

二、用样本估计总体 1、用样本的频率分布估计总体的分布 ①作样本频率分布直方图的步骤: (1)求极差; (2)决定组距与组数; (组数=极差/组距) (3)将数据分组; (4)列频率分布表(分组,频数,频率); (5)画频率分布直方图。 根据频率分布表做频率分布直方图应注意两点: 频率 ⑴纵轴的意义: 组距 ⑵横轴的意义:样本内容(每个矩形下面是组距). 例1、为了了解中学生的身高情况,对育才中学同龄的50名男学生的身高进行了测量,结果如下:(单位:cm) 175 168 180 176 167 181 162 173 171 177 171 171 174 173 174 175 177 166 163 160 166 166 163 169 174 165 175 165 170 158 174 172 166 172 167 172 175 161 173 167 170 172 165 157 172 173 166 177 169 181 列出样本的频率分布表,画出频率分布直方图. 解:在这个样本中,最大值为181,最小值为157,它们的差是24,可以取组距为4,分成7组,根据题意列出样本的频率分布表如下: 频率分布直方图(略)

高中数学统计与统计案例概率知识点上课讲义

高中数学统计与统计案例概率知识点

统计与统计案例概率(文科) 知识点 1.抽样调查 (1)抽样调查 通常情况下,从调查对象中按照一定的方法抽取一部分,进行______,获取数据,并以此对调查对象的某项指标作出______,这就是抽样调查. (2)总体和样本 调查对象的称为总______体,被抽取的称为样______本. (3)抽样调查与普查相比有很多优点,最突出的有两点: ①______ ②节约人力、物力和财力. 2.简单随机抽样 (1)简单随机抽样时,要保证每个个体被抽到的概率. (2)通常采用的简单随机抽样的方法:_____ 3.分层抽样 (1)定义:将总体按其属性特征分成若干类型(有时称作层),然后在每个类型中按照所占比例随机抽取一定的样本.这种抽样方法通常叫作分层抽样,有时也称为类型抽样. (2)分层抽样的应用范围: 当总体是由差异明显的几个部分组成时,往往选用分层抽样. 4.系统抽样 系统抽样是将总体中的个体进行编号,等距分组,在第一组中按照简单随机抽样抽取第一个样本,然后按______(称为抽样距)抽取其他样本.这种抽样方法有时也叫等距抽样或机

械抽样. 5.统计图表 统计图表是______数据的重要工具,常用的统计图表有______ 6.数据的数字特征 (1)众数、中位数、平均数 众数:在一组数据中,出现次数最多的数据叫作这组数据的众数. 中位数:将一组数据按大小依次排列,把处在______位置的一个数据(或最中间两个数据的平均数)叫作这组数据的中位数. 平均数:样本数据的算术平均数,即x =1n (x 1+x 2+…+x n ). 在频率分布直方图中,中位数左边和右边的直方图的面积应该______ (2)样本方差 标准差s = 1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2], 其中x n 是样本数据的第n 项,n 是,______x 是______ 标准差是刻画数据的离散程度的特征数,样本方差是标准差的______.通常用样本方差估计总体方差,当______时,样本方差很接近总体方差. 7.用样本估计总体 (1)通常我们对总体作出的估计一般分成两种,一种是______,另一种______. (2)在频率分布直方图中,纵轴表示,______数据落在各小组内的频率用______表示,各小长方形的面积总和等于.______ (3)在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间.从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,称之为频率折线图. (4)当样本数据较少时,用茎叶图表示数据的效果较好,它没有信息的缺失,而且______,方便表示与比较.

相关文档
最新文档