(典型题)高考数学二轮复习-知识点总结-统计与统计案例

(典型题)高考数学二轮复习-知识点总结-统计与统计案例
(典型题)高考数学二轮复习-知识点总结-统计与统计案例

统计和统计案例

1.该部分常考内容:样本数字特征的计算、各种统计图表、线性回归方程、独立性检验等;有时也会在知识交汇点处命题,如概率和统计交汇等.

2.从考查形式上来看,大部分为选择题、填空题,重在考查基础知识、基本技能,有时在知识交汇点处命题,也会出现解答题,都属于中低档题. 1. 随机抽样

(1)简单随机抽样特点为从总体中逐个抽取,适用范围:总体中的个体较少. (2)系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取,适用范围:总体中的个体数较多.

(3)分层抽样特点是将总体分成几层,分层进行抽取,适用范围:总体由差异明显的几部分组成. 2. 常用的统计图表

(1)频率分布直方图 ①小长方形的面积=组距×

频率

组距

=频率; ②各小长方形的面积之和等于1;

③小长方形的高=频率组距,所有小长方形的高的和为1

组距.

(2)茎叶图

在样本数据较少时,用茎叶图表示数据的效果较好. 3. 用样本的数字特征估计总体的数字特征

(1)众数、中位数、平均数 数字特征 样本数据 频率分布直方图

众数

出现次数最多的数据 取最高的小长方形底边中点的横坐标 中位数

将数据按大小依次排列,处在最

中间位置的一个数据(或最中间两个数据的平均数)

把频率分布直方图划分左右两个面积相等的分界线和x 轴交点的横坐标 平均数

样本数据的算术平均数

每个小矩形的面积乘以小矩形底边中点的横坐标之和

(2)方差:s 2=n

[(x 1-x )2+(x 2-x )2+…+(x n -x )2

].

标准差:

s =

1n

[

x 1-x

2

+x 2-x

2

+…+x n -x

2

].

4. 变量的相关性和最小二乘法

(1)相关关系的概念、正相关和负相关、相关系数.

(2)最小二乘法:对于给定的一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),通过求Q

= i =1

n

(y i -a -bx i )2

最小时,得到线性回归方程y ^

=b ^

x +a ^

的方法叫做最小二乘法.

5. 独立性检验

对于取值分别是{x 1,x 2}和{y 1,y 2}的分类变量X 和Y ,其样本频数列联表是:

y 1 y 2 总计

x 1 a b a +b x 2

c d c +d 总计

a +c

b +d

n

则K 2

n ad -bc 2a +b

c +

d a +c

b +d

(其中n =a +b +c +d 为样本容量).

考点一 抽样方法

例1 (2012·山东)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C .则抽到的人中,做问卷B 的人数为

( )

A .7

B .9

C .10

D .15

答案 C

分析 由系统抽样的特点知:抽取号码的间隔为

960

32

=30,抽取的号码依次为9,39,69,…,939.落入区间[451,750]的有459,489,…,729,这些数构成首项为459,公差为30的等差数列,设有n 项,显然有729=459+(n -1)×30,解得n =10.所以做问卷B 的有10人.

在系统抽样的过程中,要注意分段间隔,需要抽取几个个体,样本就需要分

成几个组,则分段间隔即为N

n

(N 为样本容量),首先确定在第一组中抽取的个体的号码数,再从后面的每组中按规则抽取每个个体.解决此类题目的关键是深刻理解各种抽样

方法的特点和适用范围.但无论哪种抽样方法,每一个个体被抽到的概率都是相等的,都等于样本容量和总体容量的比值.

(1)(2013·江西)总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为

( )

78166572080263140702436997280198

32049234493582003623486969387481

A.08 B.07 C.02 D.01

(2)某单位200名职工的年龄分布情况如图所示,现要从中抽取40名职工作样本.用系统抽样法,将全体职工随机按1~200编号,并按编号顺序平均分为40组(1~5号,6~10号,…,196~200号).若第5组抽出的号码为22,则第8组抽出的号码应是________.若用分层抽样方法,则40岁以下年龄段应抽取________人.

答案(1)D (2)37 20

分析(1)从第1行第5列、第6列组成的数65开始由左到右依次选出的数为:08,02,14,07,01,所以第5个个体编号为01.

(2)由分组可知,抽号的间隔为5,又因为第5组抽出的号码为22,即第n组抽取的号码为5n-3,所以第8组抽出的号码为37;40岁以下年龄段的职工数为200×0.5=100,

则应抽取的人数为40

200

×100=20人.

考点二用样本估计总体

例2(1)(2013·四川)某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示,以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是

( )

(2)(2013·江苏)抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:

运动员第1次第2次第3次第4次第5次

甲8791908993

乙8990918892

答案(1)A (2)2

分析(1)由于频率分布直方图的组距为5,去掉C、D,又[0,5),[5,10)两组各一人,去掉B,应选A.

(2)x 甲=1

5

(87+91+90+89+93)=90,

x 乙=1

5

(89+90+91+88+92)=90,

s 2甲=15[(87-90)2+(91-90)2+(90-90)2+(89-90)2+(93-90)2

]=4,

s 2乙=15

[(89-90)2+(90-90)2+(91-90)2+(88-90)2+(92-90)2

]=2.

(1)反映样本数据分布的主要方式有:频率分布表、频率分布直方图、茎叶图.关于频率分布直方图要明确每个小矩形的面积即为对应的频率,其高低能够描述频率的大小,高考中常常考查频率分布直方图的基本知识,同时考查借助频率分布直方图估计总体的概率分布和总体的特征数,具体问题中要能够根据公式求解数据的均值、众数和中位数、方差等.

(2)由样本数据估计总体时,样本方差越小,数据越稳定,波动越小.

在“2012魅力新安江”青少年才艺表演评比活动中,参赛选手成绩的茎叶图和频率分布直方图都受到不同程度的破坏,可见部分如图,据此回答以下问题: (1)求参赛总人数和频率分布直方图中[80,90)之间的矩形的高,并完成直方图; (2)若要从分数在[80,100]之间任取两份进行分析,在抽取的结果中,求至少有一份分数在[90,100]之间的概率.

解 (1)由茎叶图知,分数在[50,60)之间的频数为2. 由频率分布直方图知,分数在[50,60)之间的频率为 0.008×10=0.08.

所以参赛总人数为20.08

=25(人).

分数在[80,90)之间的人数为25-2-7-10-2=4(人), 分数在[80,90)之间的频率为

4

25

=0.16, 得频率分布直方图中[80,90)间矩形的高为0.16

10=0.016.

完成直方图,如图.

(2)将[80,90)之间的4个分数编号为1,2,3,4;[90,100]之间的2个分数编号为5和6. 则在[80,100]之间任取两份的基本事件为(1,2),(1,3),(1,4),(1,5),(1,6),(2,3),(2,4),(2,5),(2,6),(3,4),(3,5),(3,6),(4,5),(4,6),(5,6),共15个, 其中至少有一个在[90,100]之间的基本事件为(1,5),(1,6),(2,5),(2,6),(3,5),(3,6),(4,5),(4,6),(5,6),共9个.

故至少有一份分数在[90,100]之间的概率是915=3

5.

考点三 统计案例

例3 (2013·重庆)从某居民区随机抽取10个家庭,获得第i 个家庭的月收入x i (单位:

千元)和月储蓄y i (单位:千元)的数据资料,算得∑i =1

10

x i =80,∑i =1

10

y i =20,∑i =1

10

x i y i =184,∑i =1

10

x

2

i

=720.

(1)求家庭的月储蓄y 对月收入x 的线性回归方程y =bx +a ; (2)判断变量x 和y 之间是正相关还是负相关;

(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.

附:线性回归方程y =bx +a 中,b =

∑i =1

n

x i y i -n x y

∑i =1

n

x 2

i -n x 2

,a =y -b x ,其中x ,y 为

样本平均值,线性回归方程也可写为y ^=b ^x +a ^

. 解 (1)由题意知n =10,x =

1

n ∑i =1

n

x i =80

10

=8,

y =

1

n ∑i =1

n

y i =20

10

=2,

又l xx =∑i =1

n

x 2

i -n x 2

=720-10×82

=80,

l xy =∑i =1

n

x i y i -n x y =184-10×8×2=24,

由此得b =

l xy l xx =24

80

=0.3, a =y -b x =2-0.3×8=-0.4,

故所求线性回归方程为y =0.3x -0.4.

(2)由于变量y 的值随x 值的增加而增加(b =0.3>0), 故x 和y 之间是正相关.

(3)将x =7代入回归方程可以预测该家庭的月储蓄为y =0.3×7-0.4=1.7(千元).

(1)对具有线性相关关系的两个变量可以用最小二乘法求线性回归方程,求b ^

是关键,

其中b ^

∑i =1

n

x i -x

y i -y

∑i =1

n

x i -x

2

∑i =1

n

x i y i -n x y

∑i =1

n

x 2i -n x 2

.

(2)在利用统计变量K 2

(χ2

)进行独立性检验时,应该注意数值的准确代入和正确计算,最后把计算的结果和有关临界值相比较.

(1)通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:

男 女 总计 爱好 40 20 60 不爱好 20 30 50 总计

60

50

110 由K 2

(χ2

)=

n ad -bc 2

a +b

c +

d a +c

b +d

算得,

K 2

(χ2)=

110×40×30-20×20

2

60×50×60×50≈7.8.

附表:

P (K 2(χ2)≥k )

0.050 0.010 0.001 k

3.841 6.635 10.828

( )

A .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动和性别有关”

B .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动和性别无关”

C .有99%以上的把握认为“爱好该项运动和性别有关”

D .有99%以上的把握认为“爱好该项运动和性别无关” (2)已知x 、y 取值如下表:

x 0 1 4 5 6 8 y

1.3

1.8

5.6

6.1

7.4

9.3

从所得的散点图分析可知:y 和x 线性相关,且y =0.95x +a ,则a 等于 ( )

A .1.30

B .1.45

C .1.65

D .1.80 答案 (1)C (2)B

分析 (1)根据独立性检验的定义,由K 2(χ2

)≈7.8>6.635可知我们有99%以上的把握认为“爱好该项运动和性别有关”,故选C. (2)依题意得,x =1

6

×(0+1+4+5+6+8)=4,

y =16

(1.3+1.8+5.6+6.1+7.4+9.3)=5.25;

又直线y ^

=0.95x +a ^

必过样本点中心(x ,y ),即点(4,5.25),于是有5.25=0.95×4

+a ^

,由此解得a ^

=1.45.

1. 用样本估计总体

(1)在频率分布直方图中,各小长方形的面积表示相应的频率,各小长方形的面积的和为1.

(2)众数、中位数及平均数的异同

众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量. (3)当总体的个体数较少时,可直接分析总体取值的频率分布规律而得到总体分布;当总体容量很大时,通常从总体中抽取一个样本,分析它的频率分布,以此估计总体分布. ①总体期望的估计,计算样本平均值x =1n

∑n i =1

x i . ②总体方差(标准差)的估计:

方差=1n

∑n i =1

(x i -x )2,标准差=方差, 方差(标准差)较小者较稳定.

2. 线性回归方程y ^

=b ^

x +a ^

过样本点中心(x ,y ),这为求线性回归方程带来很多方便. 3. 独立性检验

(1)作出2×2列联表. (2)计算随机变量K 2

(χ2

)的值. (3)查临界值,检验作答.

1. 经问卷调查,某班学生对摄影分别持“喜欢”、“不喜欢”和“一般”三种态度,其中

持“一般”态度的学生比持“不喜欢”的学生多12人,按分层抽样的方法(抽样过程中不需要剔除个体)从全班选出部分学生进行关于摄影的座谈.若抽样得出的9位同学中有5位持“喜欢”态度的同学,1位持“不喜欢”态度的同学和3位持“一般”态度的同学,则全班持“喜欢”态度的同学人数为 ( )

A .6

B .18

C .30

D .54

答案 C

高中数学统计、统计案例知识点总结和典例说课讲解

统计 一.简单随机抽样:抽签法和随机数法 1.一般地,设一个总体含有N个个体(有限),从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等(n/N),就把这种抽样方法叫做简单随机抽样。 2.一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本,这种抽样方法叫做抽签法。 抽签法的一般步骤:a、将总体的个体编号。 b、连续抽签获取样本号码。 3. 利用随机数表、随机数骰子或计算机产生的随机数进行抽样,叫随机数表法。 随机数表法的步骤:a、将总体的个体编号。b、在随机数表中选择开始数字。c、读数获取样本号码。 4. 抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力,又不方便,如果标号的签搅拌得不均匀,会导致抽样不公平,随机数表法的优点与抽签法相同,缺点上当总体容量较大时,仍然不是很方便,但是比抽签法公平,因此这两种方法只适合总体容量较少的抽样类型。 二.系统抽样: 1.一般地,要从容量为N的总体中抽取容量为n的样本,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样的方法叫做系统抽样。 系统抽样的一般步骤: (1)采用随机抽样的方法将总体中的N个个编号。 (2)将整体按编号进行分段,确定分段间隔k=N/n。(k∈N,L≤k). (3)在第一段用简单随机抽样确定起始个体的编号L(L∈N,L≤k)。 (4)按照一定的规则抽取样本,通常是将起始编号L加上间隔k得到第2个个体编号L+K,再加上K得到第3个个体编号L+2K,这样继续下去,直到获取整个样本。 在确定分段间隔k时应注意:分段间隔k为整数,当N/n不是整数时,应采用等可能剔除的方剔除部分个体,以获得整数间隔k。 三.分层抽样: 1.一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样的方法叫分层抽样。 分层抽样的步骤: (1)分层:按某种特征将总体分成若干部分。(2)按比例确定每层抽取个体的个数。 (3)各层分别按简单随机抽样的方法抽取。(4)综合每层抽样,组成样本。 2.分层抽样是当总体由差异明显的几部分组成时采用的抽样方法,进行分层抽样时应注意以下几点: (1)分层抽样中分多少层、如何分层要视具体情况而定,总的原则是,层内样本的差异要小,面层之间的样本差异要大,且互不重叠。 (2)为了保证每个个体等可能入样,所有层应采用同一抽样比等可能抽样。 (3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样。 四.用样本的频率分布估计总体分布: 1.频率分布是指一个样本数据在各个小范围内所占比例的大小。一般用频率分布直方图反映样本的频率分布。 其一般步骤为:(1)计算一组数据中最大值与最小值的差,即求极差(2)决定组距与组数(3)将数据分组(4)列频率分布表(5)画频率分布直方图 2.频率分布折线图、总体密度曲线 频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图。

高项案例知识点总结

1、项目经理的选择和素质:P18-23 一个合格项目经理应具备的素质:(1)广博的知识,丰富的经历,良好的协调能力,良好的职业道德,良好的沟通和表达能力,良好的领导能力。 项目经理应具备的五大知识领域:项目管理知识体系,应用领域的知识、标准和规定,项目环境知识,通用的管理知识和技能,软技能和人际关系技能。 2、项目干系人的需求分析和沟通分析,两部分组成——P31+P232 项目干系人的分析:1、非组员的干系人的三大职责:参与、审查、反馈2、项目干系人的分析的目的:确定项目干系人的需求,帮助项目经理制定沟通管理策略。 项目干系人的管理的方法:沟通方法(分析干系人需求和期望目标,分层次分目标进行沟通,不同干系人采用不同的沟通策略,综合运用正式的和非正式的或公开或私下等多种沟通方法),问题日志需求分析就是确定待开的信息系统应该做什么。 需求分析的特点: 1、用户与开发人员之间存在着沟通方面的困难; 2、用户的需求是动态变化的; 3、生命周期种不同的阶段系统变更的代价呈非线性增长; 需求分析的过程1、问题识别;2、分析与综合;3、制订规格说明;4、评审; 需求分析的方法1、原型化方法2、结构化方法3、动态分析法 需求分析步骤: 1、阅读甲方所有资料文件-组织资产、业务法规制度、业务流程; 2、撰写调研提纲,并与甲方业务人员确认; 3、业务岗位实地调研,岗位调研报告(一地)业务调研集中会议与试点地区岗位调研(省地市异地); 4、撰写业务调研报告,与甲方主要需求人员开会讨论; 5、甲方高层参加的业务需求调研报告会,认可业务需求内容 6、正式撰写“需求分析”系列文档;与甲方主要需求人员讨论; 7、真是提交需求评审,开会,确认需求; 3、项目的组织结构对项目管理的影响P34 第五章 4、整体管理计划的制定流程,作用和内容P91-93 整体管理作用:对项目管理过程中的不同过程和活动进行识别、定义、整合、统一和协调的过程。 整体管理计划的制定流程:制订项目章程,制订项目范围说明书初步,制订项目管理计划,指导和管理项目执行,监督和控制项目工作,整体变更控制,项目收尾。 5、范围管理——范围的定义、确认,P110 范围定义:描述项目过程并把结果与项目写进详细范围说明书中。 项目范围确认的工作要点:制订并执行确认程度,项目干系人对项目范围的正式确认,让系统的使用者有效参与,项目各阶段的确认和项目最终验收的确认。 分阶段分步骤的确认是归避风险的有效方法。确认的方法:测量、测试、检验,审查、产品评审、走查 6、WBS——工作分解的方法、作用P113 创建WBS所采用的方法:使用指导方针,类比法,自顶向下、自底向上 WBS的局限:不能显示活动之间的顺序,不能显示活动之间的依赖关系 WBS的表现形式:分级的树型结构,表格形式 WBS分解的详细程度:大项目:WBS分为总纲和子项目目录;小项目:WBS直接划分到工作包。 WBS的作用通及意义:将项目大的可交付物成果与项目工作划分为较小的和易管理的组成部分,详

(典型题)高考数学二轮复习-知识点总结-统计与统计案例

统计和统计案例 1.该部分常考内容:样本数字特征的计算、各种统计图表、线性回归方程、独立性检验等;有时也会在知识交汇点处命题,如概率和统计交汇等. 2.从考查形式上来看,大部分为选择题、填空题,重在考查基础知识、基本技能,有时在知识交汇点处命题,也会出现解答题,都属于中低档题. 1. 随机抽样 (1)简单随机抽样特点为从总体中逐个抽取,适用范围:总体中的个体较少. (2)系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取,适用范围:总体中的个体数较多. (3)分层抽样特点是将总体分成几层,分层进行抽取,适用范围:总体由差异明显的几部分组成. 2. 常用的统计图表 (1)频率分布直方图 ①小长方形的面积=组距× 频率 组距 =频率; ②各小长方形的面积之和等于1; ③小长方形的高=频率组距,所有小长方形的高的和为1 组距. (2)茎叶图 在样本数据较少时,用茎叶图表示数据的效果较好. 3. 用样本的数字特征估计总体的数字特征 (1)众数、中位数、平均数 数字特征 样本数据 频率分布直方图 众数 出现次数最多的数据 取最高的小长方形底边中点的横坐标 中位数 将数据按大小依次排列,处在最 中间位置的一个数据(或最中间两个数据的平均数) 把频率分布直方图划分左右两个面积相等的分界线和x 轴交点的横坐标 平均数 样本数据的算术平均数 每个小矩形的面积乘以小矩形底边中点的横坐标之和 (2)方差:s 2=n [(x 1-x )2+(x 2-x )2+…+(x n -x )2 ]. 标准差:

s = 1n [ x 1-x 2 +x 2-x 2 +…+x n -x 2 ]. 4. 变量的相关性和最小二乘法 (1)相关关系的概念、正相关和负相关、相关系数. (2)最小二乘法:对于给定的一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),通过求Q = i =1 n (y i -a -bx i )2 最小时,得到线性回归方程y ^ =b ^ x +a ^ 的方法叫做最小二乘法. 5. 独立性检验 对于取值分别是{x 1,x 2}和{y 1,y 2}的分类变量X 和Y ,其样本频数列联表是: y 1 y 2 总计 x 1 a b a +b x 2 c d c +d 总计 a +c b +d n 则K 2 = n ad -bc 2a +b c + d a +c b +d (其中n =a +b +c +d 为样本容量). 考点一 抽样方法 例1 (2012·山东)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C .则抽到的人中,做问卷B 的人数为 ( ) A .7 B .9 C .10 D .15 答案 C 分析 由系统抽样的特点知:抽取号码的间隔为 960 32 =30,抽取的号码依次为9,39,69,…,939.落入区间[451,750]的有459,489,…,729,这些数构成首项为459,公差为30的等差数列,设有n 项,显然有729=459+(n -1)×30,解得n =10.所以做问卷B 的有10人. 在系统抽样的过程中,要注意分段间隔,需要抽取几个个体,样本就需要分 成几个组,则分段间隔即为N n (N 为样本容量),首先确定在第一组中抽取的个体的号码数,再从后面的每组中按规则抽取每个个体.解决此类题目的关键是深刻理解各种抽样

高中数学知识点之统计及统计案例分析

高中数学知识点之统计及统计案例分析 第十一编统计、统计案例 §11.1 抽样方法 1.为了了解所加工的一批零件的长度,抽取其中200个零件并测量了其长度,在这个 问题中,总体的一个样本是 . 答案 200个零件的长度 2.某城区有农民、工人、知识分子家庭共计2 004户,其中农民家庭1 600户,工人 家庭303户,现要从中抽取容量为40的样本,则在整个抽样过程中,可以用到下列抽样 方法:①简单随机抽样,②系统抽样,③分层抽样中的 . 答案①②③ 3.某企业共有职工150人,其中高级职称15人,中级职称45人,初级职称90人.现 采用分层抽样抽取容量为30的样本,则抽取的各职称的人数分别为 . 答案 3,9,18 4.(2019·广东理)某校共有学生2 000名,各年级男、女生人数如下表.已知在全 校学生中随机抽取1名,抽到二年级女生的概率是0.19.现用分层抽样的方法在全校抽取 64名学生,则应在三年级抽取的学生人数为 . 女生男生 答案 16 5.某工厂生产A、B、C三种不同型号的产品,其相应产品数量之比为2∶3∶5,现用 分层抽样方法抽出一个容量为n的样本,样本中A型号产品有16件,那么此样本的容量 n= .答案 80 例1 某大学为了支援我国西部教育事业,决定从2019应届毕业生报名的18名志愿者中,选取6人组成志愿小组.请用抽签法和随机数表法设计抽样方案.解抽签法:第一步:将18名志愿者编号,编号为1,2,3, (18) 第二步:将18个号码分别写在18张外形完全相同的纸条上,并揉成团,制成号签; 第三步:将18个号签放入一个不透明的盒子里,充分搅匀;第四步:从盒子中逐个抽取 6个号签,并记录上面的编号;第五步:所得号码对应的志愿者,就是志愿小组的成员. 随机数表法: 第一步:将18名志愿者编号,编号为01,02,03, (18) 第二步:在随机数表中任选一数作为开始,按任意方向读数,比如第8行第29列的 数7开始,向右读; 第三步:从数7开始,向右读,每次取两位,凡不在01—18中的数,或已读过的数,都跳过去不作记录,依次可得到12,07,15,13,02,09.

高中数学统计案例分析及知识点归纳总结

统计 一、知识点归纳 1、抽样方法: ①简单随机抽样(总体个数较少) ②系统抽样(总体个数较多) ③分层抽样(总体中差异明显) 注意:在N 个个体的总体中抽取出n 个个体组成样本,每个个体被抽到的机会(概率)均为N n 。 2、总体分布的估计: ⑴一表二图: ①频率分布表——数据详实 ②频率分布直方图——分布直观 ③频率分布折线图——便于观察总体分布趋势 注:总体分布的密度曲线与横轴围成的面积为1。 ⑵茎叶图: ①茎叶图适用于数据较少的情况,从中便于看出数据的分布,以及中位数、众位数等。 ②个位数为叶,十位数为茎,右侧数据按照从小到大书写,相同的数据重复写。 3、总体特征数的估计: ⑴平均数:n x x x x x n ++++= 321; 取值为n x x x ,,,21 的频率分别为n p p p ,,,21 ,则其平均数为n n p x p x p x +++ 2211; 注意:频率分布表计算平均数要取组中值。 ⑵方差与标准差:一组样本数据n x x x ,,,21 方差:2 1 2)(1 ∑=-= n i i x x n s ; 标准差:2 1 )(1∑=-= n i i x x n s 注:方差与标准差越小,说明样本数据越稳定。 平均数反映数据总体水平;方差与标准差反映数据的稳定水平。 ⑶线性回归方程 ①变量之间的两类关系:函数关系与相关关系; ②制作散点图,判断线性相关关系 ③线性回归方程:a bx y +=∧ (最小二乘法) 1 221n i i i n i i x y nx y b x nx a y bx ==? -? ?=??-??=-??∑∑ 注意:线性回归直线经过定点),(y x 。

高中数学知识点完全总结(绝对全)

高中数学概念总结 一、 函数 1、 若集合A 中有n )(N n ∈个元素,则集合A 的所有不同的子集个数为n 2,所有非空真子集的个数是22-n 。 二次函数c bx ax y ++=2的图象的对称轴方程是a b x 2-=,顶点坐标是??? ? ? ?--a b ac a b 4422,。用待定系数法求二次函数的解析式时,解析式的设法有三种形式,即(一般式)c bx ax x f ++=2)(,(零点式))()()(21x x x x a x f -?-=和n m x a x f +-=2)()( (顶点式)。 2、 幂函数n m x y = ,当n 为正奇数,m 为正偶数, m

),(y x P ,点P 到原点的距离记为r ,则sin α= r y ,cos α=r x ,tg α=x y ,ctg α=y x ,sec α=x r ,csc α=y r 。 2、同角三角函数的关系中,平方关系是:1cos sin 2 2 =+αα,αα22sec 1=+tg ,αα22csc 1=+ctg ; 倒数关系是:1=?ααctg tg ,1csc sin =?αα,1sec cos =?αα; 相除关系是:αααcos sin = tg ,α α αsin cos =ctg 。 3、诱导公式可用十个字概括为:奇变偶不变,符号看象限。如:=-)23sin( απαcos -,)2 15(απ -ctg =αtg ,=-)3(απtg αtg -。 4、 函数B x A y ++=)sin(?ω),(其中00>>ωA 的最大值是B A +,最小值是A B -,周期是ω π 2= T ,频 率是πω2= f ,相位是?ω+x ,初相是?;其图象的对称轴是直线)(2 Z k k x ∈+=+π π?ω,凡是该图象与直线B y =的交点都是该图象的对称中心。 5、 三角函数的单调区间: x y s i n =的递增区间是??? ?? ? + -222 2πππ πk k ,)(Z k ∈,递减区间是????? ? ++23222ππππk k ,)(Z k ∈;x y cos =的递增区间是[]πππk k 22,-)(Z k ∈,递减区间是[]πππ+k k 22,)(Z k ∈,tgx y =的递增区间是 ??? ? ? +-22ππππk k ,)(Z k ∈,ctgx y =的递减区间是()πππ+k k ,)(Z k ∈。 6、=±)sin(βαβαβαsin cos cos sin ± =±)c o s (βαβαβαs i n s i n c o s c o s = ±)(βαtg β αβ αtg tg tg tg ?± 1 7、二倍角公式是:sin2α=ααcos sin 2? cos2α=αα2 2 sin cos -=1cos 22 -α=α2 sin 21- tg2α= α α 2 12tg tg -。

高中数学统计与统计案例概率知识点上课讲义

高中数学统计与统计案例概率知识点

统计与统计案例概率(文科) 知识点 1.抽样调查 (1)抽样调查 通常情况下,从调查对象中按照一定的方法抽取一部分,进行______,获取数据,并以此对调查对象的某项指标作出______,这就是抽样调查. (2)总体和样本 调查对象的称为总______体,被抽取的称为样______本. (3)抽样调查与普查相比有很多优点,最突出的有两点: ①______ ②节约人力、物力和财力. 2.简单随机抽样 (1)简单随机抽样时,要保证每个个体被抽到的概率. (2)通常采用的简单随机抽样的方法:_____ 3.分层抽样 (1)定义:将总体按其属性特征分成若干类型(有时称作层),然后在每个类型中按照所占比例随机抽取一定的样本.这种抽样方法通常叫作分层抽样,有时也称为类型抽样. (2)分层抽样的应用范围: 当总体是由差异明显的几个部分组成时,往往选用分层抽样. 4.系统抽样 系统抽样是将总体中的个体进行编号,等距分组,在第一组中按照简单随机抽样抽取第一个样本,然后按______(称为抽样距)抽取其他样本.这种抽样方法有时也叫等距抽样或机

械抽样. 5.统计图表 统计图表是______数据的重要工具,常用的统计图表有______ 6.数据的数字特征 (1)众数、中位数、平均数 众数:在一组数据中,出现次数最多的数据叫作这组数据的众数. 中位数:将一组数据按大小依次排列,把处在______位置的一个数据(或最中间两个数据的平均数)叫作这组数据的中位数. 平均数:样本数据的算术平均数,即x =1n (x 1+x 2+…+x n ). 在频率分布直方图中,中位数左边和右边的直方图的面积应该______ (2)样本方差 标准差s = 1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2], 其中x n 是样本数据的第n 项,n 是,______x 是______ 标准差是刻画数据的离散程度的特征数,样本方差是标准差的______.通常用样本方差估计总体方差,当______时,样本方差很接近总体方差. 7.用样本估计总体 (1)通常我们对总体作出的估计一般分成两种,一种是______,另一种______. (2)在频率分布直方图中,纵轴表示,______数据落在各小组内的频率用______表示,各小长方形的面积总和等于.______ (3)在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间.从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,称之为频率折线图. (4)当样本数据较少时,用茎叶图表示数据的效果较好,它没有信息的缺失,而且______,方便表示与比较.

最全高中数学知识点总结(最全集)

最全高中数学知识点总结(最全集) 引言 1.课程内容: 必修课程由5个模块组成: 必修1:集合、函数概念与基本初等函数(指、对、幂函数) 必修2:立体几何初步、平面解析几何初步。 必修3:算法初步、统计、概率。 必修4:基本初等函数(三角函数)、平面向量、三角恒等变换。 必修5:解三角形、数列、不等式。 以上是每一个高中学生所必须学习的。 上述内容覆盖了高中阶段传统的数学基础知识和基本技能的主要部分,其中包括集合、函数、数列、不等式、解三角形、立体几何初步、平面解析几何初步等。不同的是在保证打好基础的同时,进一步强调了这些知识的发生、发展过程和实际应用,而不在技巧与难度上做过高的要求。 此外,基础内容还增加了向量、算法、概率、统计等内容。 选修课程有4个系列: 系列1:由2个模块组成。 选修1—1:常用逻辑用语、圆锥曲线与方程、导数及其应用。 选修1—2:统计案例、推理与证明、数系的扩充与复数、框图 系列2:由3个模块组成。 选修2—1:常用逻辑用语、圆锥曲线与方程、 空间向量与立体几何。 选修2—2:导数及其应用,推理与证明、数系的扩充与复数 选修2—3:计数原理、随机变量及其分布列,统计案例。 系列3:由6个专题组成。 选修3—1:数学史选讲。 选修3—2:信息安全与密码。 选修3—3:球面上的几何。 选修3—4:对称与群。 选修3—5:欧拉公式与闭曲面分类。 选修3—6:三等分角与数域扩充。 系列4:由10个专题组成。 选修4—1:几何证明选讲。 选修4—2:矩阵与变换。 选修4—3:数列与差分。 选修4—4:坐标系与参数方程。 选修4—5:不等式选讲。 选修4—6:初等数论初步。 选修4—7:优选法与试验设计初步。 选修4—8:统筹法与图论初步。 选修4—9:风险与决策。 选修4—10:开关电路与布尔代数。

高考知识点变量间的相关关系与统计案例

第3节变量间的相关关系与统计案例 最新考纲 1.会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系;2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(线性回归方程系数公式不要求记忆);3.了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用;4.了解回归分析的基本思想、方法及其简单应用. 知识梳理 1.相关关系与回归分析 回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法;判断相关性的常用统计图是:散点图;统计量有相关系数与相关指数. (1)在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关. (2)在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关. (3)如果散点图中点的分布从整体上看大致在一条直线附近,称两个变量具有线性相关关系. 2.线性回归方程 (1)最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法. (2)回归方程:两个具有线性相关关系的变量的一组数据:(x1,y1),(x2,y2),…,(x n,y n),其回归方程为y^=b^x+a^,则 ^是回归方程的斜率,a^是在y轴上的截距. 其中,b 回归直线一定过样本点的中心(x,y). 3.回归分析

(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法. (2)样本点的中心:对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其中(x ,y )称为样本点的中心. (3)相关系数 当r >0时,表明两个变量正相关; 当r <0时,表明两个变量负相关. r 的绝对值越接近于1,表明两个变量的线性相关性越强. r 的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r |大于0.75时,认为两个变量有很强的线性相关性. (4)相关指数: 其中21()n i i i y y =-∑是残差平方和,其值越小, 则R 2越大(接近1),模型的拟合效果越好. 4.独立性检验 (1)利用随机变量K 2来判断“两个分类变量有关系”的方法称为独立性检验. (2)列联表:列出的两个分类变量的频数表,称为列联表.假设有两个分类变量X 和Y ,它们的可能取值分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(2×2列联表)为 则随机变量K 2 =n (ad -bc )2 (a +b )(a +c )(b +d )(c +d ),其中n =a +b +c +d 为样 本容量. [常用结论与微点提醒] 1.求解回归方程的关键是确定回归系数a ^,b ^,应充分利用回归直线过样本中心点 (x ,y ). 2.根据K 2的值可以判断两个分类变量有关的可信程度,若K 2越大,则两分类变

高考数学二轮复习-统计与统计案例知识点总结

统计与统计案例 1.该部分常考内容:样本数字特征的计算、各种统计图表、线性回归方程、独立性检验等;有时也会在知识交汇点处命题,如概率与统计交汇等. 2.从考查形式上来看,大部分为选择题、填空题,重在考查基础知识、基本技能,有时在知识交汇点处命题,也会出现解答题,都属于中低档题. 1.随机抽样 (1)简单随机抽样特点为从总体中逐个抽取,适用范围:总体中的个体较少. (2)系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取,适用范围:总体中的个体数较多. (3)分层抽样特点是将总体分成几层,分层进行抽取,适用范围:总体由差异明显的几部分组成. 2.常用的统计图表 (1)频率分布直方图 ①小长方形的面积=组距× 频率 组距 =频率; ②各小长方形的面积之和等于1; ③小长方形的高=频率组距,所有小长方形的高的和为1 组距. (2)茎叶图 在样本数据较少时,用茎叶图表示数据的效果较好. 3.用样本的数字特征估计总体的数字特征 (1)众数、中位数、平均数 (2)方差:s 2=n [(x 1-x )2+(x 2-x )2+…+(x n -x )2 ]. 标准差:

s = 1n [ x 1-x 2+ x 2-x 2+…+ x n -x 2 ]. 4.变量的相关性与最小二乘法 (1)相关关系的概念、正相关和负相关、相关系数. (2)最小二乘法:对于给定的一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),通过求Q = i =1 n (y i -a -bx i )2 最小时,得到线性回归方程y ^ =b ^ x +a ^ 的方法叫做最小二乘法. 5.独立性检验 对于取值分别是{x 1,x 2}和{y 1,y 2}的分类变量X 和Y ,其样本频数列联表是: 则K 2 =n a +b c +d a +c b +d (其中n =a +b +c +d 为样本容量). 考点一 抽样方法 例1 (2012·山东)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机 编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C .则抽到的人中,做问卷B 的人数为 ( ) A .7 B .9 C .10 D .15 答案 C 解析 由系统抽样的特点知:抽取号码的间隔为 960 32 =30,抽取的号码依次为9,39,69,…,939.落入区间[451,750]的有459,489,…,729,这些数构成首项为459,公差为30的等差数列,设有n 项,显然有729=459+(n -1)×30,解得n =10.所以做问卷B 的有10人. 在系统抽样的过程中,要注意分段间隔,需要抽取几个个体,样本就需要分 成几个组,则分段间隔即为N n (N 为样本容量),首先确定在第一组中抽取的个体的号码数,再从后面的每组中按规则抽取每个个体.解决此类题目的关键是深刻理解各种抽样方法的特点和适用范围.但无论哪种抽样方法,每一个个体被抽到的概率都是相等的,

(完整版)高考数学高考必备知识点总结精华版

高考前重点知识回顾 第一章-集合 (一)、集合:集合元素的特征:确定性、互异性、无序性. 1、集合的性质:①任何一个集合是它本身的子集,记为A A ?; ②空集是任何集合的子集,记为A ?φ; ③空集是任何非空集合的真子集; ①n 个元素的子集有2n 个. n 个元素的真子集有2n -1个. n 个元素的非空真子集有2n -2个. [注]①一个命题的否命题为真,它的逆命题一定为真.否命题?逆命题. ②一个命题为真,则它的逆否命题一定为真. 原命题?逆否命题. 2、集合运算:交、并、补.{|,} {|}{,} A B x x A x B A B x x A x B A x U x A ?∈∈?∈∈?∈?I U U 交:且并:或补:且C (三)简易逻辑 构成复合命题的形式:p 或q(记作“p ∨q ” );p 且q(记作“p ∧q ” );非p(记作“┑q ” ) 。 1、“或”、 “且”、 “非”的真假判断 4、四种命题的形式及相互关系: 原命题:若P 则q ; 逆命题:若q 则p ; 否命题:若┑P 则┑q ;逆否命题:若┑q 则┑p 。 ①、原命题为真,它的逆命题不一定为真。 ②、原命题为真,它的否命题不一定为真。

③、原命题为真,它的逆否命题一定为真。 6、如果已知p ?q 那么我们说,p 是q 的充分条件,q 是p 的必要条件。 若p ?q 且q ?p,则称p 是q 的充要条件,记为p ?q. 第二章-函数 一、函数的性质 (1)定义域: (2)值域: (3)奇偶性:(在整个定义域内考虑) ①定义:①偶函数:)()(x f x f =-,②奇函数:)()(x f x f -=- ②判断方法步骤:a.求出定义域;b.判断定义域是否关于原点对称;c.求)(x f -;d.比较)()(x f x f 与-或)()(x f x f --与的关系。 (4)函数的单调性 定义:对于函数f(x)的定义域I 内某个区间上的任意两个自变量的值x 1,x 2, ⑴若当x 1f(x 2),则说f(x) 在这个区间上是减函数. 二、指数函数与对数函数 指数函数)10(≠>=a a a y x 且的图象和性质

高中数学选修1-2《统计案例》知识点讲义教学内容

第一章统计案例一、回归分析的基本思想及其初步应用 1、数学变量相关关系 的定义:当一个或几个相互联系的变量取一定的数值时,与之相对应的另一变量的值虽然不 确定,但它仍按某种规律在一定的范围内变化。变量间的这种相互关系,称为具有不确定性的相关关系. (1)按方向分类 ①正相关:两个变量的变化趋势相同,从散点图可以看出各点散布的位置是从左下角到右上角的区域,即一个变量的值由小变大时,另一个变量的值也由小变大。 ②负相关:两个变量的变化趋势相反,从散点图可以看出各点散布的位置是从左上角到右下角的区域,即一个变量的值由小变大时,另一个变量的值由大变小。 正相关负相关不相关 (2)相关性系数r(在《必修3》中有介绍) 用相关系数r来衡量两个变量之间的相关关系 ()() ()() 1 22 11 n i i i n n i i i i x x y y r x x y y = == -- = -- ∑ ∑∑

2、两变量之间的关系存在两种不同的类型 (1)相关关系——非确定性关系 (2)函数关系——确定性关系 3、回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法。 其基本步骤是:①画出两个变量的散点图; ②求回归直线方程; ③并用回归直线方程进行预报。 4、回归直线方程:∧ ∧∧+=a x b y ?? ?? ????? -=--=---=∧∧====∧∑∑∑∑x b y a x n x y x n y x x x y y x x b n i i n i i i n i i n i i i ,)())((1 221121 ()()()10.00,2,. b b r x y ≠==说明:回归系数因为当时,相关系数这时不具有线性相关关系. 称为样本点的中心,回归直线必定经过样本点的中心

高考数学必考知识点总结归纳

高考数学必考知识点总结归纳 1. 对于集合,一定要抓住集合的代表元素,及元素的“确定性、互异性、无序性”。 {}{}{}如:集合,,,、、A x y x B y y x C x y y x A B C ======|lg |lg (,)|lg 中元素各表示什么? 2. 进行集合的交、并、补运算时,不要忘记集合本身和空集的特殊情况。?注重借助于数轴和文氏图解集合问题。 空集是一切集合的子集,是一切非空集合的真子集。 {} {}如:集合,A x x x B x ax =--===||22301 若,则实数的值构成的集合为 B A a ? (答:,,)-??? ??? 1013 3. 注意下列性质: {} ()集合,,……,的所有子集的个数是;1212a a a n n (3)德摩根定律: ()()()()()()C C C C C C U U U U U U A B A B A B A B Y I I Y ==, 4. 你会用补集思想解决问题吗?(排除法、间接法) 的取值范围。 5. 可以判断真假的语句叫做命题,逻辑连接词有“或”,“且”和()()∨∧“非”().? 若为真,当且仅当、均为真p q p q ∧

若为真,当且仅当、至少有一个为真 ∨ p q p q ?p p 若为真,当且仅当为假 6. 命题的四种形式及其相互关系是什么? (互为逆否关系的命题是等价命题。) 原命题与逆否命题同真、同假;逆命题与否命题同真同假。 7. 对映射的概念了解吗?映射f:A→B,是否注意到A中元素的任意性和B中与之对应元素的唯一性,哪几种对应能构成映射? (一对一,多对一,允许B中有元素无原象。) 8. 函数的三要素是什么?如何比较两个函数是否相同? (定义域、对应法则、值域) 9. 求函数的定义域有哪些常见类型? 10. 如何求复合函数的定义域? [] 0义域是_。 >->=+- f x a b b a F(x f x f x 如:函数的定义域是,,,则函数的定 ())()() [] - a a (答:,) 11. 求一个函数的解析式或一个函数的反函数时,注明函数的定义域了吗? 12. 反函数存在的条件是什么? (一一对应函数) 求反函数的步骤掌握了吗?

(完整版)数学知识点--考点14--统计与统计案例

极差 组数、组距 分组 列表 咼频率/组距 面积=频率= 频数 样本容量 小矩形面积和=1 统计与统计案例 1. 统计的基本思想是用部份来估计总体。 2. 统计中所考察的对象的全体构成的集合看做总体, 构成总体的每个元素作为个体,从总 体中抽取的一部份个体所组成的集合叫做样本,样本中个体的数目叫做样本容量。 一、抽样方法 2.图形特征 1) 茎叶图 2) 直方图 、用样本估计总体 1.数字特征 注意: 2 2 i am b ,贝U i 的平均数为ax b ,方差为a s

3)条形图与直方图的区别:直方图中矩形通常连续排列,条形图则是分开排开; 直方图是用面积表示各 组频率的多少, 高表示每一组的频率除以组距, 组距,条形图的高表示频数的多少,其宽是固定的,表示类别。 三、变量间的相关关系 确定关系:函数关系 2.样本相关系数r : r 0.75时,认为两个变量有很强的线性相关关系。 3. 最小二乘法:使得样本数据的点到回归直线的距离平方和最小的方法。 过样本中心X, y 2 2 6. 相关指数R : R 的值越大,说明残差平方和越小,即模型的拟合效果起好。 回归效果越好。 7. 回归方程:只适用于研究的样本的总体;具有时间性;样本的取值范围会影响总 体的范围;预报值与精 确值往往不一样。 8. 步骤 宽表示 关系 非确定:相关关系 回归分析 散点图 回归曲线 回归直线 y $x $b X i y i i 1 nxy -2 x y i y X i nx 5.随机误差 e y bX i a 估计值 残差 y i bX i $ 残差分析 形:残差图 数:R 2 0,1 线性回归模型中, R 2表示解释变量对预报变量的贡献率, R 2越接近于 1,表示

高中数学选修1-2《统计案例》知识点讲义汇编

第一章 统计案例 一、回归分析的基本思想及其初步应用 1、数学变量相关关系的定义:当一个或几个相互联系的变量取一定的数值时,与之相对应的另一变量的值虽然不确定,但它仍按某种规律在一定的范围内变化。变量间的这种相互关系,称为具有不确定性的相关关系. (1)按方向分类 ①正相关:两个变量的变化趋势相同,从散点图可以看出各点散布的位置是从左下角到右上角的区域,即一个变量的值由小变大时,另一个变量的值也由小变大。 ②负相关:两个变量的变化趋势相反,从散点图可以看出各点散布的位置是从左上角到右下角的区域,即一个变量的值由小变大时,另一个变量的值由大变小。 正相关 负相关 不相关 (2)相关性系数r (在《必修3》中有介绍) 用相关系数r 来衡量两个变量之间的相关关系 ()() ()() 1 2 2 1 1 n i i i n n i i i i x x y y r x x y y ===--= --∑∑∑

2、两变量之间的关系存在两种不同的类型 (1)相关关系——非确定性关系 (2)函数关系——确定性关系 3、回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法。 其基本步骤是:①画出两个变量的散点图; ②求回归直线方程; ③并用回归直线方程进行预报。 4、回归直线方程:∧ ∧∧+=a x b y ?? ?? ????? -=--=---=∧∧====∧∑∑∑∑x b y a x n x y x n y x x x y y x x b n i i n i i i n i i n i i i ,)())((1 221121 ()()()10.00,2,. b b r x y ≠==说明:回归系数因为当时,相关系数这时不具有线性相关关系. 称为样本点的中心,回归直线必定经过样本点的中心

人教版高中数学【选修2-3】[知识点整理及重点题型梳理]-《统计案例》单元复习巩固

人教版高中数学选修2-3 知识点梳理 重点题型(常考知识点)巩固练习 《统计案例》单元复习巩固 【学习目标】 1. 了解独立性检验(只要求2×2列联表)的基本思想、方法及初步应用. 2. 通过典型案例的探究,了解实际推断原理和假设检验的基本思想、方法及初步应用. 3. 通过对实际问题的分析,了解回归分析的必要性与回归分析的一般步骤. 4. 能作出散点图,能求其回归直线方程。 5. 会用所学的知识对简单的实际问题进行回归分析。 【知识网络】 【要点梳理】 要点一、分类变量 有一种变量,这种变量所取不同的“值”表示的是个体所属不同类别,称这种变量为分类变量。 要点诠释: (1)对分类变量的理解。 这里的“变量”和“值”都应作为广义的“变量”和“值”进行理解。例如:“性别变量”有“男”和“女”两种类别,这里的变量指的是性别,同样这里的“值”指的是“男”和“女”。因此,这里所说的“变量”和“值”取的不一定是具体的数值。 (2)分类变量可以有多种类别。例如:吸烟变量有“吸烟”与“不吸烟”两种类别,而国籍变量则有多种类别。 要点二、2×2列联表 1. 列联表 用表格列出的分类变量的频数表,叫做列联表。 2. 2×2列联表 对于两个事件A,B,列出两个事件在两种状态下的数据,如下表所示:

这样的表格称为2×2列联表。 要点三:卡方统计量公式 为了研究分类变量X 与Y 的关系,经调查得到一张2×2列联表,如下表所示 统计中有一个有用的(读做“卡方”)统计量,它的表达式是: 22 ()()()()() n ad bc K a b c d a c b d -=++++(n a b c d =+++为样本容量)。 要点四、独立性检验 1. 独立性检验 通过2×2列联表,再通过卡方统计量公式计算2K 的值,利用随机变量2K 来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验。 2. 变量独立性的判断 通过对2 K 统计量分布的研究,已经得到两个临界值:3.841和6.635。当数据量较大时,在统计中,用以下结果对变量的独立性进行判断: ①如果2K ≤3.841时,认为事件A 与B 是无关的。 ②如果2K >3.841时,有95%的把握说事件A 与事件B 有关; ③如果2K >6.635时,有99%的把握说事件A 与事件B 有关; 要点诠释: (1)独立性检验一般是指通过计算2 K 统计量的大小对两个事件是否有关进行判断; (2)独立性检验的基本思想类似于反证法。即在H 0:事件A 与B 无关的统计假设下,利用2 K 统计量的大小来决定在多大程度上拒绝原来的统计假设H 0,即拒绝“事件A 与B 无关”,从而认为事件A 与B 有关。独立性检验为假设检验的特例。 (3)利用独立性检验可以考察两个分类变量是否有关,并且能较精确地给出这种判断的把

高中数学统计统计案例知识点总结和典例

高中数学统计统计案例知识点总结和典例 标准化管理处编码[BBX968T-XBB8968-NNJ668-MM9N]

统计 一.简单随机抽样:抽签法和随机数法 1.一般地,设一个总体含有N个个体(有限),从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等(n/N),就把这种抽样方法叫做简单随机抽样。 2.一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本,这种抽样方法叫做抽签法。 抽签法的一般步骤:a、将总体的个体编号。 b、连续抽签获取样本号码。 3. 利用随机数表、随机数骰子或计算机产生的随机数进行抽样,叫随机数表法。 随机数表法的步骤:a、将总体的个体编号。b、在随机数表中选择开始数字。c、读数获取样本号码。 4. 抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力,又不方便,如果标号的签搅拌得不均匀,会导致抽样不公平,随机数表法的优点与抽签法相同,缺点上当总体容量较大时,仍然不是很方便,但是比抽签法公平,因此这两种方法只适合总体容量较少的抽样类型。 二.系统抽样: 1.一般地,要从容量为N的总体中抽取容量为n的样本,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样的方法叫做系统抽样。 系统抽样的一般步骤: (1)采用随机抽样的方法将总体中的N个个编号。

(2)将整体按编号进行分段,确定分段间隔k=N/n。(k∈N,L≤k). (3)在第一段用简单随机抽样确定起始个体的编号L(L∈N,L≤k)。 (4)按照一定的规则抽取样本,通常是将起始编号L加上间隔k得到第2个个体编号L+K,再加上K得到第3个个体编号L+2K,这样继续下去,直到获取整个样本。 在确定分段间隔k时应注意:分段间隔k为整数,当N/n不是整数时,应采用等可能剔除的方剔除部分个体,以获得整数间隔k。 三.分层抽样: 1.一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样的方法叫分层抽样。 分层抽样的步骤: (1)分层:按某种特征将总体分成若干部分。(2)按比例确定每层抽取个体的个数。 (3)各层分别按简单随机抽样的方法抽取。(4)综合每层抽样,组成样本。 2.分层抽样是当总体由差异明显的几部分组成时采用的抽样方法,进行分层抽样时应注意以下几点: (1)分层抽样中分多少层、如何分层要视具体情况而定,总的原则是,层内样本的差异要小,面层之间的样本差异要大,且互不重叠。 (2)为了保证每个个体等可能入样,所有层应采用同一抽样比等可能抽样。 (3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样。

相关文档
最新文档