高考数学二轮复习-统计与统计案例知识点总结

高考数学二轮复习-统计与统计案例知识点总结
高考数学二轮复习-统计与统计案例知识点总结

统计与统计案例

1.该部分常考内容:样本数字特征的计算、各种统计图表、线性回归方程、独立性检验等;有时也会在知识交汇点处命题,如概率与统计交汇等.

2.从考查形式上来看,大部分为选择题、填空题,重在考查基础知识、基本技能,有时在知识交汇点处命题,也会出现解答题,都属于中低档题.

1.随机抽样

(1)简单随机抽样特点为从总体中逐个抽取,适用范围:总体中的个体较少. (2)系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取,适用范围:总体中的个体数较多.

(3)分层抽样特点是将总体分成几层,分层进行抽取,适用范围:总体由差异明显的几部分组成. 2.常用的统计图表

(1)频率分布直方图 ①小长方形的面积=组距×

频率

组距

=频率; ②各小长方形的面积之和等于1;

③小长方形的高=频率组距,所有小长方形的高的和为1

组距.

(2)茎叶图

在样本数据较少时,用茎叶图表示数据的效果较好. 3.用样本的数字特征估计总体的数字特征

(1)众数、中位数、平均数

(2)方差:s 2=n

[(x 1-x )2+(x 2-x )2+…+(x n -x )2

].

标准差:

s =

1n

[ x 1-x 2+ x 2-x 2+…+ x n -x 2

].

4.变量的相关性与最小二乘法

(1)相关关系的概念、正相关和负相关、相关系数.

(2)最小二乘法:对于给定的一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),通过求Q

= i =1

n

(y i -a -bx i )2

最小时,得到线性回归方程y ^

=b ^

x +a ^

的方法叫做最小二乘法.

5.独立性检验

对于取值分别是{x 1,x 2}和{y 1,y 2}的分类变量X 和Y ,其样本频数列联表是:

则K 2

=n a +b c +d a +c b +d

(其中n =a +b +c +d 为样本容量).

考点一 抽样方法

例1 (2012·山东)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机

编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C .则抽到的人中,做问卷B 的人数为

( )

A .7

B .9

C .10

D .15

答案 C

解析 由系统抽样的特点知:抽取号码的间隔为

960

32

=30,抽取的号码依次为9,39,69,…,939.落入区间[451,750]的有459,489,…,729,这些数构成首项为459,公差为30的等差数列,设有n 项,显然有729=459+(n -1)×30,解得n =10.所以做问卷B 的有10人.

在系统抽样的过程中,要注意分段间隔,需要抽取几个个体,样本就需要分

成几个组,则分段间隔即为N

n

(N 为样本容量),首先确定在第一组中抽取的个体的号码数,再从后面的每组中按规则抽取每个个体.解决此类题目的关键是深刻理解各种抽样方法的特点和适用范围.但无论哪种抽样方法,每一个个体被抽到的概率都是相等的,

都等于样本容量和总体容量的比值.

(1)(2013·江西)总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为

( )

(2)某单位200名职工的年龄分布情况如图所示,现要从中抽取40名职工作样本.用系统抽样法,将全体职工随机按1~200编号,并按编号顺序平均分为40组(1~5号,6~10号,…,196~200号).若第5组抽出的号码为22,则第8组抽出的号码应是________.若用分层抽样方法,则40岁以下年龄段应抽取________人.

答案(1)D (2)37 20

解析(1)从第1行第5列、第6列组成的数65开始由左到右依次选出的数为:08,02,14,07,01,所以第5个个体编号为01.

(2)由分组可知,抽号的间隔为5,又因为第5组抽出的号码为22,即第n组抽取的号码为5n-3,所以第8组抽出的号码为37;40岁以下年龄段的职工数为200×0.5=100,

则应抽取的人数为40

200

×100=20人.

考点二用样本估计总体

例2 (1)(2013·四川)某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示,以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是

( )

(2)(2013·江苏)抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:

答案(1)A (2)2

解析(1)由于频率分布直方图的组距为5,去掉C、D,又[0,5),[5,10)两组各一人,

去掉B ,应选A.

(2)x 甲=1

5

(87+91+90+89+93)=90,

x 乙=1

5

(89+90+91+88+92)=90,

s 2甲=15[(87-90)2+(91-90)2+(90-90)2+(89-90)2+(93-90)2

]=4,

s 2乙=15

[(89-90)2+(90-90)2+(91-90)2+(88-90)2+(92-90)2

]=2.

(1)反映样本数据分布的主要方式有:频率分布表、频率分布直方图、茎叶图.关于频率分布直方图要明确每个小矩形的面积即为对应的频率,其高低能够描述频率的大小,高考中常常考查频率分布直方图的基本知识,同时考查借助频率分布直方图估计总体的概率分布和总体的特征数,具体问题中要能够根据公式求解数据的均值、众数和中位数、方差等.

(2)由样本数据估计总体时,样本方差越小,数据越稳定,波动越小.

在“2012魅力新安江”青少年才艺表演评比活动中,参赛选手成绩的茎叶图和频率分布直方图都受到不同程度的破坏,可见部分如图,据此回答以下问题:

(1)求参赛总人数和频率分布直方图中[80,90)之间的矩形的高,并完成直方图; (2)若要从分数在[80,100]之间任取两份进行分析,在抽取的结果中,求至少有一份分数在[90,100]之间的概率.

解 (1)由茎叶图知,分数在[50,60)之间的频数为2. 由频率分布直方图知,分数在[50,60)之间的频率为 0.008×10=0.08.

所以参赛总人数为20.08

=25(人).

分数在[80,90)之间的人数为25-2-7-10-2=4(人), 分数在[80,90)之间的频率为

4

25

=0.16, 得频率分布直方图中[80,90)间矩形的高为0.16

10=0.016.

完成直方图,如图.

(2)将[80,90)之间的4个分数编号为1,2,3,4;[90,100]之间的2个分数编号为5和6. 则在[80,100]之间任取两份的基本事件为(1,2),(1,3),(1,4),(1,5),(1,6),(2,3),

(2,4),(2,5),(2,6),(3,4),(3,5),(3,6),(4,5),(4,6),(5,6),共15个, 其中至少有一个在[90,100]之间的基本事件为(1,5),(1,6),(2,5),(2,6),(3,5),(3,6),(4,5),(4,6),(5,6),共9个. 故至少有一份分数在[90,100]之间的概率是915=3

5.

考点三 统计案例

例3 (2013·重庆)从某居民区随机抽取10个家庭,获得第i 个家庭的月收入x i (单位:千

元)与月储蓄y i (单位:千元)的数据资料,算得∑i =1

10

x i =80,∑i =1

10

y i =20,∑i =1

10

x i y i =184,∑i =1

10

x

2

i

=720.

(1)求家庭的月储蓄y 对月收入x 的线性回归方程y =bx +a ; (2)判断变量x 与y 之间是正相关还是负相关;

(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.

附:线性回归方程y =bx +a 中,b =

∑i =1

n

x i y i -n x y

∑i =1

n

x 2i -n x 2

,a =y -b x ,其中x ,y 为样

本平均值,线性回归方程也可写为y ^=b ^x +a ^

. 解 (1)由题意知n =10,x =

1

n ∑i =1

n

x i =80

10

=8,

y =

1

n ∑i =1

n

y i =20

10

=2,

又l xx =∑i =1

n

x 2

i -n x 2

=720-10×82

=80,

l xy =∑i =1

n

x i y i -n x y =184-10×8×2=24,

由此得b =

l xy l xx =24

80

=0.3, a =y -b x =2-0.3×8=-0.4,

故所求线性回归方程为y =0.3x -0.4.

(2)由于变量y 的值随x 值的增加而增加(b =0.3>0),

故x 与y 之间是正相关.

(3)将x =7代入回归方程可以预测该家庭的月储蓄为y =0.3×7-0.4=1.7(千元).

(1)对具有线性相关关系的两个变量可以用最小二乘法求线性回归方程,求b ^

是关键,

其中b ^

∑i =1

n

x i -x

y i -y

∑i =1

n

x i -x 2

∑i =1

n

x i y i -n x y

∑i =1

n

x 2i -n x 2

.

(2)在利用统计变量K 2

(χ2

)进行独立性检验时,应该注意数值的准确代入和正确计算,最后把计算的结果与有关临界值相比较.

(1)通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:

由K 2

(χ2

)=

a +

b

c +

d a +c b +d

算得,

K 2

(χ2

)=110× 40×30-20×20

2

60×50×60×50

≈7.8.

附表:

( )

A .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”

B .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”

C .有99%以上的把握认为“爱好该项运动与性别有关”

D .有99%

以上的把握认为“爱好该项运动与性别无关” (2)已知x 、y 取值如下表:

从所得的散点图分析可知:y 与x 线性相关,且y =0.95x +a ,则a 等于 ( )

A .1.30

B .1.45

C .1.65

D .1.80 答案 (1)C (2)B

解析 (1)根据独立性检验的定义,由K 2(χ2

)≈7.8>6.635可知我们有99%以上的把握

认为“爱好该项运动与性别有关”,故选C. (2)依题意得,x =1

6

×(0+1+4+5+6+8)=4,

y =16

(1.3+1.8+5.6+6.1+7.4+9.3)=5.25;

又直线y ^

=0.95x +a ^

必过样本点中心(x ,y ),即点(4,5.25),于是有5.25=0.95×4

+a ^

,由此解得a ^

=1.45.

1.用样本估计总体

(1)在频率分布直方图中,各小长方形的面积表示相应的频率,各小长方形的面积的和为1.

(2)众数、中位数及平均数的异同

众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量. (3)当总体的个体数较少时,可直接分析总体取值的频率分布规律而得到总体分布;当总体容量很大时,通常从总体中抽取一个样本,分析它的频率分布,以此估计总体分布. ①总体期望的估计,计算样本平均值x =1n

∑n i =1

x i . ②总体方差(标准差)的估计:

方差=1n

∑n i =1

(x i -x )2,标准差=方差, 方差(标准差)较小者较稳定.

2.线性回归方程y ^

=b ^

x +a ^

过样本点中心(x ,y ),这为求线性回归方程带来很多方便. 3.独立性检验

(1)作出2×2列联表. (2)计算随机变量K 2

(χ2

)的值. (3)查临界值,检验作答.

1.经问卷调查,某班学生对摄影分别持“喜欢”、“不喜欢”和“一般”三种态度,其中

持“一般”态度的学生比持“不喜欢”的学生多12人,按分层抽样的方法(抽样过程中不需要剔除个体)从全班选出部分学生进行关于摄影的座谈.若抽样得出的9位同学中有5位持“喜欢”态度的同学,1位持“不喜欢”态度的同学和3位持“一般”态度的

同学,则全班持“喜欢”态度的同学人数为 ( )

A .6

B .18

C .30

D .54

答案 C

解析 由题意设全班学生为x 人,持“喜欢”、“不喜欢”和“一般”态度的学生分别占全班人数的59、19、13,所以x (13-1

9)=12,解得x =54,所以全班持“喜欢”态度的人

数为54×5

9

=30.故选C.

2.某校从参加高三年级期中考试的学生中随机抽取60名学生,将其数学成绩(均为整数)

分成六段[40,50),[50,60),…,[90,100]后得到如图的频率分布直方图,请你根据频率分布直方图中的信息,估计出本次考试数学成绩的平均分为________.

答案 71

解析 由频率分布直方图得每一组的频率依次为0.1,0.15,0.15,0.3,0.25,0.05,又由频率分布直方图,得每一组数据的中点值依次为45,55,65,75,85,95.

所以本次考试数学成绩的平均分为x =45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71. 故填71.

3. 随机抽取某中学甲、乙两班各10名同学,测量他们的身高(单

位:cm),获得身高数据的茎叶图如图. (1)根据茎叶图判断哪个班的平均身高较高; (2)计算甲班的样本方差;

(3)现从乙班这10名同学中随机抽取两名身高不低于173 cm 的同学,求身高为176 cm 的同学被抽中的概率.

解 (1)由茎叶图可知:甲班身高集中于160 cm ~179 cm 之间,而乙班身高集中于170 cm ~180 cm 之间,因此乙班平均身高高于甲班,其中

x 甲=

158+162+163+168+168+170+171+179+179+182

10

=170,

x 乙=

159+162+165+168+170+173+176+178+179+181

10

=171.1.

(2)甲班的样本方差为

110

[(158-170)2+(162-170)2+(163-170)2+(168-170)2

+(168-170)2

+(170-170)2

+(171-170)2

+(179-170)2

+(179-170)2

+(182-170)2

]

=57.2.

(3)设身高为176 cm 的同学被抽中的事件为A .

从乙班10名同学中抽取两名身高不低于173 cm 的同学有:(181,173)、(181,176)、(181,178)、(181,179)、(179,173)、(179,176)、(179,178)、(178,173)、(178,176)、(176,173),共10个基本事件,而事件A 含有4个基本事件, ∴P (A )=410=2

5

.

(推荐时间:60分钟)

一、选择题

1.要完成下列两项调查:①从某肉联厂的火腿肠生产线上抽取1 000根火腿肠进行“瘦肉

精”检测;②从某中学的15名艺术特长生中选出3人调查学习负担情况.适合采用的抽样方法依次为

( )

A .①用分层抽样,②用简单随机抽样

B .①用系统抽样,②用简单随机抽样

C .①②都用系统抽样

D .①②都用简单随机抽样 答案 B

解析 ①中总体容量较大,且火腿肠之间没有明显差异,故适合采用系统抽样;②中总体容量偏小,故适合采用简单随机抽样.

2.(2012·四川)交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,

对甲、乙、丙、丁四个社区做分层抽样调查.假设四个社区驾驶员的总人数为N ,其中甲社区有驾驶员96人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数N 为

( )

A .101

B .808

C .1 212

D .2 012 答案 B

解析 由题意知抽样比为12

96,而四个社区一共抽取的驾驶员人数为12+21+25+43=

101,

故有1296=101

N

,解得N =808.

3.(2013·福建)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6

组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为

( )

A .588

B .480

C .450

D .120

答案 B

解析 少于60分的学生人数600×(0.05+0.15)=120(人), ∴不少于60分的学生人数为480人.

4.甲、乙两位运动员在5场比赛的得分情况如茎叶图所示,记甲、乙两人的平均得分分别

为x 甲,x 乙,则下列判断正确的是

( )

A.x 甲>x 乙;甲比乙成绩稳定

B.x 甲>x 乙;乙比甲成绩稳定

C.x 甲

D.x 甲

解析 由茎叶图可知

x 甲=17+16+28+30+34

5=25,

x 乙=

15+28+26+28+33

5

=26,

∴x 甲

又s 2甲=15

[(17-25)2+(16-25)2+(28-25)2+(30-25)2+(34-25)2

]=52,

s 2乙=1

5

[(15-26)2+(28-26)2+(26-26)2+(28-26)2+(33-26)2

]=35.6,

∴乙比甲成绩稳定.

5.一个样本容量为10的样本数据,它们组成一个公差不为0的等差数列{a n },若a 3=8,

且a 1,a 3,a 7成等比数列,则此样本的平均数和中位数分别是 ( )

A .13,12

B .13,13

C .12,13

D .13,14

答案 B

解析 设等差数列{a n }的公差为d (d ≠0),a 3=8,a 1a 7=a 2

3=64,(8-2d )(8+4d )=64,

(4-d )(2+d )=8,2d -d 2

=0,又d ≠0,故d =2,故样本数据为4,6,8,10,12,14,16,18,20,22,样本的平均数为 4+22 ×510=13,中位数为12+14

2=

13,故选B.

6.2011年6月,台湾爆出了食品添加有毒塑化剂的案件,令世人震惊.我国某研究所为此

开发了一种用来检测塑化剂的新试剂,把500组添加了该试剂的食品与另外500组未添加该试剂的食品作比较,提出假设H 0:“这种试剂不能起到检测出塑化剂的作用”,并计算出P (K 2

≥6.635)≈0.01.对此,四名同学做出了以下的判断:

p :有99%的把握认为“这种试剂能起到检测出塑化的作用”; q :随意抽出一组食品,它有99%的可能性添加了塑化剂; r :这种试剂能检测出塑化剂的有效率为99%; s :这种试剂能检测出塑化剂的有效率为1%.

则下列命题中为真命题的是

( )

A .p ∧q

B .綈p ∧q

C .(綈p ∧綈q )∧(r ∨s )

D .(p ∨綈r )∧(綈q ∨s )

答案 D

解析 提出假设H 0“这种试剂不能起到检测出塑化剂的作用”,并计算出

P (K 2≥6.635)≈0.01,因此,在一定程度上说明假设不合理,我们就有99%的把握拒绝

假设.由题设可知命题p ,r 为真命题,q ,s 为假命题,依据复合命题的真值表可知D 为真命题. 二、填空题

7.(2013·湖北)从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350

度之间,频率分布直方图如图所示. (1)直方图中x 的值为 __________;

(2)在这些用户中,用电量落在区间[100,250)内的户数为________.

答案 (1)0.004 4 (2)70

解析 (1)(0.002 4+0.003 6+0.006 0+x +0.002 4+0.001 2)×50=1, ∴x =0.004 4.

(2)(0.003 6+0.004 4+0.006 0)×50×100=70.

8.下表提供了某厂节能减排技术改造后在生产A 产品过程中记录的产量x (吨)与相应的生

产能耗y (吨)的几组对应数据:

根据上表提供的数据,求出y 关于x 的线性回归方程为y ^

=0.7x +0.35,那么表中t 的值为________. 答案 3

解析 ∵样本点中心为? ????4.5,11+t 4, ∴

11+t

4

=0.7×4.5+0.35,解得t =3. 9.某校高三考生参加某高校自主招生面试时,五位评委给分如下:

9.0 9.1 8.9 9.2 8.8 则五位评委给分的方差为________. 答案 0.02

解析 评委给分的平均数为

1

5

×(9.0+9.1+8.9+9.2+8.8)=9.0, 方差为15×[(9.0-9.0)2+(9.1-9.0)2+(8.9-9.0)2+(9.2-9.0)2+(8.8-9.0)2

]=

0.1

5

=0.02. 10.某校开展“爱我海西、爱我家乡”摄影比赛,9位评委为参赛作品A

给出的分数如茎叶图所示.记分员在去掉一个最高分和一个最低分 后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中 的x )无法看清,若

记分员计算无误,则数字x 应该是__________. 答案 1

解析 当x ≥4时,89+89+92+93+92+91+947=640

7≠91,

∴x <4,∴89+89+92+93+92+91+x +90

7=91,

∴x =1. 三、解答题

11.(2013·陕西)有7位歌手(1至7号)参加一场歌唱比赛,由500名大众评委现场投票决

定歌手名次,根据年龄将大众评委分为五组,各组的人数如下:

(1)

高中数学统计、统计案例知识点总结和典例说课讲解

统计 一.简单随机抽样:抽签法和随机数法 1.一般地,设一个总体含有N个个体(有限),从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等(n/N),就把这种抽样方法叫做简单随机抽样。 2.一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本,这种抽样方法叫做抽签法。 抽签法的一般步骤:a、将总体的个体编号。 b、连续抽签获取样本号码。 3. 利用随机数表、随机数骰子或计算机产生的随机数进行抽样,叫随机数表法。 随机数表法的步骤:a、将总体的个体编号。b、在随机数表中选择开始数字。c、读数获取样本号码。 4. 抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力,又不方便,如果标号的签搅拌得不均匀,会导致抽样不公平,随机数表法的优点与抽签法相同,缺点上当总体容量较大时,仍然不是很方便,但是比抽签法公平,因此这两种方法只适合总体容量较少的抽样类型。 二.系统抽样: 1.一般地,要从容量为N的总体中抽取容量为n的样本,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样的方法叫做系统抽样。 系统抽样的一般步骤: (1)采用随机抽样的方法将总体中的N个个编号。 (2)将整体按编号进行分段,确定分段间隔k=N/n。(k∈N,L≤k). (3)在第一段用简单随机抽样确定起始个体的编号L(L∈N,L≤k)。 (4)按照一定的规则抽取样本,通常是将起始编号L加上间隔k得到第2个个体编号L+K,再加上K得到第3个个体编号L+2K,这样继续下去,直到获取整个样本。 在确定分段间隔k时应注意:分段间隔k为整数,当N/n不是整数时,应采用等可能剔除的方剔除部分个体,以获得整数间隔k。 三.分层抽样: 1.一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样的方法叫分层抽样。 分层抽样的步骤: (1)分层:按某种特征将总体分成若干部分。(2)按比例确定每层抽取个体的个数。 (3)各层分别按简单随机抽样的方法抽取。(4)综合每层抽样,组成样本。 2.分层抽样是当总体由差异明显的几部分组成时采用的抽样方法,进行分层抽样时应注意以下几点: (1)分层抽样中分多少层、如何分层要视具体情况而定,总的原则是,层内样本的差异要小,面层之间的样本差异要大,且互不重叠。 (2)为了保证每个个体等可能入样,所有层应采用同一抽样比等可能抽样。 (3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样。 四.用样本的频率分布估计总体分布: 1.频率分布是指一个样本数据在各个小范围内所占比例的大小。一般用频率分布直方图反映样本的频率分布。 其一般步骤为:(1)计算一组数据中最大值与最小值的差,即求极差(2)决定组距与组数(3)将数据分组(4)列频率分布表(5)画频率分布直方图 2.频率分布折线图、总体密度曲线 频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图。

高项案例知识点总结

1、项目经理的选择和素质:P18-23 一个合格项目经理应具备的素质:(1)广博的知识,丰富的经历,良好的协调能力,良好的职业道德,良好的沟通和表达能力,良好的领导能力。 项目经理应具备的五大知识领域:项目管理知识体系,应用领域的知识、标准和规定,项目环境知识,通用的管理知识和技能,软技能和人际关系技能。 2、项目干系人的需求分析和沟通分析,两部分组成——P31+P232 项目干系人的分析:1、非组员的干系人的三大职责:参与、审查、反馈2、项目干系人的分析的目的:确定项目干系人的需求,帮助项目经理制定沟通管理策略。 项目干系人的管理的方法:沟通方法(分析干系人需求和期望目标,分层次分目标进行沟通,不同干系人采用不同的沟通策略,综合运用正式的和非正式的或公开或私下等多种沟通方法),问题日志需求分析就是确定待开的信息系统应该做什么。 需求分析的特点: 1、用户与开发人员之间存在着沟通方面的困难; 2、用户的需求是动态变化的; 3、生命周期种不同的阶段系统变更的代价呈非线性增长; 需求分析的过程1、问题识别;2、分析与综合;3、制订规格说明;4、评审; 需求分析的方法1、原型化方法2、结构化方法3、动态分析法 需求分析步骤: 1、阅读甲方所有资料文件-组织资产、业务法规制度、业务流程; 2、撰写调研提纲,并与甲方业务人员确认; 3、业务岗位实地调研,岗位调研报告(一地)业务调研集中会议与试点地区岗位调研(省地市异地); 4、撰写业务调研报告,与甲方主要需求人员开会讨论; 5、甲方高层参加的业务需求调研报告会,认可业务需求内容 6、正式撰写“需求分析”系列文档;与甲方主要需求人员讨论; 7、真是提交需求评审,开会,确认需求; 3、项目的组织结构对项目管理的影响P34 第五章 4、整体管理计划的制定流程,作用和内容P91-93 整体管理作用:对项目管理过程中的不同过程和活动进行识别、定义、整合、统一和协调的过程。 整体管理计划的制定流程:制订项目章程,制订项目范围说明书初步,制订项目管理计划,指导和管理项目执行,监督和控制项目工作,整体变更控制,项目收尾。 5、范围管理——范围的定义、确认,P110 范围定义:描述项目过程并把结果与项目写进详细范围说明书中。 项目范围确认的工作要点:制订并执行确认程度,项目干系人对项目范围的正式确认,让系统的使用者有效参与,项目各阶段的确认和项目最终验收的确认。 分阶段分步骤的确认是归避风险的有效方法。确认的方法:测量、测试、检验,审查、产品评审、走查 6、WBS——工作分解的方法、作用P113 创建WBS所采用的方法:使用指导方针,类比法,自顶向下、自底向上 WBS的局限:不能显示活动之间的顺序,不能显示活动之间的依赖关系 WBS的表现形式:分级的树型结构,表格形式 WBS分解的详细程度:大项目:WBS分为总纲和子项目目录;小项目:WBS直接划分到工作包。 WBS的作用通及意义:将项目大的可交付物成果与项目工作划分为较小的和易管理的组成部分,详

统计学课程知识点总结

1. 统计的研究对象的特点:数量性,总体性,变异性。 2. 统计研究的基本环节:统计设计,收集数据,整理与分析,统计资料的积累、开发与应用。 3. 统计总体:根据一定数目的确定的所要研究的的事物的全体。特点:同质性、大量性。 总体可分为有限总体和无限总体。 标志:总体各单位普遍具有的属性或特征。标志分为品质标志(表明单位属性,用文字、语言描述)和数量标志(表明单位数量,用数值表现)。 不变指标:一个总体中各单位有关标志的具体表现都相同。变异指标:在一个总体中,当一个标志在各单位的具体表现有可能都相同。 第二章 1. 统计调查方式:普查,抽样调查,重点调查,定期报表制度。 调查方式按调查的范围划分,可分为全面调查和非全面调查。 按时间标志可分为连续性(经常性)调查和不连续性(一次性)调查 (一) 普查是专门组织的一种全面调查。特点:非经常性调查、最全面调查。 (二) 抽样调查是一种非全面性调查,可分为概率调查和非概率调查。 (三) 重点调查是指在调查对象中,只选择一部分重点单位进行的非全面调查,它是一种不连续的调查。 (四) 定期报表制度又称统计报表制度,它是依照国家有关法规,自上而下地统一布置,按照统一的表式、统一的指标项目、统一的报送时间和报送程序,自下而上逐级地定期提供统计资料的一种调查方式。 2. 我国现行的统计调查体系:以必要的周期性普查为基础,经常性的抽样调查为主体,同时辅之以重点调查、科学推算和部分定期报表综合运用的统计调查方法体系。 3.调查对象是指需要调查的现象总体。调查单位是指所要调查的具体单位,它是进行调查登记的标志的承担者。 4. 统计分组的原则:穷尽原则和互斥原则。 (先分后组) 间断型分组和连续型分组,等距和异距注意事项 第三章 1. 简单算术平均数121 n i n i x x x x x n n =++ +== ∑ 2. 加权算术平均数 11221121 n i i n n i n n i i x f x f x f x f x f f f f ==+++== +++∑∑ 3. 组距数列的算术平均数 4. 相对数的算术平均数 5. 调和平均数 6. 几何平均数 7. 算术平均数的性质: 1 1 , ()0n n i i i i nx x x x ===-=∑∑ 8. 组距数列的众数112O O O M M M L d ?=+??+? 9. 组距数列的中位数12e e e e M e M M M f S M L d f --=+?∑ 11. 方差(注意与样本方差的区别)P102: 10,11题 第四章 1. 事件的关系和运算:包含 ,相等 ,和 ,差 ,积 ,逆 ,不相容 。 2. 概率的计算:古典概型 ,几何概型 加法法则 ,乘法公式 条件概率 ,全概率与贝叶斯公式 3. 常见的随机变量的期望与方差

(典型题)高考数学二轮复习-知识点总结-统计与统计案例

统计和统计案例 1.该部分常考内容:样本数字特征的计算、各种统计图表、线性回归方程、独立性检验等;有时也会在知识交汇点处命题,如概率和统计交汇等. 2.从考查形式上来看,大部分为选择题、填空题,重在考查基础知识、基本技能,有时在知识交汇点处命题,也会出现解答题,都属于中低档题. 1. 随机抽样 (1)简单随机抽样特点为从总体中逐个抽取,适用范围:总体中的个体较少. (2)系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取,适用范围:总体中的个体数较多. (3)分层抽样特点是将总体分成几层,分层进行抽取,适用范围:总体由差异明显的几部分组成. 2. 常用的统计图表 (1)频率分布直方图 ①小长方形的面积=组距× 频率 组距 =频率; ②各小长方形的面积之和等于1; ③小长方形的高=频率组距,所有小长方形的高的和为1 组距. (2)茎叶图 在样本数据较少时,用茎叶图表示数据的效果较好. 3. 用样本的数字特征估计总体的数字特征 (1)众数、中位数、平均数 数字特征 样本数据 频率分布直方图 众数 出现次数最多的数据 取最高的小长方形底边中点的横坐标 中位数 将数据按大小依次排列,处在最 中间位置的一个数据(或最中间两个数据的平均数) 把频率分布直方图划分左右两个面积相等的分界线和x 轴交点的横坐标 平均数 样本数据的算术平均数 每个小矩形的面积乘以小矩形底边中点的横坐标之和 (2)方差:s 2=n [(x 1-x )2+(x 2-x )2+…+(x n -x )2 ]. 标准差:

s = 1n [ x 1-x 2 +x 2-x 2 +…+x n -x 2 ]. 4. 变量的相关性和最小二乘法 (1)相关关系的概念、正相关和负相关、相关系数. (2)最小二乘法:对于给定的一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),通过求Q = i =1 n (y i -a -bx i )2 最小时,得到线性回归方程y ^ =b ^ x +a ^ 的方法叫做最小二乘法. 5. 独立性检验 对于取值分别是{x 1,x 2}和{y 1,y 2}的分类变量X 和Y ,其样本频数列联表是: y 1 y 2 总计 x 1 a b a +b x 2 c d c +d 总计 a +c b +d n 则K 2 = n ad -bc 2a +b c + d a +c b +d (其中n =a +b +c +d 为样本容量). 考点一 抽样方法 例1 (2012·山东)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C .则抽到的人中,做问卷B 的人数为 ( ) A .7 B .9 C .10 D .15 答案 C 分析 由系统抽样的特点知:抽取号码的间隔为 960 32 =30,抽取的号码依次为9,39,69,…,939.落入区间[451,750]的有459,489,…,729,这些数构成首项为459,公差为30的等差数列,设有n 项,显然有729=459+(n -1)×30,解得n =10.所以做问卷B 的有10人. 在系统抽样的过程中,要注意分段间隔,需要抽取几个个体,样本就需要分 成几个组,则分段间隔即为N n (N 为样本容量),首先确定在第一组中抽取的个体的号码数,再从后面的每组中按规则抽取每个个体.解决此类题目的关键是深刻理解各种抽样

(最全)高中数学概率统计知识点总结

概率与统计 一、普通的众数、平均数、中位数及方差 1、 众数:一组数据中,出现次数最多的数。 2、平均数:①、常规平均数:12n x x x x n ++???+= ②、加权平均数:112212n n n x x x x ωωωωωω++???+=++???+ 3、中位数:从大到小或者从小到大排列,最中间或最中间两个数的平均数。 4、方差:2222121 [()()()]n s x x x x x x n = -+-+???+- 二、频率直方分布图下的频率 1、频率 =小长方形面积:f S y d ==?距;频率=频数/总数 2、频率之和:121n f f f ++???+=;同时 121n S S S ++???+=; 三、频率直方分布图下的众数、平均数、中位数及方差 1、众数:最高小矩形底边的中点。 2、平均数: 112233n n x x f x f x f x f =+++???+ 112233n n x x S x S x S x S =+++???+ 3、中位数:从左到右或者从右到左累加,面积等于0.5时x 的值。 4、方差:22221122()()()n n s x x f x x f x x f =-+-+???+- 四、线性回归直线方程:???y bx a =+ 其中:1 1 2 22 1 1 ()() ?() n n i i i i i i n n i i i i x x y y x y nxy b x x x nx ====---∑∑== --∑∑ , ??a y bx =- 1、线性回归直线方程必过样本中心(,)x y ; 2、?0:b >正相关;?0:b <负相关。 3、线性回归直线方程:???y bx a =+的斜率?b 中,两个公式中分子、分母对应也相等;中间可以推导得到。 五、回归分析 1、残差:??i i i e y y =-(残差=真实值—预报值)。分析:?i e 越小越好; 2、残差平方和:21?()n i i i y y =-∑, 分析:①意义:越小越好; ②计算:222211221 ????()()()()n i i n n i y y y y y y y y =-=-+-+???+-∑ 3、拟合度(相关指数):221 2 1 ?()1() n i i i n i i y y R y y ==-∑=- -∑,分析:①.(]20,1R ∈的常数; ②.越大拟合度越高; 4、相关系数 :()() n n i i i i x x y y x y nx y r ---?∑∑= = 分析:①.[r ∈-的常数; ②.0:r >正相关;0:r <负相关 ③.[0,0.25]r ∈;相关性很弱; (0.25,0.75)r ∈;相关性一般; [0.75,1]r ∈;相关性很强; 六、独立性检验 1、2×2列联表: 2、独立性检验公式 ①.2 2() ()()()() n ad bc k a b c d a c b d -= ++++ ②.犯错误上界P 对照表 3、独立性检验步骤

高中数学统计案例分析及知识点归纳总结

统计 一、知识点归纳 1、抽样方法: ①简单随机抽样(总体个数较少) ②系统抽样(总体个数较多) ③分层抽样(总体中差异明显) 注意:在N 个个体的总体中抽取出n 个个体组成样本,每个个体被抽到的机会(概率)均为N n 。 2、总体分布的估计: ⑴一表二图: ①频率分布表——数据详实 ②频率分布直方图——分布直观 ③频率分布折线图——便于观察总体分布趋势 注:总体分布的密度曲线与横轴围成的面积为1。 ⑵茎叶图: ①茎叶图适用于数据较少的情况,从中便于看出数据的分布,以及中位数、众位数等。 ②个位数为叶,十位数为茎,右侧数据按照从小到大书写,相同的数据重复写。 3、总体特征数的估计: ⑴平均数:n x x x x x n ++++= 321; 取值为n x x x ,,,21 的频率分别为n p p p ,,,21 ,则其平均数为n n p x p x p x +++ 2211; 注意:频率分布表计算平均数要取组中值。 ⑵方差与标准差:一组样本数据n x x x ,,,21 方差:2 1 2)(1 ∑=-= n i i x x n s ; 标准差:2 1 )(1∑=-= n i i x x n s 注:方差与标准差越小,说明样本数据越稳定。 平均数反映数据总体水平;方差与标准差反映数据的稳定水平。 ⑶线性回归方程 ①变量之间的两类关系:函数关系与相关关系; ②制作散点图,判断线性相关关系 ③线性回归方程:a bx y +=∧ (最小二乘法) 1 221n i i i n i i x y nx y b x nx a y bx ==? -? ?=??-??=-??∑∑ 注意:线性回归直线经过定点),(y x 。

高中数学知识点完全总结(绝对全)

高中数学概念总结 一、 函数 1、 若集合A 中有n )(N n ∈个元素,则集合A 的所有不同的子集个数为n 2,所有非空真子集的个数是22-n 。 二次函数c bx ax y ++=2的图象的对称轴方程是a b x 2-=,顶点坐标是??? ? ? ?--a b ac a b 4422,。用待定系数法求二次函数的解析式时,解析式的设法有三种形式,即(一般式)c bx ax x f ++=2)(,(零点式))()()(21x x x x a x f -?-=和n m x a x f +-=2)()( (顶点式)。 2、 幂函数n m x y = ,当n 为正奇数,m 为正偶数, m

),(y x P ,点P 到原点的距离记为r ,则sin α= r y ,cos α=r x ,tg α=x y ,ctg α=y x ,sec α=x r ,csc α=y r 。 2、同角三角函数的关系中,平方关系是:1cos sin 2 2 =+αα,αα22sec 1=+tg ,αα22csc 1=+ctg ; 倒数关系是:1=?ααctg tg ,1csc sin =?αα,1sec cos =?αα; 相除关系是:αααcos sin = tg ,α α αsin cos =ctg 。 3、诱导公式可用十个字概括为:奇变偶不变,符号看象限。如:=-)23sin( απαcos -,)2 15(απ -ctg =αtg ,=-)3(απtg αtg -。 4、 函数B x A y ++=)sin(?ω),(其中00>>ωA 的最大值是B A +,最小值是A B -,周期是ω π 2= T ,频 率是πω2= f ,相位是?ω+x ,初相是?;其图象的对称轴是直线)(2 Z k k x ∈+=+π π?ω,凡是该图象与直线B y =的交点都是该图象的对称中心。 5、 三角函数的单调区间: x y s i n =的递增区间是??? ?? ? + -222 2πππ πk k ,)(Z k ∈,递减区间是????? ? ++23222ππππk k ,)(Z k ∈;x y cos =的递增区间是[]πππk k 22,-)(Z k ∈,递减区间是[]πππ+k k 22,)(Z k ∈,tgx y =的递增区间是 ??? ? ? +-22ππππk k ,)(Z k ∈,ctgx y =的递减区间是()πππ+k k ,)(Z k ∈。 6、=±)sin(βαβαβαsin cos cos sin ± =±)c o s (βαβαβαs i n s i n c o s c o s = ±)(βαtg β αβ αtg tg tg tg ?± 1 7、二倍角公式是:sin2α=ααcos sin 2? cos2α=αα2 2 sin cos -=1cos 22 -α=α2 sin 21- tg2α= α α 2 12tg tg -。

统计概率知识点归纳总结归纳大全

统计概率知识点归纳总结大全 1.了解随机事件的发生存在着规律性与随机事件概率的意义. 2.了解等可能性事件的概率的意义,会用排列组合的基本公式计算一些等可能性事件的概率、 3.了解互斥事件、相互独立事件的意义,会用互斥事件的概率加法公式与相互独立事件的概率乘法公式计算一些事件的概率. 4.会计算事件在n 次独立重复试验中恰好发生k 次的概率. 5.掌握离散型随机变量的分布列、 6.掌握离散型随机变量的期望与方差、 7.掌握抽样方法与总体分布的估计、 8.掌握正态分布与线性回归、 考点1、求等可能性事件、互斥事件与相互独立事件的概率 解此类题目常应用以下知识: (1)等可能性事件(古典概型)的概率:P (A )=)()(I card A card =n m ; 等可能事件概率的计算步骤: (1) 计算一次试验的基本事件总数n ; (2) 设所求事件A,并计算事件A 包含的基本事件的个数m ; (3) 依公式()m P A n =求值; (4) 答,即给问题一个明确的答复、 (2)互斥事件有一个发生的概率:P (A +B )=P (A )+P (B ); 特例:对立事件的概率:P (A )+P (A )=P (A +A )=1、 (3)相互独立事件同时发生的概率:P (A ·B )=P (A )·P (B ); 特例:独立重复试验的概率:P n (k )=k n k k n p p C --)1(、其中P 为事件A 在一次试验中发生的概率,此式为二项式 [(1-P)+P]n 展开的第k+1项、

(4)解决概率问题要注意“四个步骤,一个结合”: ① 求概率的步骤就是: 第一步,确定事件性质???????等可能事件 互斥事件 独立事件 n 次独立重复试验 即所给的问题归结为四类事件中的某一种、 第二步,判断事件的运算???和事件积事件 即就是至少有一个发生,还就是同时发生,分别运用相加或相乘事件、 第三步,运用公式()()()()()()()()(1) k k n k n n m P A n P A B P A P B P A B P A P B P k C p p -?=???+=+???=??=-??等可能事件: 互斥事件: 独立事件: n 次独立重复试验:求解 第四步,答,即给提出的问题有一个明确的答复、 考点2离散型随机变量的分布列 1、随机变量及相关概念 ①随机试验的结果可以用一个变量来表示,这样的变量叫做随机变量,常用希腊字母ξ、η等表示、 ②随机变量可能取的值,可以按一定次序一一列出,这样的随机变量叫做离散型随机变量、 ③随机变量可以取某区间内的一切值,这样的随机变量叫做连续型随机变量、 2、离散型随机变量的分布列 ①离散型随机变量的分布列的概念与性质 一般地,设离散型随机变量ξ可能取的值为1x ,2x ,……,i x ,……,ξ取每一个值i x (=i 1,2,……)的概率P(i x =ξ)=i P ,则称下表、

高中数学统计与统计案例概率知识点上课讲义

高中数学统计与统计案例概率知识点

统计与统计案例概率(文科) 知识点 1.抽样调查 (1)抽样调查 通常情况下,从调查对象中按照一定的方法抽取一部分,进行______,获取数据,并以此对调查对象的某项指标作出______,这就是抽样调查. (2)总体和样本 调查对象的称为总______体,被抽取的称为样______本. (3)抽样调查与普查相比有很多优点,最突出的有两点: ①______ ②节约人力、物力和财力. 2.简单随机抽样 (1)简单随机抽样时,要保证每个个体被抽到的概率. (2)通常采用的简单随机抽样的方法:_____ 3.分层抽样 (1)定义:将总体按其属性特征分成若干类型(有时称作层),然后在每个类型中按照所占比例随机抽取一定的样本.这种抽样方法通常叫作分层抽样,有时也称为类型抽样. (2)分层抽样的应用范围: 当总体是由差异明显的几个部分组成时,往往选用分层抽样. 4.系统抽样 系统抽样是将总体中的个体进行编号,等距分组,在第一组中按照简单随机抽样抽取第一个样本,然后按______(称为抽样距)抽取其他样本.这种抽样方法有时也叫等距抽样或机

械抽样. 5.统计图表 统计图表是______数据的重要工具,常用的统计图表有______ 6.数据的数字特征 (1)众数、中位数、平均数 众数:在一组数据中,出现次数最多的数据叫作这组数据的众数. 中位数:将一组数据按大小依次排列,把处在______位置的一个数据(或最中间两个数据的平均数)叫作这组数据的中位数. 平均数:样本数据的算术平均数,即x =1n (x 1+x 2+…+x n ). 在频率分布直方图中,中位数左边和右边的直方图的面积应该______ (2)样本方差 标准差s = 1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2], 其中x n 是样本数据的第n 项,n 是,______x 是______ 标准差是刻画数据的离散程度的特征数,样本方差是标准差的______.通常用样本方差估计总体方差,当______时,样本方差很接近总体方差. 7.用样本估计总体 (1)通常我们对总体作出的估计一般分成两种,一种是______,另一种______. (2)在频率分布直方图中,纵轴表示,______数据落在各小组内的频率用______表示,各小长方形的面积总和等于.______ (3)在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间.从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,称之为频率折线图. (4)当样本数据较少时,用茎叶图表示数据的效果较好,它没有信息的缺失,而且______,方便表示与比较.

最全高中数学知识点总结(最全集)

最全高中数学知识点总结(最全集) 引言 1.课程内容: 必修课程由5个模块组成: 必修1:集合、函数概念与基本初等函数(指、对、幂函数) 必修2:立体几何初步、平面解析几何初步。 必修3:算法初步、统计、概率。 必修4:基本初等函数(三角函数)、平面向量、三角恒等变换。 必修5:解三角形、数列、不等式。 以上是每一个高中学生所必须学习的。 上述内容覆盖了高中阶段传统的数学基础知识和基本技能的主要部分,其中包括集合、函数、数列、不等式、解三角形、立体几何初步、平面解析几何初步等。不同的是在保证打好基础的同时,进一步强调了这些知识的发生、发展过程和实际应用,而不在技巧与难度上做过高的要求。 此外,基础内容还增加了向量、算法、概率、统计等内容。 选修课程有4个系列: 系列1:由2个模块组成。 选修1—1:常用逻辑用语、圆锥曲线与方程、导数及其应用。 选修1—2:统计案例、推理与证明、数系的扩充与复数、框图 系列2:由3个模块组成。 选修2—1:常用逻辑用语、圆锥曲线与方程、 空间向量与立体几何。 选修2—2:导数及其应用,推理与证明、数系的扩充与复数 选修2—3:计数原理、随机变量及其分布列,统计案例。 系列3:由6个专题组成。 选修3—1:数学史选讲。 选修3—2:信息安全与密码。 选修3—3:球面上的几何。 选修3—4:对称与群。 选修3—5:欧拉公式与闭曲面分类。 选修3—6:三等分角与数域扩充。 系列4:由10个专题组成。 选修4—1:几何证明选讲。 选修4—2:矩阵与变换。 选修4—3:数列与差分。 选修4—4:坐标系与参数方程。 选修4—5:不等式选讲。 选修4—6:初等数论初步。 选修4—7:优选法与试验设计初步。 选修4—8:统筹法与图论初步。 选修4—9:风险与决策。 选修4—10:开关电路与布尔代数。

统计学知识点汇总情况

统计学知识点汇总 一、统计学 统计学是一门关于数据资料的收集、整理、分析和推断的科学。 三、统计的特点 (1)数量性: 社会经济统计的认识对象是社会经济现象的数量方面,包括现象的数量表现、现象之间的数量关系和质量互变的数量界限。 (2)总体性: 社会经济统计的认识对象是社会经济现象的总体的数量方面。例如,国民经济总体的数量方面、社会总体的数量方面、地区国民经济和社会总体的数量方面、各企事业单位总体数量方面等等。 (3)具体性: 社会经济统计的认识对象是具体事物的数量方面,而不是抽象的量。这是统计与数学的区别。(4)社会性: 社会经济现象是人类有意识的社会活动,是人类社会活动的条件、过程和结果,社会经济统计以社会经济现象作为研究对象,自然具有明显的社会性。 四、统计工作过程 (1)统计设计 根据所要研究问题的性质,在有关学科理论的指导下,制定统计指标、指标体系和统计分类,给出统一的定义、标准。同时提出收集、整理和分析数据的方案和工作进度等。 (2)收集数据 统计数据的收集有两种基本方法,实验法和调查法。 (3)整理与分析

描述统计是指对采集的数据进行登记、审核、整理、归类,在此基础上进一步计算出各种能反映总体数量特征的综合指标,并用图表的形式表示经过归纳分析而得到的各种有用的统计信息。 推断统计是在对样本数据进行描述的基础上,利用一定的方法根据样本数据去估计或检验总体的数量特征。 (4)统计资料的积累、开发与应用 对于已经公布的统计资料需要加以积累,同时还可以进行进一步的加工,结合相关的实质性学科的理论知识去进行分析和利用。 五、统计总体的特点 (1)大量性 大量性是指构成总体的总体单位数要足够的多,总体应由大量的总体单位所构成,大量性是对统计总体的基本要求; (2)同质性 同质性是指总体中各单位至少有一个或一个以上不变标志,即至少有一个具有某一共同标志表现的标志,使它们可以结合起来构成总体,同质性是构成统计总体的前提条件; (3)变异性 变异性就是指总体中各单位至少有一个或一个以上变异标志,即至少有一个不同标志表现的标志,作为所要研究问题的对象。变异性是统计研究的重点。 六、标志与指标的区别与联系 ■区别: 标志是说明总体单位特征的;指标是说明总体特征的。 标志中的品质标志不能用数量表示;而所有的指标都能用数量表示。 标志(指数量标志)不一定经过汇总,可直接取得;而指标(指数量指标)一定要经过汇总才能取得。

统计和概率知识点总结

数据的收集、整理与描述 1、全面调查:考察全体对象的调查方式叫做全面调查。 2、抽样调查:调查部分数据,根据部分来估计总体的调查方式称为抽样调查。 3、总体:要考察的全体对象称为总体。 4、个体:组成总体的每一个考察对象称为个体。 5、样本:被抽取的所有个体组成一个样本。 6、样本容量:样本中个体的数目称为样本容量。 7、样本平均数:样本中所有个体的平均数叫做样本平均数。 8、总体平均数:总体中所有个体的平均数叫做总体平均数,在统计中,通常用样本平均数估计总体平均数。 9、频数:一般地,我们称落在不同小组中的数据个数为该组的频数。 10、频率:频数与数据总数的比为频率。 11、组数和组距:在统计数据时,把数据按照一定的范围分成若干各组,分成组的个数称为组数,每一组两个端点的差叫做组距。 数据的分析 1、平均数:一般地,如果有n 个数,,,,21n x x x 那么,)(121n x x x n x +++= 叫 做这n 个数的平均数,x 读作“x 拔”。 2、加权平均数:如果n 个数中,1x 出现1f 次,2x 出现2f 次,…,k x 出现k f 次 (这里n f f f k =++ 21)。那么,根据平均数的定义,这n 个数的平均数可以表示为n f x f x f x x k k ++=2211,这样求得的平均数x 叫做加权平均数,其中 k f f f ,,,21 叫做权。 3、中位数:将一组数据按照由小到大(或由大到小)的顺序排列,如果数据的个数是奇数,则处于中间位置的数就是这组数据的中位数(median);如果数据的个数是偶数,则中间两个数据的平均数就是这组数据的中位数。 4、众数:一组数据中出现次数最多的数据就是这组数据的众数(mode )。 5、极差:组数据中的最大数据与最小数据的差叫做这组数据的极差(range)。

高考数学二轮复习-统计与统计案例知识点总结

统计与统计案例 1.该部分常考内容:样本数字特征的计算、各种统计图表、线性回归方程、独立性检验等;有时也会在知识交汇点处命题,如概率与统计交汇等. 2.从考查形式上来看,大部分为选择题、填空题,重在考查基础知识、基本技能,有时在知识交汇点处命题,也会出现解答题,都属于中低档题. 1.随机抽样 (1)简单随机抽样特点为从总体中逐个抽取,适用范围:总体中的个体较少. (2)系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取,适用范围:总体中的个体数较多. (3)分层抽样特点是将总体分成几层,分层进行抽取,适用范围:总体由差异明显的几部分组成. 2.常用的统计图表 (1)频率分布直方图 ①小长方形的面积=组距× 频率 组距 =频率; ②各小长方形的面积之和等于1; ③小长方形的高=频率组距,所有小长方形的高的和为1 组距. (2)茎叶图 在样本数据较少时,用茎叶图表示数据的效果较好. 3.用样本的数字特征估计总体的数字特征 (1)众数、中位数、平均数 (2)方差:s 2=n [(x 1-x )2+(x 2-x )2+…+(x n -x )2 ]. 标准差:

s = 1n [ x 1-x 2+ x 2-x 2+…+ x n -x 2 ]. 4.变量的相关性与最小二乘法 (1)相关关系的概念、正相关和负相关、相关系数. (2)最小二乘法:对于给定的一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),通过求Q = i =1 n (y i -a -bx i )2 最小时,得到线性回归方程y ^ =b ^ x +a ^ 的方法叫做最小二乘法. 5.独立性检验 对于取值分别是{x 1,x 2}和{y 1,y 2}的分类变量X 和Y ,其样本频数列联表是: 则K 2 =n a +b c +d a +c b +d (其中n =a +b +c +d 为样本容量). 考点一 抽样方法 例1 (2012·山东)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机 编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C .则抽到的人中,做问卷B 的人数为 ( ) A .7 B .9 C .10 D .15 答案 C 解析 由系统抽样的特点知:抽取号码的间隔为 960 32 =30,抽取的号码依次为9,39,69,…,939.落入区间[451,750]的有459,489,…,729,这些数构成首项为459,公差为30的等差数列,设有n 项,显然有729=459+(n -1)×30,解得n =10.所以做问卷B 的有10人. 在系统抽样的过程中,要注意分段间隔,需要抽取几个个体,样本就需要分 成几个组,则分段间隔即为N n (N 为样本容量),首先确定在第一组中抽取的个体的号码数,再从后面的每组中按规则抽取每个个体.解决此类题目的关键是深刻理解各种抽样方法的特点和适用范围.但无论哪种抽样方法,每一个个体被抽到的概率都是相等的,

(完整版)高考数学高考必备知识点总结精华版

高考前重点知识回顾 第一章-集合 (一)、集合:集合元素的特征:确定性、互异性、无序性. 1、集合的性质:①任何一个集合是它本身的子集,记为A A ?; ②空集是任何集合的子集,记为A ?φ; ③空集是任何非空集合的真子集; ①n 个元素的子集有2n 个. n 个元素的真子集有2n -1个. n 个元素的非空真子集有2n -2个. [注]①一个命题的否命题为真,它的逆命题一定为真.否命题?逆命题. ②一个命题为真,则它的逆否命题一定为真. 原命题?逆否命题. 2、集合运算:交、并、补.{|,} {|}{,} A B x x A x B A B x x A x B A x U x A ?∈∈?∈∈?∈?I U U 交:且并:或补:且C (三)简易逻辑 构成复合命题的形式:p 或q(记作“p ∨q ” );p 且q(记作“p ∧q ” );非p(记作“┑q ” ) 。 1、“或”、 “且”、 “非”的真假判断 4、四种命题的形式及相互关系: 原命题:若P 则q ; 逆命题:若q 则p ; 否命题:若┑P 则┑q ;逆否命题:若┑q 则┑p 。 ①、原命题为真,它的逆命题不一定为真。 ②、原命题为真,它的否命题不一定为真。

③、原命题为真,它的逆否命题一定为真。 6、如果已知p ?q 那么我们说,p 是q 的充分条件,q 是p 的必要条件。 若p ?q 且q ?p,则称p 是q 的充要条件,记为p ?q. 第二章-函数 一、函数的性质 (1)定义域: (2)值域: (3)奇偶性:(在整个定义域内考虑) ①定义:①偶函数:)()(x f x f =-,②奇函数:)()(x f x f -=- ②判断方法步骤:a.求出定义域;b.判断定义域是否关于原点对称;c.求)(x f -;d.比较)()(x f x f 与-或)()(x f x f --与的关系。 (4)函数的单调性 定义:对于函数f(x)的定义域I 内某个区间上的任意两个自变量的值x 1,x 2, ⑴若当x 1f(x 2),则说f(x) 在这个区间上是减函数. 二、指数函数与对数函数 指数函数)10(≠>=a a a y x 且的图象和性质

卫生统计学知识点总结

卫生统计学知识点总结-CAL-FENGHAI-(2020YEAR-YICAI)_JINGBIAN

卫生统计学 统计工作基本步骤:统计设计(调查设计和实验设计)、资料分析{收集资料、整理资料、分析资料【统计描述和统计推断(参数估计和假设检验)】。 ★统计推断:是利用样本所提供的信息来推断总体特征,包括:参数估计和假设检验。a参数估计是指利用样本信息来估计总体参数,主要有点估计(把样本统计量直接作为总体参数估计值)和区间估计【按预先设定的可信度(1-α),来确定总体均数的所在范围】。b假设检验:是以小概率反证法的逻辑推理来判断总体参数间是否有质的区别。 变量资料可分为定性变量、定量变量。不同类型的变量可以进行转化,通常是由高级向低级转化。 资料按性质可分为计量资料、计数资料和等级资料。 定量资料的统计描述 1频率分布表和频率分布图是描述计量资料分布类型及分布特征的方法。离散型定量变量的频率分布图可用直条图表达。 2频率分布表(图)的用途:①描述资料的分布类型;②描述分布的集中趋势和离散趋势;③便于发现一些特大和特小的可疑值;④便于进一步的统计分析和处理;⑤当样本含量足够大时,以频率作为概率的估计值。 ★3集中趋势和离散趋势是定量资料中总体分布的两个重要指标。 (1)描述集中趋势的统计指标:平均数(算术均数、几何均数和中位数)、百分位数(是一种位置参数,用于确定医学参考值范围,P50就是中位数)、众数。算术均数:适用于对称分布资料,特别是正态分布资料或近似正态分布资料;几何均数:对数正态分布资料(频率图一般呈正偏峰分布)、等比数列;中位数:适用于各种分布的资料,特别是偏峰分布资料,也可用于分布末端无确定值得资料。 (2)描述离散趋势的指标:极差、四分位数间距、方差、标准差和变异系数。四分位数间距:适用于各种分布的资料,特别是偏峰分布资料,常把中位数和四分位数间距结合起来描述资料的集中趋势和离散趋势。方差和标准差:都适用于对称分布资料,特别对正态分布资料或近似正态分布资料,常把均数和标准差结合起来描述资料的集中趋势和离散趋势;变异系数:主要用于量纲不同时,或均数相差较大时变量间变异程度的比较。 标准差的应用:①表示变量分布的离散程度;②结合均数计算变异系数、描述对称分布资料;③结合样本含量计算标准误。 定性资料的统计描述 1定性资料的基础数据是绝对数。描述一组定性资料的数据特征,通常需要计算相对数。定性变量可以通过频率分布表描述其分布特征。 2 指标频率型指标强度型指标相对比型指标 概念近似反映某一时间出现概率单位时间内某现象的发生 率 两个有关联的指标A和B之比 计算 公式 A/B 有无 量纲 无有可有、可无 取值 范围 【0,1】可大于1无限制 本质大样本时作为概率近似值分子式分母的一部分频率强度,即概率强度的 似 值 表示相对于B的一个单位,A有多少 位 A和B可以是绝对数、相对数和平均

高中数学选修1-2《统计案例》知识点讲义教学内容

第一章统计案例一、回归分析的基本思想及其初步应用 1、数学变量相关关系 的定义:当一个或几个相互联系的变量取一定的数值时,与之相对应的另一变量的值虽然不 确定,但它仍按某种规律在一定的范围内变化。变量间的这种相互关系,称为具有不确定性的相关关系. (1)按方向分类 ①正相关:两个变量的变化趋势相同,从散点图可以看出各点散布的位置是从左下角到右上角的区域,即一个变量的值由小变大时,另一个变量的值也由小变大。 ②负相关:两个变量的变化趋势相反,从散点图可以看出各点散布的位置是从左上角到右下角的区域,即一个变量的值由小变大时,另一个变量的值由大变小。 正相关负相关不相关 (2)相关性系数r(在《必修3》中有介绍) 用相关系数r来衡量两个变量之间的相关关系 ()() ()() 1 22 11 n i i i n n i i i i x x y y r x x y y = == -- = -- ∑ ∑∑

2、两变量之间的关系存在两种不同的类型 (1)相关关系——非确定性关系 (2)函数关系——确定性关系 3、回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法。 其基本步骤是:①画出两个变量的散点图; ②求回归直线方程; ③并用回归直线方程进行预报。 4、回归直线方程:∧ ∧∧+=a x b y ?? ?? ????? -=--=---=∧∧====∧∑∑∑∑x b y a x n x y x n y x x x y y x x b n i i n i i i n i i n i i i ,)())((1 221121 ()()()10.00,2,. b b r x y ≠==说明:回归系数因为当时,相关系数这时不具有线性相关关系. 称为样本点的中心,回归直线必定经过样本点的中心

相关文档
最新文档