“统计与概率”中考知识梳理

“统计与概率”中考知识梳理
“统计与概率”中考知识梳理

原文地址:“统计与概率”中考知识梳理作者:sxzq

(本文发表于2010年第3期《数学金刊》)

“统计与概率”是初中数学的四个学习领域之一,这部分知识在人们的生活实践有着广泛的应用,在近年来各地中考中所占比例约为15%.初中阶段对该部分知识的学习分散在各册数学书中,我们一起来将它们梳理一下吧!

一、知识结构

二、重点知识

1. “两查”即普查、抽样调查

普查(又叫全面调查)的范围是所有考察的对象,抽样调查的范围是部分考察的对象.现实生活中经常会进行一些调查,采取普查还是抽样调查既要考虑问题本身的需要,又要考虑实现的可能性和所付出的代价的大小.例如,为让市民吃上放心月饼,某市质检部门对市场上销售的月饼进行质量调查,面对种类、数量繁多的月饼,如果采用普查方式,虽然得到的结果准确,但费时耗力不说、经过调查的月饼都被破坏无法继续销售,所以只能采取抽样调查.又如,为防控H1N1甲型流感,学校要记录师生每天的体温,因为要防治严重传染病,所以人数再多这样的调查也应该是普查.

当然抽样调查时,所选择的样本必须要具有代表性.例:要检测某地区空气的质量,如果只抽取市中心的空气质量作为样本,这样选择就不具有代表性,就不能真实反映总体情况.

在区分总体、个体、样本、样本容量这四个概念时,首先找出考察的对象,从而找出总体、个体,再根据被收集数据的这一部分对象找出样本,最后再根据样本确定出样本容量.

例:为了了解七年级2000名学生的数学成绩,从中抽取了1000名学生的期末数学成绩进行统计分析.这个问题中,我们考察的对象是学生的数学成绩,因此,总体是所有2000名学生的数学成绩,个体就是每一个学生的数学成绩,再根据被收集数据的这一部分考察对象即1000名学生的数学成绩,确定出样本即1000名学生的数学成绩,最后再根据样本的数目,即收集的数据的数目,确定样本容量1000(注意没有单位).

2.“双频”,即频数和频率

在一组数据中,我们称每个数据出现的次数为频数,而每个数据出现的次数与总次数的比值为频率.如,“(2009年宜宾)已知数据: .其中无理数出现的频率为()”.题中共5个数,无理数出现的频数是3(分别是),所以频率为 = 60%.

3. “三数”即平均数、中位数、众数

一般地,我们会用平均数(算术平均数或加权平均数)、中位数、众数来描述一组数据的平均水平.

怎样计算一个同学某次考试的平均分呢?大家都知道,只要将各科成绩相加再除以科数就可以了.一般地,对于n个数x1,x2,x3,……,x n,x=(x1+x2+x3+…+x n)叫做这n个数的平均数,又称算术平均数.

某电台在招播音员时,要进行笔试和面试,并将上两项成绩按3:2的比例计算总成绩,甲的两项成绩各为90分、80分,其总成绩的计算就不能90和80相加再除以2、而要用加权平均数来算.如果一组数据里的各个数据的“重要程度”未必相同,在计算这组数据的平均数时,往往给每个数据一个“权”,那么这组数据的平均数就成为加权平均数,公式是….上述问题中甲的总成绩就是90×+80×=86(分).

将一组数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数),叫做这组数据的中位数.如,要求一组数据4,5,6,7,7,8的中位数,它们已经按大小排列好了,最中间的是两个数6、7,中位数就是(6+7)÷2=3.5;又如,“(2009柳州)某学习小组7个男同学的身高(单位:米)为:1.66、1.65、1.72、1.58、1.64、1.66、1.70,那么这组数据的众数为()”,将原数据从小到大排列为1.58、1.64、1.65、1.66、1.66、1.70、1.72,最中间一个位置上的数1.66就是中位数.

有时我们更关心一组数据里哪个数出现的次数最多,比如书店的老板,要根据书的不同销量来确定怎样进货,这时就要用到众数了.我们把一组数据中出现次数最多的那个数据叫做这组数据的众数.例如,在5、3、2、6、9、6、7这组数中,6出现了2次,出现的次数最多,所以众数是6;如果在这组数中再加上一个5,因为其中5和6都出现了2次、都是最多的,所以这8个数的众数就是5、6两个数.

注意:①平均数的计算要用到所有数据,它能够充分利用数据提供的信息,故在生活中较为常用,但它受极端值的影响较大;②中位数只是一个位置代表值,只需很少的计算,不受极端值的影响,但不能充分利用所有数据的信息;③当一组数据中某些数据多次重复出现时,众数是人们关心的一个量,它不需要计算,并且不受极端值的影响,但当各个数据重复的资料大致相等时,众数往往没有特别意义.

4. “三差”即极差、方差、标准差

我们用极差、方差、标准差来描述一组数据的波动程度(或离散程度),它们越大,说明数据的波动越大;反之,越小.

极差是指一组数据中最大数据与最小数据的差.它能反映数据的变化范围,是一种简单的度量数据波动情况的量,但它受极端值的影响较大.如,“(2009年嘉兴市)已知数据:2,,3,5,6,5,则这组数据的众数和极差分别是()”,其中5出现了2次、出现次数最多,故众数是5;极差是最大数6与最小数-1的差7.

方差是各个数据与平均数之差的平方的平均数,即:

S2= [(x1- )2+(x2- )2+(x3- )2+…+(x n- )2〕,其中,是x1,x2,x3,…x n的平均数,S2是方差,而标准差S就是方差的算术平方根.如,“(2009年鄂州)有一组数据如下:3、a、4、6、7,它们的平均数是5,那么这组数据的方差是()”.先根据平均数的公式求出a=5,所以方差S2= [(3-5)2+(5-5)2+(4-5)2+(6-5)2+(7-5)2〕=2,标准差是 .

在实际问题的解决过程中,仅有“平均水平”还难以准确到刻画一组数据,比如,当两个运动员的几次训练的平均成绩相同时,怎样评价他们的水平呢?这时我们还要考虑数据的“波动情况”,总的说来,一般用平均数(算术平均数或加权平均数)、中位数、众位数来描述一组数据的平均水平,表示数据的集中程度;而用极差和方差来表示数据的离散程度和波动情况,在分析数据时,往往会根据要求来取数据的平均数,当数据的平均水平一致时,为了更好地根据统计结果做出合理的判断和预测,我们往往会根据极差和方差来判断数据的稳定性,从而做出正确的决策.

5. “五图” :即条形统计图、折线统计图、扇形统计图、频数分布直方图、频数分布折线图

统计图是表示统计数据的图形,是数据及其之间关系的直观表现和反映.

解决问题时选择哪种统计图,要根据统计图的特点和问题需要而定.当我们要清楚地表示出每个项目的具体数目时用条形统计图或频数分布直方图,当要清楚地反映数据的变化情况时用折线统计图或频数分布折线图,当要表示出各部分在总体中所占的百分比时就用扇形统计图.

在扇形统计图中所有部分的百分比之和等于1,扇形圆心角的度数=表示部分占总体的比例×360°;在频数分布直方图中,各小组的频数之和等于数据总数,各小组的频率之和等于1.

6.“三事件”,即必然事件、不可能事件和不确定事件

生活中,有的事件肯定会发生,像太阳每天都从东方升起,这样的事件叫必然事件;有的事件是不会发生的,像半夜里出太阳,这样的事件叫不可能事件;还有的事件可能发生、也可能不发生,像买彩票中奖,这样的事件叫不确定事件(或随机事件).必然事件和不可能事件统称为确定事件.

7.“两率”,即频率和概率

频率在前面已经提过,概率是某事件发生的可能性大小,常用字母P表示.显然,必然事件发生的概率为1,即p(必然事件)=1;不可能事件发生的概率为0,即P(不可能事件)=0;不确定事件A发生的概率在0和1之间,即 0<P(A)<1.

8.“一计算”,即概率的计算

我们重点学习了两种随机事件概率的计算方法:即理论计算和试验估算.比如,掷一枚均匀的硬币,只有两种结果:正面向上和反面向上、且这两种结果出现的机会相等,所以从理论上算正面向上的概率是0.5;我们也可以通过多次试验,用正面向上出现的次数除以试验的总次数来计算频率,再估计其概率.

理论计算我们又分为如下两种情况:

第一种:只涉及一步试验的随机事件发生的概率,如:投硬币时出现正面的概率、掷骰子时出现5点的概率、在一个不透明的袋子里摸不同颜色的球的概率,等等,计算公式:P = .

第二种:通过列表法、树状图来计算涉及两步或两步以上试验的随机事件发生的概率,如:配紫色,对游戏是否公平的计算.

另外,许多随机事件的概率不能直接用公式计算,为了估计这些事件的概率,只有通过大量的重复实验来解决,以事件出现的频率来估计概率.

三、思想方法

1.抽样考察

一般地,当总体中个体数目较多,普查的工作量较大,受客观条件的限制,无法对所有个体进行普查,或调查具有破坏性时,不允许普查,这时我们往往会用抽样调查来估计总体.抽样时要注意样本的代表性和广泛性.

2.用样本估计总体

用样本的平均数、众数、中位数去估计相应总体的平均水平特征;用样本的频数、频率、频数分布表、频数分布直方图和频数分布折线图去估计相应总体数据的分布情况;用样本的极差、方差或标准差去估计相应总体数据的波动情况.

3.数形结合

用绘制的统计图表去反映数据的分布情况及发展趋势.

4.分类讨论

计算概率时,有时要考虑各种可能的情况,分别计算出各种情况发生的概率.

四、易混易错

1.正确运用统计图

用统计图表示数据形象直观,但若统计图制作得不合理就容易引起误解。因此,读图时一定要先判断统计图的准确性,不能只从表面现象作出判断,而要抓住统计图的实际意义。

扇形统计图只反映部分与总体的比例关系,只从两个不同的扇形统计图中无法比较具体数目的大小。

2.概率不同于频率

频率与概率虽然都是比值,但这是两个不同的概念.概率是伴随随机事件客观存在的,而频率是通过试验得到的.当实验次数充分大时,频率在概率附近摆动.可以通过观察随机试验次数的不断增加时频率值在哪个数附近摆动,据此估计概率值.但是频率值不等于概率值.所以,在掷硬币的试验中,正面向上的概率是,这是客观存在的,但试验100次出现正面向上的次数可能是50次,还可能是45次,56次等等,其频率值不等于概率值.

3.计算概率时要注意等可能性

在计算等可能性事件的概率时一定要列出所有的结果,否则将出现失误.如,同时投掷甲、乙两枚硬币,在求“出现一正一反”的概率时,如果认为出现三种结果,所以“出现一正一反”的概率是,那就错了,实际上,会出现4种等可能结果:都正、都反、甲正乙反和乙正甲反,其中后两种都是“出现一正一反”,所以所求概率是 = .

实战演练

1、(2009呼和浩特)为了了解我市参加中考的15000名学生的视力情况,抽查了1000名学生的视力进行统计分析.下面四个判断正确的是()

A.15000名学生是总体 B.1000名学生的视力是总体的一个样本

C.每名学生是总体的一个个体 D.上述调查是普查

2、(2009年新疆)要反映乌鲁木齐市一天内气温的变化情况宜采用()

A.条形统计图 B.扇形统计图 C.频数分布直方图 D.折线统计图

3、 (2009成都)为了解某小区居民的日用电情况,居住在该小区的一名同学随机抽查了l5户家庭的日用电量,结果如下表:

日用电量(单

567810

位:度)

户数2543l

则关于这l5户家庭的日用电量,下列说法错误的是

(A)众数是6度 (B)平均数是6.8度 (C)极差是5度 (D)中位数是6度

4、(2009白银市)在一个不透明的布袋中装有红色、白色玻璃球共40个,除颜色外其他完全相同.小明通过多次摸球试验后发现,其中摸到红色球的频率稳定在15%左右,则口袋中红色球可能有()

A.4个 B.6个 C.34

个 D.36个

5、(2009年内蒙古包头)在综合实践课上,六名同学做的作品的数量(单位:件)分别是:5,7,3,,6,4;若这组数据的平均数是5,则这组数据的中位数

是件.

6、(2009年齐齐哈尔市)为了解某地区30万电视观众对新闻、动画、娱乐三类节目的喜爱情况,根据老年人、成年人、青少年各年龄段实际人口的比例3∶5∶2,随机抽取一定数量的观众进行调查,得到如下统计图.

青少年

老年人

节目

人数/人

图一:观众喜爱的节目统计图

新闻

娱乐

动画

20

40

60

80

100

32

46

68

94

A

B

图二:成年人喜爱的节目统计图

新闻

娱乐

动画

相关主题
相关文档
最新文档