随机抽数问题
人教A版高中数学必修二第9章章末检测(含答案)

第九章章末检测(时间:120分钟,满分150分)一、选择题(本大题共8小题,每小题5分,共40分.)1.某防疫站对学生进行身体健康调查,欲采用分层随机抽样的方法抽取样本.某中学共有学生2 000名,从中抽取了一个样本量为200的样本,其中男生103名,则该中学共有女生为( )A .1 030名B .97名C .950名D .970名【答案】D 【解析】由题意,知该中学共有女生2 000×200-103200=970(名).故选D .2.(2020年北京期末)艺术体操比赛共有7位评委分别给出某选手的原始评分,评定该选手的成绩时,从7个原始评分中去掉1个最高分、1个最低分,得到5个有效评分.5个有效评分与7个原始评分相比,不变的数字特征是( )A .中位数B .平均数C .方差D .极差【答案】A 【解析】根据题意,从7个原始评分中去掉1个最高分、1个最低分,得到5个有效评分,与7个原始评分相比,不变的中位数.故选A .3.(2020年河北月考)已知某校高一、高二年级学生人数均为600人,参加社团的高一和高二的人数比为2∶3,现从参加社团的同学中按分层抽样的方式抽取45人,则抽取的高二学生人数为( )A .9B .18C .27D .36【答案】C 【解析】由分层抽样的性质可得,抽取的高二学生人数为45×32+3=27.故选C .4.(2020年永州月考)在样本频率分布直方图中,共有5个小长方形,已知中间小长方形的面积是其余4个小长方形面积之和的13,且中间一组的频数为10,则这个样本量是( )A .20B .30C .40D .50【答案】C 【解析】所有长方形的面积和为1,因为中间小长方形的面积是其余4个小长方形面积之和的13,所以中间的面积为14,又中间一组的频数为10,所以样本容量为10÷14=40.故选C .5.(2019年惠州期末)某地区连续六天的最低气温(单位:℃)为:9,8,7,6,5,7,则该六天最低气温的平均数和方差分别为( )A .7和53B .8和83C .7和1D .8和23【答案】A 【解析】由题意,六天最低气温的平均数x =16×(9+8+7+6+5+7)=7,方差s 2=16×[(9-7)2+(8-7)2+(7-7)2+(6-7)2+(5-7)2+(7-7)2]=53.故选A .6.假设从高一年级全体同学(500人)中随机抽出60人参加一项活动,利用随机数法抽取样本时,先将500名同学按000,001,…,499进行编号,如果从随机数表第8行第11列的数开始,按三位数连续向右读取,最先抽出的4名同学的号码是(下面摘取了此随机数表第7行和第8行)( )84421 75331 57245 50688 77047 44767 21763 35025 63016 37859 16955 56719 98105 07175 12867 35807 A .455 068 047 447 B .169 105 071 286 C .050 358 074 439 D .447 176 335 025【答案】B 【解析】由随机数表法的随机抽样的过程可知最先抽出的4名同学的号码为169,105,071,286.7.(2020年阜阳期末)某单位去年的开支分布的折线图如图1所示,在这一年中的水、电、交通开支(单位:万元)如图2所示,则去年的水费开支占总开支的百分比为( )图1图2A .6.25%B .7.5%C .10.25%D .31.25%【答案】A 【解析】由拆线图知去年水、电、交通支出占总支出的百分比为20%,由条形图得去年水、电、交通支出合计为250+450+100=800(万元),其中水费支出250(万元),∴去年的水费开支占总开支的百分比为250800×20%=6.25%.故选A .8.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是( )A .甲地:总体均值为3,中位数为4B .乙地:总体均值为1,总体方差大于0C .丙地:中位数为2,众数为3D .丁地:总体均值为2,总体方差为3【答案】D 【解析】A 中,中位数为4,可能存在大于7的数;同理,在C 中也有可能;B 中的总体方差大于0,叙述不明确,如果方差太大,也有可能存在大于7的数;D 中,因为平均数为2,根据方差公式,如果有大于7的数存在,那么方差不可能为3.故选D .二、选择题:本题共4小题,每小题5分,共20分.在每小题给出的选项中,有多项符合题目要求.全部选对的得5分,有选错的得0分,部分选对的得3分.9.下列叙述正确的是( )A .极差与方差都反映了数据的集中程度B .方差是没有单位的统计量C .标准差比较小时,数据比较分散D .只有两个数据时,极差是标准差的2倍【答案】AD 【解析】由极差与方差的定义可知A 正确;方差是有单位的,其单位是原始数据单位的平方,B 错误;标准差较小时,数据比较集中,C 错误;只有两个数据x 1,x 2时,极差等于|x 2-x 1|,平均数为x 1+x 22,所以方差s 2=12⎣⎢⎡⎦⎥⎤⎝ ⎛⎭⎪⎫x 1-x 1+x 222+⎝ ⎛⎭⎪⎫x 2-x 1+x 222=14(x 1-x 2)2,则标准差s 2=12|x 2-x 1|,D 正确.故选AD .10.某学校为了调查学生在一周生活方面的支出情况,抽出了一个样本量为n 的样本,其频率分布直方图如图所示,其中支出在[50,60)元的学生有60人,则下列说法正确的是( )A .样本中支出在[50,60)元的频率为0.03B .样本中支出不少于40元的人数有132C .n 的值为200D .若该校有2 000名学生,则一定有600人支出在[50,60)元【答案】BC 【解析】A 中,样本中支出在[50,60)元的频率为1-(0.01+0.024+0.036)×10=0.3,故A 错误;B 中,样本中支出不少于40元的人数有0.0360.03×60+60=132,故B 正确;C 中,n =600.3=200,故C 正确;D 中,若该校有2 000名学生,则可能有600人支出在[50,60)元,故D 错误.故选BC .11.某地某所高中2019年的高考考生人数是2016年高考考生人数的1.5倍,为了更好地对比该校考生的升学情况,统计了该校2016年和2019年的高考升学情况,得到如下柱状图:则下列结论正确的是()A.与2016年相比,2019年一本达线人数有所增加B.与2016年相比,2019年二本达线人数增加了0.5倍C.与2016年相比,2019年艺体达线人数相同D.与2016年相比,2019年不上线的人数有所增加【答案】AD【解析】依题意,设2016年高考考生人数为x,则2019年高考考生人数为1.5x,由24%·1.5x-28%·x=8%·x>0,故选项A正确;由(40%·1.5x-32%·x)÷32%·x =0.875,故选项B不正确;由8%·1.5x-8%·x=4%·x>0,故选项C不正确;由28%·1.5x -32%·x=10%·x>0,故选项D正确.故选AD.12.给出三幅统计图如图所示:A.从折线统计图能看出世界人口的变化情况B.2050年非洲人口将达到大约15亿C .2050年亚洲人口比其他各洲人口的总和还要多D .从1957年到2050年各洲中北美洲人口增长速度最慢【答案】AC 【解析】从折线统计图能看出世界人口的变化情况,故A 正确;从条形统计图中可知2050年非洲人口大约将大于15亿,故B 错误;从扇形统计图中可知2050年亚洲人口比其他各洲人口的总和还要多,故C 正确;由题中三幅统计图并不能得出从1957年到2050年中哪个洲人口增长速度最慢,故D 错误.故选AC .三、填空题(本大题共4小题,每小题5分,共20分,请把答案填写在题中横线上) 13.一支田径队有男运动员48人,女运动员36人,若用分层抽样的方法从该队的全体运动员中抽取一个样本量为21的样本,则抽取男运动员的人数为________.【答案】12 【解析】抽取的男运动员的人数为2148+36×48=12. 14.将样本量为100的某个样本数据拆分为10组,若前七组的频率之和为0.79,而剩下的三组的频率依次相差0.05,则剩下的三组中频率最高的一组的频率为________.【答案】0.12 【解析】设剩下的三组中频率最高的一组的频率为x ,则另两组的频率分别为x -0.05,x -0.1.因为频率总和为1,所以0.79+(x -0.05)+(x -0.1)+x =1,解得x =0.12.15.12,13,25,26,28,31,32,40的25%分位数为________.【答案】19 【解析】因为8×25%=2,8×80%=6.4,所以25%分位数为x 2+x 32=13+252=19.16.下图是根据某中学为地震灾区捐款的情况而制作的统计图,已知该校共有学生3 000人,由统计图可得该校共捐款为________元.【答案】37 770 【解析】由扇形统计图可知,该中学高一、高二、高三分别有学生960人、990人、1 050人.由条形统计图知,该中学高一、高二、高三人均捐款分别为15元、13元、10元,所以共捐款15×960+13×990+10×1 050=37 770(元).四、解答题(本大题共6小题,17题10分,其余小题为12分,共70分,解答应写出必要的文字说明、证明过程或演算步骤)17.为调查某班学生的平均身高,从50名学生中抽取110,应如何抽样?若知道男生、女生的身高显著不同(男生30人,女生20人),应如何抽样?解:从50名学生中抽取110,即抽取5人,采用简单随机抽样法(抽签法或随机数法).若知道男生、女生的身高显著不同,则采用分层抽样法,按照男生与女生的人数比为30∶20=3∶2进行抽样,则男生抽取3人,女生抽取2人.18.(2020年辽宁学业考试)某学校随机抽取部分新生调查其上学所需时间(单位:分钟),并将所得数据绘制成频率分布直方图(如图).已知上学所需时间的范围是[0,100],样本数据分组为[0,20),[20,40),[40,60),[60,80),[80,100].(1)求直方图中x的值;(2)如果上学所需时间在[60,100]的学生可申请在学校住宿,请估计该校800名新生中有多少名学生可以申请住宿.解:(1)由直方图可得到20x+0.025×20+0.006 5×20+0.003×2×20=1,解得x=0.012 5.(2)由直方图可知,新生上学所需时间在[60,100]的频率为0.003×2×20=0.12,所以800×0.12=96(名).所以800名新生中估计有96名学生可以申请住宿.19.某汽车制造厂分别从A,B两种轮胎中各随机抽取了8个进行测试,列出了每一个轮胎行驶的最远里程数(单位:1 000 km):轮胎A96112971081001038698轮胎B10810194105969397106(1)分别计算(2)分别计算A,B两种轮胎行驶的最远里程的极差、方差;(3)根据以上数据,你认为哪种型号轮胎的性能更加稳定?解:(1)A 轮胎行驶的最远里程的平均数为18×(96+112+97+108+100+103+86+98)=100,中位数为12×(100+98)=99.B 轮胎行驶的最远里程的平均数为18×(108+101+94+105+96+93+97+106)=100,中位数为12×(101+97)=99.(2)A 轮胎行驶的最远里程的极差为112-86=26,方差为18×[(-4)2+122+(-3)2+82+02+32+(-14)2+(-2)2]=55.25,B 轮胎行驶的最远里程的极差为108-93=15,方差为18×[82+12+(-6)2+52+(-4)2+(-7)2+(-3)2+62]=29.5,(3)根据以上数据,A 轮胎和B 轮胎的最远行驶里程的平均数相同,但B 轮胎行驶的最远里程的极差和方差相对于A 轮胎较小,所以B 轮胎性能更加稳定.20.某幼儿园根据部分同年龄段女童的身高数据绘制了频率分布直方图,其中身高的变化范围是[96,106](单位:厘米),样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106].(1)求出x 的值;(2)已知样本中身高小于100厘米的人数是36,求出总样本量N 的数值;(3)根据频率分布直方图提供的数据及(2)中的条件,求出样本中身高位于[98,104)的人数.解:(1)由题意(0.050+0.100+0.150+0.125+x )×2=1,解得x =0.075. (2)设样本中身高小于100厘米的频率为p 1,则p 1=(0.050+0.100)×2=0.300. 而p 1=36N ,∴N =36p 1=360.300=120.(3)样本中身高位于[98,104)的频率p 2=(0.100+0.150+0.125)×2=0.750,∴身高位于[98,104)的人数n =p 2N =0.750×120=90.21.为了让学生了解环保知识,增强环保意识,某中学举行了一次环保知识竞赛,共有900名学生参加了这次竞赛.为了了解本次竞赛的成绩情况,从中抽取了部分学生的成绩(得分取正整数,满分为100分)进行统计.请你根据下面尚未完成的频率分布表和频率分布直方图,解答下列问题:组号 分组 频数 频率 1 [50,60) 4 0.08 2 [60,70) 8 0.16 3 [70,80) 10 0.20 4 [80,90) 16 0.32 5 [90,100] 合计—(1)填充频率分布表中的空格;(2)如图,不具体计算频率组距,补全频率分布直方图;(3)估计这900名学生竞赛的平均成绩(结果保留整数,同一组中的数据用该组区间的中点值作代表).解:(1)40.08=50,即样本量为50.第5组的频数为50-4-8-10-16=12,从而第5组的频率为1250=0.24.又各小组频率之和为1,所以频率分布表中的四个空格应分别填12,0.24,50,1.(2)设第一个小长方形的高为h 1,第二个小长方形的高为h 2,第五个小长方形的高为h 5,则h 1h 2=48=12,h 1h 5=412=13. 补全的频率分布直方图如图所示.(3)50名学生竞赛的平均成绩为x =4×55+8×65+10×75+16×85+12×9550=79.8≈80(分).所以估计这900名学生竞赛的平均成绩约为80分.22.共享单车入驻泉州一周年以来,因其“绿色出行,低碳环保”的理念而备受人们的喜爱,值此周年之际,某机构为了了解共享单车使用者的年龄段、使用频率、满意度等三个方面的信息,在全市范围内发放5 000份调查问卷,回收到有效问卷3 125份,现从中随机抽取80份,分别对使用者的年龄段、26~35岁使用者的使用频率、26~35岁使用者的满意度进行汇总,得到如下三个表格:表(一)使用者年龄段25岁以下26岁~35岁36岁~45岁45岁以上人数2040 1010表(二)使用频率 0~6次/月7~14次/月15~22次/月23~31次/月人数510 205表(三)满意度 非常满意(9~10)满意(8~9)一般(7~8)不满意(6~7)人数1510105(1)依据上述表格完成下列三个统计图形:(2)某城区现有常住人口30万,请用样本估计总体的思想,试估计年龄在26岁~35岁之间,每月使用共享单车在7~14次的人数.解:(1)(2)由表(一)可知年龄在26岁~35岁之间的有40人,占总抽取人数的12,所以30万人口中年龄在26岁~35岁之间的约有30×12=15(万人).由表(二)可知,年龄在26岁~35岁之间每月使用共享单车在7~14次之间的有10人,占总抽取人数的14,所以年龄在26岁~35岁之间的15万人中,每月使用共享单车在7~14次之间的约有15×14=154(万人).。
使用Python进行随机生成、随机抽取、随机分组

使用Python进行随机生成、随机抽取、随机分组日常办公中,我们经常会遇到诸如:随机抽取,随机分配,随机数生成等问题,这些都和“随机”这个概念相关,在Python中主要通过random库内的方法来解决。
今天我们通过一些常用的库方法和简单案例,来掌握Python中随机数的使用方法。
首先,我们须要来了解一下在random库中,最高频使用的方法有哪些,而他们又有什么作用?一、Python中Random的常用的7个方法的简介①random():随机生成一个0~1之间小数,精确到小数点后18位,含0不含1②uniform(x,y):随机生成一个[x,y]之间的小数,包含x和y本身,含16位有效数字③randint(x,y):随机生成一个[x,y]之间的整数,包含整数x和y本身④randrange(a,b,[c]):随机生成一个a~b之间整数,含a不含b,其中c可选参数,表示步长值⑤choice(seqtype):随机从序列类型(如字典、元组、列表等)中返回1个元素⑥shuffle(seqtype):将序列类型(同上)中元素随机洗牌乱序,返回乱序后序列⑦sample(seq,m):从序列类型中随机选取m个元素返回(以列表形式)关于开区间和闭区间的问题小结:random和randrange方法右侧区间为开区间,取不到端点数值;randint和uniform方法右侧是闭区间,可以取到端点数值。
在了解了以上的一些random库的基本方法以后,下面我们结合一些实际案例来看一下如何使用它们。
【案例1:生成验证码(数字和字母组成)(randrange方法)】①生成纯数字:随机生成6个0~10的整数(不含10)import randomlistA=[]for i in range(6):num=random.randrange(0,10)listA.append(num)s="".join(listA)print(s)注:1.join方法为字符串合并方法,即把listA中的所有元素连接起来,双引号内为分隔符,这里为空值,意为直接把所有的列表元素连接起来,不用任何分隔符;2.所有随机方法都为random库中的方法,所以在使用前须要导入random库,而且在调用其中的方法时,须要添加random前缀,如random.randrange(1,10)。
高二数学抽样试题

高二数学抽样试题1.某市有大型超市家、中型超市家、小型超市家.为掌握各类超市的营业情况,现按分层抽样方法抽取一个容量为的样本,应抽取中型超市__________家.【答案】16【解析】根据分层抽样的知识,设应抽取中型超市t家,得,解得t=16.【考点】分层抽样.2.某班同学利用五一节进行社会实践,对[25,55]岁的人群随机抽取n人进行了一次生活习惯是否符合低碳观念的调查,若生活习惯符合低碳观念,则称为“低碳族”,否则称为“非低碳族”,得到如下统计表和各年龄段人数频率分布直方图:(1)请补全频率分布直方图,并求n、a、p的值;(2)在所得样本中,从[40,50)岁年龄段的“低碳族”中采用分层抽样法抽取18人参加户外低碳体验活动,其中选取3人作为领队,记选取的3名领队中年龄在[40,45)岁的人数为X,求X的分布列和数学期望EX.【答案】(1),a=60,;(2)随机变量X的分布列为X0123∴数学期望.【解析】(1)由已知条件求出第二组的频率,从而补全频率分布直方图,由此能求出n、a、p的值.(2)[35,40)岁年龄段的“环保族”人数与[40,45)年龄段的“环保族”人数的比值为100:60=5:3,由题意,随机变量X的所有可能的取值为0,1,2,3,分别求出P(X=0),P(X=1),P(X=2),P(X=3),由此能求出随机变量X的分布列和数学期望EX.试题解析:(Ⅰ)第二组的频率为1﹣(0.04+0.04+0.03+0.02+0.01)×5=0.3,所以高为.频率直方图如下:3第一组的人数为,频率为0.04×5=0.2,所以.由题可知,第二组的频率为0.3,所以第二组的人数为1000×0.3=300,所以.第四组的频率为0.03×5=0.15,所以第四组的人数为1000×0.15=150,所以a=150×0.4=60.(Ⅱ)因为[40,45)岁年龄段的“低碳族”与[45,50)岁年龄段的“低碳族”的比值为60:30=2:1,所以采用分层抽样法抽取18人,[40,45)岁中有12人,[45,50)岁中有6人.随机变量X服从超几何分布.,,,.所以随机变量X的分布列为∴数学期望.【考点】离散型随机变量的期望与方差;分层抽样方法.3.我校15届高二有名学生, 现采用系统抽样方法, 抽取人做问卷调查, 将人按随机编号, 则抽取的人中, 编号落入区间的人数为().A.11B.12C.13D.14【答案】C【解析】由题意得,从840名学生中按系统抽样方法抽取42名,则应把840名学生分成42段,每段20人,从每段20人中抽取1人;编号落入区间的人数是.【考点】系统抽样.4.某高校共有15000人,其中男生10500人,女生4500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时)(1)应收集多少位女生样本数据?(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据分组区间为:.估计该校学生每周平均体育运动时间超过4个小时的概率.(3)在样本数据中,有60位女生的每周平均体育运动时间超过4个小时.请完成每周平均体育运动时间与性别的列联表,并判断是否有的把握认为“该校学生的每周平均体育运动时间与性别有关”.P(K2≥k)0.100.050.0100.005附:K2=【答案】(1)90(2)0.75(3)有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.【解析】(1)由题知,抽样比例为50:1,根据分层抽样是按比例抽样和女生人数即可计算出女生应抽取的人数;(2)观察频率分布直方图,找出每周平均体育运动不超过4小时的所有小矩形高即为频率/组距,这些小矩形的面积和即为每周平均体育运动不超过4小时的频率,1减去这个频率就是每周运动时间超过4小时的概率;(3)根据频率分布直方图计算出这300位男生和女生中每周运动时超过4小时和不超过4小时的人数,列出2×2列联表,代入K2公式,计算出样本观测值,将该值与表中概率为95%值比较即可得出是否有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.试题解析:(1)300×=90,所以应收集90位女生的样本数据. 3分(2)由频率分布直方图得每周平均体育运动超过4小时的频率为1-2×(0.100+0.025)=0.75,所以该校学生每周平均体育运动时间超过4小时的概率的估计值为0.75. 7分(3)由(2)知,300位学生中有300×0.75=225(位)的每周平均体育运动时间超过4小时,75人的每周平均体育运动时间不超过4小时.又因为样本数据中有210份是关于男生的,90份是关于女生的,所以每周平均体育运动时间与性别列联表如下:男生女生总计结合列联表可算得K2==≈4.762>3.841.所以有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”. 12分【考点】分层抽样方法,总体估计,独立性检验5.2013年第三季度,国家电网决定对城镇居民民用电计费标准做出调整,并根据用电情况将居民分为三类: 第一类的用电区间在,第二类在,第三类在(单位:千瓦时).某小区共有1000户居民,现对他们的用电情况进行调查,得到频率分布直方图如图所示.(1)求该小区居民用电量的中位数与平均数;(2)利用分层抽样的方法从该小区内选出5户居民代表,若从该5户居民代表中任选两户居民,求这两户居民用电资费属于不同类型的概率.【答案】(1)平均数为156.8,中位数为155;(2).【解析】(1)先利用所给的频率分布直方图求出每一组的频率,再利用频率求出平均数,找出中位数;(2)按照所给题目的意思可知第一类 4户,第二类1户,那么两户居民用电资费属于不同类型的概率为.试题解析:解:(1)第一组频率为20×0.005=0.1第二组频率为20×0.015=0.3第三组频率为20×0.02=0.4第四组频率为20×0.005=0.1第五组频率为20×0.003=0.06第六组频率为20×0.002=0.04 -2分平均数为0.1×120+0.3×140+0.4×160+0.1×180+0.06×200+0.04×220=156.8 -4分中位数为150+20×0.25=155 -6分(2)第一类 4户第二类1户 -8分两户居民用电资费属于不同类型的概率为 -----12分考点:频率分布直方图,中位数,分层抽样.6.采用系统抽样方法从960人中抽取32人做问卷调查.为此将他们随机编号为1,2, (960)分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间的人做问卷,编号落入区间的人做问卷,其余的人做问卷,则抽到的人中,做问卷的人数为()A.7B.9C.10D.15【答案】C【解析】由系统抽样方法可知从从960人中抽取32人,则每组人数为960/32 =30,就是每30人中抽取一人做问卷,那么共用有人,中共有人,故选C.【考点】系统抽样.7.某学校共有师生2400人,现用分层抽样方法,从所有师生中抽取一个容量为160的样本,已知从学生中抽取的人数为150,那么该学校的教师人数是。
简单随机抽样

简单随机抽样简答题:结合实例,简述什么是简单随机抽样。
【参考答案】(1)简单随机抽样:一般地,设一个总体含有N(N为正整数)个个体,从中逐个抽取n\;(1≤n<N)个个休作为样本,如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等。
我们把这样的抽样方法叫做放回简单随机抽样;如果抽取是不放回的,目每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫作不放回简单随机抽样。
放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样。
特点:每个个体被抽中的可能性相同(概率相等),样本的每个单位完全独立,彼此间无一定的关联性和排斥性。
简单随机抽样是其他各种抽样方法的基础。
通常当总体内的个体之间差异程度较小和数目较少时,采用这种抽样方法。
简言之,其特点是:①总体个数有限;②逐个抽取;③等可能抽样。
例如:高一三班52名学生的学号分别是01,52,从中随机挑选2名学生参加演讲表演,这种抽样方法就是简单随机抽样。
(2)分层随机抽样:一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层。
适用特征:①总体由差异明显的几部分组成;②分成的各层互不重叠;③各层抽取的比例等于样本在总体中的比例 \frac{n}{N}例如:初级中学有学生270人,其中初一年级108人,初二、初三年级各81人,现要抽取10人参加项调查,使用分层抽样时,将学生按初一、初二、初三年级依次统一编号为1,2,…,270,则抽取比例为\frac{10}{27}=\frac{1}{27} ,所以应分别从初一、初二、初三年级抽取4人,3人,3人。
重点概念补充说明:总体:目标总体与抽样总体目标总体也简称为总体,是指所有研究对象的全体,或是研究人员希望从中获取信息的总体,它研究对象中所有性质相同的个体所组。
随机抽样教案

2.1 随机抽样【教学目标】1.理解随机抽样的必要性和重要性.2.会用简单随机抽样方法从总体中抽取样本,理解分层抽样和系统抽样方法.【教法指导】及学会简单随机抽样方法,理解分层和系统抽样方法;难点是对样本随机性的理解;增强新旧知识之间的联系,培养自己分析问题、解决问题的水平,从而获得学习数学的方法.【教学过程】课本导读一、总体、个体、样本在统计里,把所考察对象的某一数值指标的全体构成的集合看成总体,其中构成总体的每一个考察的对象为个体.从总体中随机抽取若干个个体构成的集合叫做总体的一个样本,样本中包含的个体数目叫做样本容量.二、随机抽样抽样时保持每一个个体都可能被抽到,每一个个体被抽到的机会是均等的,满足这样条件的抽样是随机抽样.三、简单随机抽样1.定义设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),假设每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.2.最常用的简单随机抽样的方法抽签法和随机数法.四、系统抽样1.定义当总体中的个体数目较多时,可将总体分成均衡的几个局部,然后按照事先定出的规则,从每一局部抽取1个个体得到所需要的样本,这种抽样方法叫做系统抽样.五、分层抽样1.定义在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样的方法就叫做分层抽样.2.分层抽样的操作步骤第一步,确定样本容量与总体个数的比;第二步,计算出各层需抽取的个体数;第三步,采用简单随机抽样或系统抽样在各层中抽取个体;第四步,将各层中抽取的个体合在一起,就是所要抽取的样本.六、三种抽样方法的区别与联系疑难辨析1.简单随机抽样(1)在简单随机抽样中,某一个个体被抽到的可能性与第几次抽取相关,第一次抽到的可能性最大.( )[ 学 ](2)从20个零件中用简单随机抽样一次性抽取3个实行质量检测.( )(3)从100件玩具随机拿出一件,放回后再拿出一件,连续拿5次,是简单随机抽样.( )2.系统抽样(1)当总体中个体数较多时,应采取系统抽样法.( )(2)要从1 002个学生中用系统抽样的方法选择一个容量为20的样本,需要剔除2个学生,这样对被剔除者不公平.( )3.分层抽样(1)分层抽样中,每个个体被抽到的可能性与层数及分层相关.( )(2)某地区教育部门要调查中小学生的近视情况及形成原因,要抽取1 的学生实行调查,可用分层抽样实行.( )[ 学 ]4.三种抽样方法的比较(1)某班有45人,现抽取5人参加一项社会活动,则能够用简单随机抽样法抽取.( )(2)某校即将召开学生代表大会,现要从高一、高二、高三共抽取60名代表,则可用分层抽样方法抽取.( )(3)三种抽样方法,不管是哪一种,总体中每一个个体被抽到的机会均等.( )(3)根据三种抽样方法的规则可知,每个个体被抽到的机会均等.题型一简单随机抽样例1第十二届全运会将于2013年8月31日至9月12日在辽宁省沈阳市举行,沈阳某大学为了支持大运会,从报名的30名大三学生中选8人组成志愿小组,请用抽签法和随机数表法设计抽样方案.探究一通过本例题让学生理解利用简单随机抽样抽取样本时条件及步骤.1.条件(1)总体的个数较少,利用随机数表法或抽签法可容易获得样本;2.步骤(1)随机数表法的操作步骤编号、选起始数、读数、获取样本;(2)抽签法的操作步骤编号、制签、搅匀、抽取.学思考题一1、以下问题中,最适合用简单随机抽样方法抽样的是 ( )A .某电影院有32排座位,每排有40个座位,座位号是1~40,有一次报告会坐满了听众,报告会结束后为听取意见,要留下32名听众实行座谈B .从10台冰箱中抽出3台实行质量检查C .某学校有在编人员160人,其中行政人员16人,教师112人,后勤人员32人,教育部门为理解在编人员对学校机构改革的意见,要从中抽取一个容量为20的样本D .某乡农田有 山地800公顷,丘陵1 200公顷,平地2 400公顷,洼地400公顷,现抽取农田48公顷估计全乡农田平均每公顷产量 答案 B解析 A 的总体容量较大,用简单随机抽样法比较麻烦;B 的总体容量较少,用简单随机抽样法比较方便;C 因为学校各类人员对这个问题的看法可能差异很大,不宜采用简单随机抽样法;D 总体容量大,且各类田地的差别很大,也不宜采用简单随机抽样法.2.利用抽签法,从n 个个体中抽取一个容量为10的样本.若第二次抽取时,余下的每个个体被抽到的概率为13,则在整个抽样过程中,每个个体被抽到的概率为( )A.13B.514C.14D.10273.用随机数表实行抽样有以下几个步骤 ①将总体中的个体编号;②获取样本号码;③选定开始的数字,这些步骤的先后顺序应为( )A .①②③B .①③②C .③②①D .③①②4.学校举办元旦晚会,需要从每班选10名男生,8名女生参加合唱节目,某班有男生32名,女生28名,试用抽签法确定该班参加合唱的同5.现有120台机器,请用随机数表法抽取10台机器,写出抽样过程.【分析】已知N=120,n=10,用随机数表法抽样时编号000,001,002,…,119,抽取10个编号(都是三位数),对应的机器组成样本.【解析】第一步,先将120台机器编号,能够编为000,001,002, (119)第二步,在随机数表中任选一个数作为开始,任选一个方向作为读数方向,例如选出第9行第7列的数3,向右读;第三步,从选定的数3开始向右读,每次读取三位,凡不在000~119中的数跳过去不读,前面已经读过的也跳过去不读,依次可得到074,100,094,052,080, 003,105,107,083,092;第四步,以上这10个号码074,100,094,052,080,003,105,107,083,092所对应的10台机器就是要抽取的对象.题型二系统抽样例2、 1、某初级中学领导采用系统抽样方法,从该校预备年级全体800名学生中抽50名学生做牙齿健康检查.现将800名学生从1到800实行编号,求得间隔数 =80050=16,即每16人抽取一人.在1~16中随机抽取一个数,假设抽到的是7,则从33~48这16个数中应取的数是________.【解析】 (1)因为采用系统抽样方法,每16人抽取一人,1~16中随机抽取一个数抽到的是7,所以在第 组抽到的是7+16( -1),所以从33~48这16个数中应取的数是7+16×2=39.【答案】392、某装订厂平均每小时大约装订图书360册,要求检验员每小时抽取40册图书,检验其质量状况,请你设计一个抽样方案.3.某校高中三年级的295名学生已经编号为1,2,…,295,为了理解学生的学习情况,要按1∶5的比例抽取一个样本,请用系统抽样的方法实行抽取,并写出过程.【分析】 按1∶5的比例确定样本容量,再按系统抽样的步骤实行,关键是确定第1段的编号.【解析】 按照1∶5的比例抽取样本,则样本容量为15×295=59. 抽样步骤是(1)编号 按现有的号码;(2)确定分段间隔 =5,把295名同学分成59组,每组5人,第1组是编号为1~5的5名学生,第2组是编号为6~10的5名学生,依次下去,第59组是编号为291~295的5名学生;(3)采用简单随机抽样的方法,从第一组5名学生中抽出一名学生,不妨设编号为l(1≤l≤5);(4)那么抽取的学生编号为l+5(=0,1,2,...,58),得到59个个体作为样本,如当l=3时的样本编号为3,8,13, (288)293.[ 学 ]探究二通过本例题让学生理解系统抽样的特点及步骤.(1)通过例2的(1)(2)让学生理解系统抽样的特点是等距离抽样,若第一组抽取号码a,然后以d为间距依次等距离抽取后面的编号,抽出的所有号码为a+d ( =0,1,2,…,n-1),其中n是组数.(2)通过例2的(3)让学生理解系统抽样的步骤第一步,将总体的N个个体编号.第二步,确定分段间隔,对编号实行分段.第三步,在第1段用简单随机抽样确定起始个体编号l.第四步,按照一定的规则抽取样本.思考题二(1)一个总体中有100个个体,随机编号为0,1,2,…,99,依编号顺序平均分成10组,组号依次为1,2,3,…,10,现用系统抽样抽取一个容量为10的样本,并规定假设在第一组随机抽取的号码为m,那么在第(=2,3,…,10)组中抽取的号码的个位数字与m +的个位数字相同.若m=6,则该样本的全部号码是__________________.(2)将某班的60名学生编号 01,02,…,60,采用系统抽样方法抽取一个容量为5的样本,且随机抽得的一个号码为04,则剩下的四个号码依次是________.题型三、分层抽样例3、(1)(2013·湖南卷)某学校有男、女学生各500名.为理解男女学生在学习兴趣与业余爱好方面是否存有显著差异,拟从全体学生中抽取100名学生实行调查,则宜采用的抽样方法是( )A.抽签法 B.随机数法C.系统抽样法 D.分层抽样法(2)[2012·江苏卷] 某学校高一、高二、高三年级的学生人数之比为3∶3∶4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取________名学生.(3)[2012·天津卷] 某地区有小学150所,中学75所,大学25所,现采用分层抽样的方法从这些学校中抽取30所学校对学生实行视力调查,应从小学中抽取________所学校,中学中抽取________所学校.(4)某高中共有900人,其中高一年级300人,高二年级200人,高三年级400人,现采用分层抽样抽取容量为45的样本,那么高一、高二、高三各年级抽取的人数分别为( )A.15,5,25 B.15,15,15C.10,5,30 D.15,10,20(5)某城市有210家百货商店,其中大型商店20家、中型商店40家、小型商店150家,为了掌握各商店的营业情况,计划抽取一个容量为21的样本,按照分层抽样方法抽取时,各种百货商店分别要抽取多少家?并写出抽样过程.探究三通过本例题让学生理解分成抽样的特点及步骤,各局部之间有明显的差异是分层抽样的依据,至于各层内用什么方法抽样是灵活的.分层抽样中,个体被抽中的机会均等,表达了抽样的公平性.(1)通过例3(1)让学生理解什么情况采用分层抽样;(2)通过例3(2)(3)(4)让学生理解分层抽样的抽样比方何计算;(3)通过例3(5)让学生理解分层抽样的步骤.思考题三、(1)[2012·南阳一模] 某地为了调查职业满意度,决定用分层抽样的方法从公务员、教师、自由职业者三个群体的相关人员中抽取若干人组成调查小组,相关数据见下表相关人员数[ ] 抽取人数公务员35 b教师 a 3 自由职业者28 4则调查小组的总人数为( ) A .84 B .12 C .81 D .14(2)[2012·江西重点中学一模] 在100个零件中,有一级品20个,二级品30个,三级品50个,从中抽取20个作为样本 ①采用随机抽样法,将零件编号为00,01,02,…,99,抽出20个;②采用系统抽样法,将所有零件分成20组,每组5个,然后每组中随机抽取1个;③采用分层抽样法,随机从一级品中抽取4个,二级品中抽取6个,三级品中抽取10个.则( )A .不管采取哪种抽样方法,这100个零件中每个被抽到的概率都是15B .①②两种抽样方法,这100个零件中每个被抽到的概率都是15,③并非如此C .①③两种抽样方法,这100个零件中每个被抽到的概率都是15,②并非如此D .采用不同的抽样方法,这100个零件中每个被抽到的概率各不相同(3)[2012·吉林一模] 从总数为N 的一群学生中抽取一个容量为100的样本,若每个学生被抽取的概率为14,则N的值为( )A.25 B.75 C.400 D.5004.某公司有三个部门,第一个部门800个员工,第二个部门604个员工,第三个部门500个员工,现在用按部门分层抽样的方法抽取一个容量为380名员工的样本,求应该剔除几个人,每个部门应该抽取多少名员工?随堂测评1.现要完成以下3项抽样调查①从10盒酸奶中抽取3盒实行食品卫生检查.②技报告厅有32排,每排有40个座位,有一次报告会恰好坐满了听众,报告会结束后,为了听取听众意见,需要请32位听众实行座谈.③东方中学共有160名教职工,其中一般教师120名,行政人员16名,后勤人员24名.为了理解教职工对学校在校务公开方面的意义,拟抽取一个容量为20的样本.较为合理的抽样方法是( )A.①简单随机抽样,②系统抽样,③分层抽样B.①简单随机抽样,②分层抽样,③系统抽样C.①系统抽样,②简单随机抽样,③分层抽样D.①分层抽样,②系统抽样,③简单随机抽样[2012·漳州三校二联] 某学校为了调查高二年级的80名文学生和高三年级的120名文学生完成课后作业所需时间,采取了两种抽样调查的方式第一种由学生会的同学随机抽取高二年级8名和高三年级12名同学实行调查;第二种由教务处对该年级的文学生实行编号,从001到200,抽取学号最后一位为2的同学实行调查,则这两种抽样的方法依次为( )A.分层抽样,简单随机抽样B.抽签法,随机数表法C.分层抽样,系统抽样D.简单随机抽样,系统抽样3.[2013·南通中学联考] 某地有居民2万户,从中随机抽取200户,调查是否已安装安全救助报警系统,调查结果如下表所示[ ] 外户原住户已安装60 35未安装45 60则该小区已安装安全救助报警系统的户数估计有________户.4.某商场想通过检查发票及销售记录的 2 快速估计每月的销售总额.采取如下方法从某本发票的存根中随机抽一张,如15号,然后按序往后将65号,115号,165号,…,发票上的销售额组成一个调查样本.这种抽取样本的方法是( )A.抽签法 B.随机数表法C.系统抽样法 D.其他方式的抽样5.为了考察某校的教学水平,将抽查这个学校高三年级局部学生的本学年考试成绩实行考察.为了全面地反映实际情况,采取以下三种方式实行(已知该校高三年级共有14个教学班,并且每个班内的学生都已经按随机方式编好了学号,假定该校每班人数都相同).①从全年级14个班中任意抽取一个班,再从该班中任意抽取14人,考察他们的学习成绩;②每个班都抽取1人,共计14人,考察14个学生的成绩;③把学校高三年级的学生按成绩分成优秀、良好、普通三个级别,从中抽取100名学生实行考察(已知若按成绩分,该校高三学生中优秀学生有105名,良好学生有420名,普通学生有175名).根据上面的表达,试回答以下问题(1)上面三种抽取方式中,其总体、个体、样本分别指什么?每一种抽取方式抽取的样本中,其样本容量分别是什么?(2)上面三种抽取方式各自采用何种抽取样本的方法?(3)试分别写出上面三种抽取方式各自抽取样本的步骤.。
PPT随机抽题系统(附vba代码)

目录
• 系统概述 • 系统设计 • 系统操作流程 • 系统维护与更新 • 常见问题与解决方案 • 案例分享与实际应用
01
系统概T随机抽题系统是一个基于 PowerPoint平台开发的自动化工 具,用于在演示文稿中随机抽取 预设题目并展示给观众。
企业培训考核应用案例
案例概述
在企业培训考核中,PPT随机抽题系统可以用于检验员工的学习 成果和技能掌握情况。
实现方式
根据培训内容和要求,制作相应的PPT和题库,通过VBA代码实现 随机抽题和自动评分功能。
优势特点
能够快速有效地检验员工的学习成果,提高培训效果和员工参与度, 为企业提供客观准确的考核数据。
02
系统设计
数据库设计
数据库类型
选择合适的关系型数据库, 如Microsoft SQL Server 或MySQL,用于存储题库 和用户信息。
数据表设计
设计包含题目信息、用户 信息等数据表,并定义主 键、外键等关系。
字段设计
根据需求定义数据表的字 段,如题目ID、题目内容、 答案等。
用户界面设计
网络在线答题应用案例
案例概述
01
在网络在线答题应用中,PPT随机抽题系统可以用于各种知识竞
赛、趣味答题等活动。
实现方式
02
利用PPT的分享功能,将带有随机抽题系统的PPT分享到网络平
台,参与者通过在线答题参与活动。
优势特点
03
能够吸引大量参与者、提高活动的趣味性和互动性,同时保证
答题的公正性和客观性。
THANKS FOR WATCHING
感谢您的观看
通过VBA代码实现用户登录和身份验 证功能,确保系统安全性。
9.1.2 分层随机抽样
探究
抽样调查最核心的问题是样本的代表性.简单 随机抽样是使总体中每一个个体都有相 等的机会被 抽中,但因为抽样的随机性,有可能会出现比较 “极端”的样本.例如.在对 树人中学高一年级学生 身高的调査中,可能出现样本中50个个体大部分来 自高个子或矮 个子的情形.这种“极端”样本的平 均数会大幅度地偏离总体平均数,从而使得估计值 出现较大的误差.
X = X1 +X2 +
M
+X M
=1 M
M i 1
X
,
i
x= x1 +x2 +
m
+xm
=
1 m
m i 1
xi,
则第2层的总体平均数和样本平均数分别为
Y = Y1 +Y2 +
N
+YN
=1 N
N
Yi,
i 1
y= y1 +y2 +
n
+yn
=
1 n
n i 1
xi,
总体平均数和样本平均数分别为
M
N
和第2层包含的个体数分别为M和 N,抽取的样本量
分别为m和n.我们用X1,X2,…,XM表示第1层各个 个体的变量值, 用x1,x2,…,xm 表示第1层样本的各 个个体的变量值;用Y1,Y2,…,YN表示第2层各个 个体的变量值,用y1,y2,…,yn表示第2层样本的各 个个体的变量值.
则第1层的总体平均数和样本平均数分别为
一般地,分层抽样的操作步骤 第一步,将总体分成互不交叉的层; 第二步,计算样本容量与总体的个体数之比. 按比例确定各层要抽取的个体数. 第三步,用简单随机抽样在各层中抽取相应数量 的个体.
高中数学抽样方法-课文知识点解析
抽样方法-课文知识点解析1.常用抽样方法:简单随机抽样、分层抽样和系统抽样.2.简单随机抽样一般地,从总体中抽取一定量的样本,在抽取过程中要保证每个个体被抽到的概率相同,这样的抽样方法叫简单随机抽样.通常采用抽签法和产生随机数字的方法(利用工具产生随机数). (1)抽签法抽签法的实施步骤:a.给调查对象群体(共有N个)中的每个对象编号(号码可以从1到N).b.准备“抽签”工具(签可以是纸条、卡片或小球),实施“抽签”.先把号码写在形状、大小相同的签上,然后把签放在同一个箱子里,进行均匀搅拌,每次从中抽出一个签,连续抽n次,就得到一个容量为n的样本.c.对样本中的每一个体进行测量或调查,得到数据,通过分析数据得出结论.例如:请用抽签法设计一个调查方案,调查你所在学校学生喜欢体育活动的情况.(以总体数量为N)抽取n个样本为例.第一步,给全体同学编号,号码从1到N;第二步,准备N个大小、形状相同的签,把号码(1~N)写在签上,每次抽取一个签,连续抽n次,就得到一个容量为n的样本;第三步,对样本中的每一个体进行调查.可设计一个问卷,如下. 你对体育活动的喜欢程度A.喜欢B.一般C.不喜欢说明:只准选择一个答案.然后请抽取的几个同学如实填写问卷,统计出数据,填入下表.由样本情况估计全校所有同学喜欢体育活动的情况,从而得出调查结论,写出调查报告.(2)产生随机数把总体中的N个个体依次编上0,1,2,…,N-1的号码,然后利用工具(转盘或摸球、随机数表、科学计算器或计算机)产生0,1,…,N-1中的随机数,产生的随机数是几,就选几号个体,直到抽到预先规定的样本数.利用转盘或摸球产生随机数,这种方法大家都比较熟悉,并且简便易行,尤其当总体容量不大时.这种方法的缺点是当总体容量很大时,制作转盘和进行摸球就比较困难了.利用随机数表产生随机数,是其中最重要、最常用的一种方法.下面举例说明如何利用随机数表来抽取样本.为了检验某种产品的质量,决定从40件产品中抽取10件进行检查.在利用随机数表抽取这个样本时,可按下面步骤进行. 全析提示我们知道要做到绝对地随机抽取样本非常困难,因此在抽样过程中尽可能避免人为因素的影响,而抽签法和产生随机数字法恰好具备此特点.抽签法最大的优点是简便易行,但此种方法不宜适用于总体数量较大的对象,一般适用于个体数量较少的对象.要点提炼一个调查方案的设计一定要科学、合理,要易于操作,易得出数据便于统计;问卷的设计更要具有科学性,选项要全面、合理.通过调查方案的设计和实施,有利于提高同学们的思维、逻辑、组织和实践能力,这也符合素质教育的要求.全析提示利用抽签法抽取样本时,编号应从1开始;而利用随机数抽取样本时,编号应从0开始.利用随机数表产生随机数是最常用的产生随机数的方法,要掌握此种方法的步骤.表3-17816 6572 0802 6314 0702 4369 9728 0198 3204 9243 4935 8200 3623 4869 6938 7481 2976 3413 2841 4241 2424 1985 9313 2322 8303 9822 5888 2410 1158 2729 6443 2943 5556 8526 6166 8231 2438 8455 4618 44452635 7900 3370 9160 1620 3882 7757 4950 3211 4919 7306 4916 7677 8733 9974 6732 2748 6198 7164 4148 7086 2888 8519 1620 7477 0111 1630 2404 2979 7991 9683 5125 5379 7076 2694 2927 4399 5519 8106 85019264 4607 2021 3920 7766 3817 3256 1640 5858 7766 3170 0500 2593 0545 5370 7814 2889 6628 6757 8231 1589 0062 0047 3815 5131 8186 3709 4521 6665 5325 5383 2702 9055 7196 2172 3207 1114 1384 4359 44887900 5870 2602 8813 5509 4324 0030 4750 3693 9212 0557 7369 7162 9568 1312 9438 0380 3338 0138 4560 4230 6496 3806 0347 0246 4469 9719 8316 1285 0357 2389 2390 7266 0081 6897 2851 4666 0620 4596 34009312 4779 5737 8918 4550 3994 5573 9229 6111 6098 0965 7352 6847 3034 9977 3770 2310 4476 9148 0679 2662 2062 0522 9234 9826 8857 8675 6642 5471 8820 4308 2105 6703 8248 6064 6962 0053 8188 6494 45091110 9486 6533 3954 1944 1516 1682 3404 9651 1456 5613 0357 4244 3341 9605 3567 8350 5728 4338 0824 7899 1307 5814 8688 6982 5126 7736 3383 6215 3441 8578 2277 6490 7644 7085 8361 5662 4141 9877 37478570 2150 8140 4355 5321 2548 0208 7543 9169 0408 4353 6122 8913 9930 4169 6032 2127 0162 6176 4969 8185 9312 8748 8575 8090 9872 1968 0263 0081 2662 6831 3106 2959 9011 1448 4346 7019 8148 1557 8400第一步,先将40件产品编号,可以编为00,01,02, (38)39;全析提示用随机数表产生随机数分三步,一第二步,在随机数表中任选一个数开始,由于总体的编号是两位数,我们可以一次选取其中的两列,组成一个两位数.我们从附表的第17列和第18列的第2行开始选数;第三步,从选定的数36开始,得到第一个两位数,将它取出;继续向下读,由上至下分别是24,11,24,16,76,70,29,43,77,25,15,66,11,55,71,42,12,46,45,68,26,54,00,…其中24,11重复出现,76,70,43,77,66,55,71,42,46,45,68,54超过39,不能选取,这样选取的10个样本的编号分别为36,24,11,16,29,25,15,12,26,00.课本例1,严格地按照用随机数表产生随机数的步骤进行的.在选数的过程中,是从表3-1中第6列和第7列这两列的第4行开始,由上至下的顺序进行选数的.事实上,定位置和选数的顺序是任意的.下面我们用另外一种顺序选取10个样本.第一步,将总体中的每个个体进行编号:00,01,02,…,79; 第二步,由于总体是一个两位数的编号,每次要从随机数表中选取两列组成两位数.从随机数表中任意一个位置,比如从表3-1中第1列和第2列这两列的第三行开始选数,由左至右分别是29,76,34,13,28,41,42,41,24,24,19,85,93,13,23,…其中13,41,24重复出现,83,93超过79,不能选取,这样选取的10个样本的编号分别为29,76,34,13,28,41,42,24,19,23. 3.分层抽样将总体按其属性特征分成若干类型(有时称作层),然后在每个类型中随机抽取一定的样本,这种抽样方法通常叫做分层抽样,有时也称为类型抽样.例如教材中的问题2,如若用简单随机抽样,则抽到的15个样本很可能不能按照它们的家数之比抽取,这样得到的数据就不能真实地反映情况,误差很大;为了避免这种情况,我们按照大型、中型、小型的比例,从100家大型商店中抽出1个代表,从500家中型商店中抽出5个代表,从900家小型商店中抽出9个代表. 再例如,一个单位有职工500人,其中不到35岁的有125人,35岁~49岁的有280人,50岁以上的有95人.为了了解这个单位职工身体状况有关的某项指标,要从中抽取一个容量为100的样本.由于职工年龄与这项指标有关,决定采用分层抽样的方法进行抽取.因为样本容量与总体个数的比为 100∶500=1∶5,所以在各年龄段抽取的个体数依次是 5125,5280,595,即25,56,19.在各年龄段分别抽取时,可采用简单随机抽样,将各年龄段抽取的个体合在一起,就是所要抽取的样本.是编号;二是定位置;三选数.定住位置后,读数的方向可以向右,也可以向左、向上、向下等.取数过程中,要把不符合要求的数(超过最大编码)和与前面重复的数去掉.利用随机数表选取样本的一般步骤:①编号;②定位;③选数.选数过程中,重复的数字只取一个,超过最大编号的数不能取.思维拓展定位置是任意的,选数的顺序是任意的,没有任何约束,所以选取的样本的编号可以是多种多样的,并不唯一.全析提示当已知总体由差异明显的几部分组成时,为了使样本充分地反映总体的情况,常将总体分成几部分,然后按照各部分所占比例进行抽样.由于分层抽样充分地利用了我们所掌握的信息,使样本具有较好地代表性,而在各层中进行抽样时,大多数情况下采用简单随机抽样,有时也会用到其他方法,这样需根据问题的需要来决定.本例符合分层抽样的特点和适用范围.课本例2,显然不同类型的农田之间的产量有较大差异,也就是说,总体由差异明显的几部分组成,故采用分层抽样的方法,对不同类型的农田按其总数的比例来抽取.假设本例中共有农田500亩,山地、丘陵、平原和洼地各占农田总数的10%、20%、40%和30%,欲抽取50亩进行产量调查,则应抽取5亩山地、10亩丘陵、20亩平原和15亩洼地.课本例3,由于不同层次管理人员的收入差异很大,故采取分层抽样的方法.不同层抽取样本的数目等于抽取样本总数与不同层次管理人员所占总体比例的积,所以应抽取:高层管理人员:100×5%=5(人),中层管理人员:100×15%=15(人),一般员工:100×80%=80(人).4.系统抽样系统抽样是将总体的个体进行编号,按照简单随机抽样抽取第一个样本,然后按照相同的间隔(称为抽抽样距)抽取其他样本,这种抽样方法有时也叫等距抽样或机械抽样.例如,为了了解参加某种知识竞赛的1000名学生的成绩,打算从中抽一个容量为50的样本.假定这1000名学生的编号是1,2,…,1000,由于50∶1000=1∶20,我们将总体分成50个部分,其中每一部分包括20个个体,例如第一部分的编号是1,2,3,…,20,然后在第一部分随机抽取一个号码,比如它是18号,那么可以从第18号起,每隔20个抽取一个号码,这样得到了一个容量为50的样本,它们的号码分别是:18,38,58,…,978,998.由于总体中的个体数1000正好能被样本容量整除,可以用它们的比值作为抽样距.如果不能整除,比如总体中的个数为1003,样本容量仍为50,这时可先用简单随机抽样先从总体中剔除3个个体,使剩下的个体数1000能被50整除,然后再按系统抽样法往下进行.在抽样时,如果总体的排列存在明显的周期性或者事先是排好序的,那么利用系统抽样进行抽样时将会产生明显的偏差,因为这样抽取的样本不具有代表性.如课本P20思考交流中的两个问题,第一个问题中,抽取的样本不具备代表性,身体偏高;第二个问题中,采取这样的抽样方法,只对周一的交通流量进行了统计,无法代表一个月的状况,只要改变抽样距,如抽样距改为6,就可以了.课本例4,由于总体个体数太大,又无明显的层次差异,所以不能采用简单随机抽样和分层抽样,采用系统抽样是比较合适的.课本给出了系统抽样的一般步骤,要严格地按步骤进行抽样.第一步,确定分段情况,所抽取样本数就是需要分的段数,应为50;确定抽样距,抽样距=总体个体数/抽取样本数=10000/50=200;第二步,按顺序进行编号;要点提炼采用分层抽样时,不同层次所选取的样本数=抽取样本总数×该层所占总体的比例.全析提示当总体容量和样本容量都很大时,采用简单随机抽样或分层抽样,都是非常麻烦的,系统抽样正好能解决这个问题.要点提炼用系统抽样抽取一定容量的样本时,首先要分清总体中的个数是否能被样本容量整除,否则就会出现抽样距不等的情况,就不合乎系统抽样的原则.全析提示在利用系统抽样进行抽样时,要注意总体的排列有没有明显的周期性,这时抽样距的选取要恰当,要打乱周期性;如果总体事先排好序,要先打乱顺序,再抽样,以达到抽取的样本具有广泛的代表性.系统抽样的步骤:①确定分段情况和抽样距;②编号;③确定第一个样本编号;④等距抽样.在确定第一个样本编号时,一定要采用简单随机抽样,并且一定要在第一段内抽取,否则无法保证等距抽样.对于系统抽样,经常遇见的两种情况要加以区分,以避免不必要的麻烦.第三步,采用简单随机抽样从第一个时间段抽取第一个样本;第四步,等距抽样,顺序抽取相应编号的样本.课本例5,本例与例4的不同之处在于,总体个体数不能被样本总数整除,这时可把商作为抽样距,余数得通过简单随机抽样从总体中剔除,对剩余进行编号,其余完全同例4.5.三种抽样方法的比较上面介绍了简单随机抽样、分层抽样和系统抽样.下面通过列表将它们作一个简单的比较.三种抽样方法的比较熟悉三种抽样方法各自的特点和适用范围,以便针对不同的实际问题,采取不同的抽样方法.。
统计案例分析及典型例题
统计案例分析及典型例题§11.1 抽样方法基础自测1.为了了解所加工的一批零件的长度,抽取其中200个零件并测量了其长度,在这个问题中,总体的一个样本是 .答案 200个零件的长度2.某城区有农民、工人、知识分子家庭共计2 004户,其中农民家庭1 600户,工人家庭303户,现要从中抽取容量为40的样本,则在整个抽样过程中,可以用到下列抽样方法:①简单随机抽样,②系统抽样,③分层抽样中的 .答案①②③3.某企业共有职工150人,其中高级职称15人,中级职称45人,初级职称90人.现采用分层抽样抽取容量为30的样本,则抽取的各职称的人数分别为 .答案3,9,184.某工厂生产A、B、C三种不同型号的产品,其相应产品数量之比为2∶3∶5,现用分层抽样方法抽出一个容量为n的样本,样本中A型号产品有16件,那么此样本的容量n= .答案80例1某大学为了支援我国西部教育事业,决定从2007应届毕业生报名的18名志愿者中,选取6人组成志愿小组.请用抽签法和随机数表法设计抽样方案.解抽签法:第一步:将18名志愿者编号,编号为1,2,3, (18)第二步:将18个号码分别写在18张外形完全相同的纸条上,并揉成团,制成号签;第三步:将18个号签放入一个不透明的盒子里,充分搅匀;第四步:从盒子中逐个抽取6个号签,并记录上面的编号;第五步:所得号码对应的志愿者,就是志愿小组的成员.随机数表法:第一步:将18名志愿者编号,编号为01,02,03, (18)第二步:在随机数表中任选一数作为开始,按任意方向读数,比如第8行第29列的数7开始,向右读;第三步:从数7开始,向右读,每次取两位,凡不在01—18中的数,或已读过的数,都跳过去不作记录,依次可得到12,07,15,13,02,09.第四步:找出以上号码对应的志愿者,就是志愿小组的成员.例2 某工厂有1 003名工人,从中抽取10人参加体检,试用系统抽样进行具体实施. 解 (1)将每个人随机编一个号由0001至1003. (2)利用随机数法找到3个号将这3名工人剔除. (3)将剩余的1 000名工人重新随机编号由0001至1000. (4)分段,取间隔k =100001=100将总体均分为10段,每段含100个工人.(5)从第一段即为0001号到0100号中随机抽取一个号l .(6)按编号将l ,100+l ,200+l ,…,900+l 共10个号码选出,这10个号码所对应的工人组成样本. 例3 (14分)某一个地区共有5个乡镇,人口3万人,其中人口比例为3∶2∶5∶2∶3,从3万人中抽取一个300人的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程.解 应采取分层抽样的方法.3分过程如下:(1)将3万人分为五层,其中一个乡镇为一层.5分(2)按照样本容量的比例随机抽取各乡镇应抽取的样本. 300×153=60(人);300×152=40(人); 300×155=100(人);300×152=40(人); 300×153=60(人),10分因此各乡镇抽取人数分别为60人,40人,100人,40人,60人.12分(3)将300人组到一起即得到一个样本.14分练习:一、填空题1.(安庆模拟)某校高中生共有900人,其中高一年级300人,高二年级200人,高三年级400人,现分层抽取容量为45的样本,那么高一、高二、高三年级抽取的人数分别为 .答案15,10,202.某牛奶生产线上每隔30分钟抽取一袋进行检验,则该抽样方法为①;从某中学的30名数学爱好者中抽取3人了解学习负担情况,则该抽样方法为②.那么①,②分别为 .答案系统抽样,简单随机抽样3.下列抽样实验中,最适宜用系统抽样的是(填序号).①某市的4个区共有2 000名学生,且4个区的学生人数之比为3∶2∶8∶2,从中抽取200人入样②某厂生产的2 000个电子元件中随机抽取5个入样③从某厂生产的2 000个电子元件中随机抽取200个入样④从某厂生产的20个电子元件中随机抽取5个入样答案③4.(2013·重庆文)某校高三年级有男生500人,女生400人,为了解该年级学生的健康情况,从男生中任意抽取25人,从女生中任意抽取20人进行调查,这种抽样方法是 .答案分层抽样法5.某中学有高一学生400人,高二学生300人,高三学生200人,学校团委欲用分层抽样的方法抽取18名学生进行问卷调查,则下列判断不正确的是(填序号).①高一学生被抽到的概率最大②高三学生被抽到的概率最大③高三学生被抽到的概率最小④每名学生被抽到的概率相等答案①②③6.某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40种、10种、30种、20种,现从中抽取一个容量为20的样本进行食品安全检测,若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是 .答案 67.(天津文,11)一个单位共有职工200人,其中不超过45岁的有120人,超过45岁的有80人.为了调查职工的健康状况,用分层抽样的方法从全体职工中抽取一个容量为25的样本,应抽取超过45岁的职工人.答案108.将参加数学竞赛的1 000名学生编号如下0001,0002,0003,…,1000,打算从中抽取一个容量为50的样本,按系统抽样的方法分成50个部分,如果第一部分编号为0001,0002,…,0020,从第一部分随机抽取一个号码为0015,则第40个号码为 . 答案 07959.某政府机关有在编人员100人,其中副处级以上干部10人,一般干部70人,工人20人,上级机关为了了解政府机构改革意见,要从中抽取一个容量为20的样本,试确定用何种方法抽取,如何抽取? 解 用分层抽样抽取. (1)∵20∶100=1∶5, ∴510=2,570=14,520=4∴从副处级以上干部中抽取2人,一般干部中抽取14人,从工人中抽取4人.(2)因副处级以上干部与工人人数较少,可用抽签法从中分别抽取2人和4人;对一般干部可用随机数表法抽取14人.(3)将2人、4人、14人编号汇合在一起就得到了容量为20的样本.10.某单位有工程师6人,技术员12人,技工18人,要从这些人中抽取一个容量为n 的样本.如果采用系统抽样法和分层抽样法抽取,不用剔除个体;如果样本容量增加一个,则在采用系统抽样时,需要在总体中先剔除1个个体,求样本容量n .解 总体容量为6+12+18=36.当样本容量是n 时,由题意知,系统抽样的间隔为n36,分层抽样的比例是36n ,抽取工程师36n ×6=6n (人),抽取技术人员36n ×12=3n (人),抽取技工36n×18=2n (人).所以n 应是6的倍数,36的约数即n =6,12,18,36.当样本容量为(n +1)时,在总体中剔除1人后还剩35人,系统抽样的间隔为135+n ,因为135+n 必须是整数,所以n 只能取6,即样本容量为6.总体分布的估计与总体特征数的估计基础自测1.一个容量为20的样本,已知某组的频率为0.25,则该组的频数为 . 答案 52.(2008·山东理)右图是根据《山东统计年鉴2007》中的资料作成的1997年至2006年我省城镇居民百户家庭人口数的茎叶图.图中左边的数字从左到右分别表示城镇居民百户家庭人口数的百位数字和十位数字,右边的数字表示城镇居民百户家庭人口数的个位数字.从图中可以得到1997年至2006年我省城镇居民百户家庭人口数的平均数为 . 答案 303.63.在抽查产品的尺寸过程中,将其尺寸分成若干组,[a ,b )是其中的一组,抽查出的个体在该组上的频率为m ,该组在频率分布直方图的高为h ,则|a -b |= . 答案 hm4.(2008·山东文,9)从某项综合能力测试中抽取100人的成绩,统计如表,则这100人成绩的标准差为 .分数 5 4 3 2 1 人数2010303010答案 51025.为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁~18岁的男生体重(kg ),得到频率分布直方图如下:根据上图可得这100名学生中体重在[56.5,64.5)的学生人数是 . 答案 40典型例题:例1 在学校开展的综合实践活动中,某班进行了小制作评比,作品上交时间为5月1日至30日,评委会把同学们上交 作品的件数按5天一组分组统计,绘制了频率分布直方图(如图所示),已知从左到右各长方形高的比为2∶3∶4∶6∶4∶1,第三组的频数为12,请解答下列问题:(1)本次活动共有多少件作品参加评比? (2)哪组上交的作品数量最多?有多少件?(3)经过评比,第四组和第六组分别有10件、2件作品获奖,问这两组哪组获奖率高? 解 (1)第三组的频率为1464324+++++=51又因为第三组的频数为12,∴参评作品数为5112=60.(2)根据频率分布直方图,可以看出第四组上交的作品数量最多,共有60×1464326+++++=18(件).(3)第四组的获奖率是1810=95,第六组上交的作品数量为60×1464321+++++=3(件),∴第六组的获奖率为32=96,显然第六组的获奖率高.例4(14分)某化肥厂甲、乙两个车间包装肥料,在自动包装传送带上每隔30 min 抽取一包产品,称其重量,分别 记录抽查数据如下: 甲:102, 101, 99, 98, 103, 98,99;乙:110, 115, 90,85,75,115, 110.(1)这种抽样方法是哪一种? (2)将这两组数据用茎叶图表示;(3)将两组数据比较,说明哪个车间产品较稳定. 解 (1)因为间隔时间相同,故是系统抽样. 2分(2)茎叶图如下:5分(3)甲车间: 平均值:1x =71(102+101+99+98+103+98+99)=100,7分方差:s 12=71[(102-100)2+(101-100)2+…+(99-100)2]≈3.428 6.9分乙车间:平均值:2x =71(110+115+90+85+75+115+110)=100,11分方差:s 22=71[(110-100)2+(115-100)2+…+(110-100)2]≈228.571 4.13分∵1x =2x ,s 12<s 22,∴甲车间产品稳定.14分练习:1.为了了解小学生的体能情况,抽取了某小学同年级部分学生进行跳绳测试,将所得数据整理后,画出频率分布直方图如图所示,已知图中从左到右前三个小组的频率分别是0.1,0.3,0.4,第一小组的频数为5.(1)求第四小组的频率;(2)参加这次测试的学生人数是多少?(3)在这次测试中,学生跳绳次数的中位数落在第几小组内? 解 (1)第四小组的频率=1-(0.1+0.3+0.4)=0.2. (2)设参加这次测试的学生人数是n , 则有n =第一小组频率第一小组频数=5÷0.1=50(人).(3)因为0.1×50=5,0.3×50=15,0.4×50=20,0.2×50=10,即第一、第二、第三、第四小组的频数分别为5、15、20、10,所以学生跳绳次数的中位数落在第三小组内. 练习:一、填空题1.下列关于频率分布直方图的说法中不正确的是 .①直方图的高表示取某数的频率②直方图的高表示该组上的个体在样本中出现的频率③直方图的高表示该组上的个体数与组距的比值④直方图的高表示该组上的个体在样本中出现的频率与组距的比值答案①②③2.甲、乙两名新兵在同样条件下进行射击练习,每人打5发子弹,命中环数如下:甲:6,8,9,9,8;乙:10,7,7,7,9.则这两人的射击成绩比稳定.答案甲乙4.某班50名学生在一次百米测试中,成绩全部介于13秒与19秒之间,将测试结果分成六组:右图是得到的频率分布直方图.设成绩小于17秒的学生人数占全班总人数的百分比为x,成绩大于等于15秒且小于17秒的学生人数为y,则从频率分布直方图中可分析出x和y分别为 .答案0.9, 356.甲、乙两名同学在5次体育测试中的成绩统计的茎叶图如图所示,若甲、乙两人的平均成绩分别是x甲、x乙,则x甲x乙,比稳定.答案<乙甲7.(上海,9)已知总体的各个体的值由小到大依次为2,3,3,7,a,b,12,13.7,18.3,20,且总体的中位数为10.5.若要使该总体的方差最小,则a、b的取值分别是 .答案10.5、10.5二、解答题10.为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少? (3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由. 解 (1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小, 因此第二小组的频率为:391517424+++++=0.08.又因为频率=样本容量第二小组频数, 所以样本容量=第二小组频率第二小组频数=08.012=150. (2)由图可估计该学校高一学生的达标率约为39151742391517++++++++×100%=88%.(3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内.线性回归方程1.下列关系中,是相关关系的为 (填序号). ①学生的学习态度与学习成绩之间的关系; ②教师的执教水平与学生的学习成绩之间的关系; ③学生的身高与学生的学习成绩之间的关系; ④家庭的经济条件与学生的学习成绩之间的关系. 答案 ①②2.为了考察两个变量x 、y 之间的线性相关关系,甲、乙两同学各自独立地做10次和15次试验,并利用最小二乘法求得回归直线分别为l 1和l 2.已知在两人的试验中发现变量x 的观测数据的平均值恰好基础自测相等,都为s,变量y的观测数据的平均值也恰好相等,都为t,那么下列说法中正确的是(填序号).①直线l1,l2有交点(s,t)②直线l1,l2相交,但是交点未必是(s,t)③直线l1,l2由于斜率相等,所以必定平行④直线l1,l2必定重合答案①3.下列有关线性回归的说法,正确的是(填序号).①相关关系的两个变量不一定是因果关系②散点图能直观地反映数据的相关程度③回归直线最能代表线性相关的两个变量之间的关系④任一组数据都有回归直线方程答案①②③4.下列命题:①线性回归方法就是由样本点去寻找一条贴近这些样本点的直线的数学方法;②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示;③通过回归直线yˆ=bˆx+aˆ及回归系数bˆ,可以估计和预测变量的取值和变化趋势.其中正确命题的序号是 .答案①②③5.已知回归方程为yˆ=0.50x-0.81,则x=25时,yˆ的估计值为 .答案11.69例1下面是水稻产量与施化肥量的一组观测数据:施化肥量15 20 25 30 35 40 45水稻产量320 330 360 410 460 470 480(1)将上述数据制成散点图;(2)你能从散点图中发现施化肥量与水稻产量近似成什么关系吗?水稻产量会一直随施化肥量的增加而增长吗?解(1)散点图如下:(2)从图中可以发现施化肥量与水稻产量具有线性相关关系,当施化肥量由小到大变化时,水稻产量由小变大,图中的数据点大致分布在一条直线的附近,因此施化肥量和水稻产量近似成线性相关关系,但水稻产量只是在一定范围内随着化 肥施用量的增加而增长.例2 (14分)随着我国经济的快速发展,城乡居民的生活水平不断提高,为研究某市家庭平均收入与月平均生活支出的关系,该市统计部门随机调查了10个家庭,得数据如下:家庭编号 12345678910x i (收入)千元 0.8 1.1 1.3 1.5 1.5 1.8 2.0 2.2 2.4 2.8y i (支出)千元0.7 1.0 1.2 1.0 1.3 1.5 1.3 1.7 2.0 2.5(1)判断家庭平均收入与月平均生活支出是否相关? (2)若二者线性相关,求回归直线方程. 解 (1)作出散点图:5分观察发现各个数据对应的点都在一条直线附近,所以二者呈线性相关关系. 7分(2)x =101 (0.8+1.1+1.3+1.5+1.5+1.8+2.0+2.2+2.4+2.8)=1.74,y =101(0.7+1.0+1.2+1.0+1.3+1.5+1.3+1.7+2.0+2.5)=1.42,9分bˆ=∑∑==-•-ni ini i i x n xyx n y x 1221≈0.813 6,a ˆ=1.42-1.74×0.813 6≈0.004 3,13分∴回归方程y ˆ=0.813 6x +0.004 3. 14分例3 下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨)标准煤的几组对照数据.x 3 4 5 6 y2.5344.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程yˆ=b ˆx +a ˆ; (3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤? (参考数值:3×2.5+4×3+5×4+6×4.5=66.5) 解 (1)散点图如下图:(2)x =46543+++=4.5,y =45.4435.2+++=3.5∑=41i ii yx =3×2.5+4×3+4×5+6×4.5=66.5.∑=412i ix=32+42+52+62=86∴bˆ=24124144x x yx yx i i i ii -•-∑∑===25.44865.45.345.66⨯-⨯⨯-=0.7aˆ =y -b ˆx =3.5-0.7×4.5=0.35. ∴所求的线性回归方程为yˆ=0.7x +0.35. (3)现在生产100吨甲产品用煤y =0.7×100+0.35=70.35,∴降低90-70.35=19.65(吨)标准煤.1.科研人员为了全面掌握棉花新品种的生产情况,查看了气象局对该地区年降雨量与年平均气温的统计数据(单位分别是mm,℃),并作了统计.年平均气温 12.51 12.84 12.84 13.69 13.33 12.74 13.05 年降雨量748542507813574701432(1)试画出散点图;(2)判断两个变量是否具有相关关系. 解 (1)作出散点图如图所示,(2)由散点图可知,各点并不在一条直线附近,所以两个变量是非线性相关关系.2.在研究硝酸钠的可溶性程度时,对于不同的温度观测它在水中的溶解度,得观测结果如下:温度(x ) 0 10 20 50 70 溶解度(y )66.776.085.0112.3128.0由资料看y 与x 呈线性相关,试求回归方程. 解 x =30,y =50.1283.1120.850.767.66++++=93.6.bˆ=25125155x xyx yx i ii ii -•-∑∑==≈0.880 9.aˆ=y -b ˆx =93.6-0.880 9×30=67.173. ∴回归方程为yˆ=0.880 9x +67.173.3.某企业上半年产品产量与单位成本资料如下:月份 产量(千件)单位成本(元)1 2 73 2 3 72 3 4 71 4 3 73 5 4 69 6568(1)求出线性回归方程;(2)指出产量每增加1 000件时,单位成本平均变动多少? (3)假定产量为6 000件时,单位成本为多少元? 解 (1)n =6,∑=61i i x =21,∑=61i i y =426,x =3.5,y =71,∑=612i i x =79,∑=61i i i y x =1 481,bˆ=26126166x x yx yx i i i ii -•-∑∑===25.3679715.364811⨯-⨯⨯-=-1.82.aˆ=y -b ˆx =71+1.82×3.5=77.37. 回归方程为yˆ=a ˆ+b ˆx =77.37-1.82x . (2)因为单位成本平均变动bˆ=-1.82<0,且产量x 的计量单位是千件,所以根据回归系数b 的意义有: 产量每增加一个单位即1 000件时,单位成本平均减少1.82元. (3)当产量为6 000件时,即x =6,代入回归方程:yˆ=77.37-1.82×6=66.45(元) 当产量为6 000件时,单位成本为66.45元.一、填空题1.观察下列散点图,则①正相关;②负相关;③不相关.它们的排列顺序与图形对应顺序是 .答案 a ,c ,b2.回归方程yˆ=1.5x -15,则下列说法正确的有 个. ①y =1.5x -15 ②15是回归系数a ③1.5是回归系数a ④x =10时,y =0 答案 13.(2009.湛江模拟)某地区调查了2~9岁儿童的身高,由此建立的身高y (cm)与年龄x (岁)的回归模型为yˆ=8.25x +60.13,下列叙述正确的是 . ①该地区一个10岁儿童的身高为142.63 cm ②该地区2~9岁的儿童每年身高约增加8.25 cm ③该地区9岁儿童的平均身高是134.38 cm④利用这个模型可以准确地预算该地区每个2~9岁儿童的身高 答案 ②4.三点(3,10),(7,20),(11,24)的回归方程是 .答案 yˆ=1.75x +5.75 5.某人对一地区人均工资x (千元)与该地区人均消费y (千元)进行统计调查,y 与x 有相关关系,得到回归直线方程yˆ=0.66x +1.562.若该地区的人均消费水平为7.675千元,估计该地区的人均消费额占人均工资收入的百分比约为 . 答案 83%6.某化工厂为预测产品的回收率y ,需要研究它和原料有效成分含量x 之间的相关关系,现取8对观测值,计算,得∑=81i i x =52, ∑=81i i y =228, ∑=812i i x =478, ∑=81i i i y x =1 849,则其线性回归方程为 .答案 yˆ=11.47+2.62x 7.有下列关系:①人的年龄与他(她)拥有的财富之间的关系;②曲线上的点与该点的坐标之间的关系;③苹果的产量与气候之间的关系;④森林中的同一种树木,其断面直径与高度之间的关系.其中,具有相关关系的是 .答案①③④8.已知关于某设备的使用年限x与所支出的维修费用y(万元),有如下统计资料:使用年限2 3 4 5 6x维修费用2.23.8 5.5 6.5 7.0y若y对x呈线性相关关系,则回归直线方程yˆ=bˆx+aˆ表示的直线一定过定点 .答案(4,5)二、解答题9.期中考试结束后,记录了5名同学的数学和物理成绩,如下表:学生A B C D E学科数学80 75 70 65 60物理70 66 68 64 62(1)数学成绩和物理成绩具有相关关系吗?(2)请你画出两科成绩的散点图,结合散点图,认识(1)的结论的特点.解(1)数学成绩和物理成绩具有相关关系.(2)以x轴表示数学成绩,y轴表示物理成绩,可得相应的散点图如下:由散点图可以看出,物理成绩和数学成绩对应的点不分散,大致分布在一条直线附近.10.以下是某地搜集到的新房屋的销售价格y和房屋的面积x的数据:房屋面积x(m2) 115 110 80 135 105销售价格y(万24.8 21.6 18.4 29.2 22元)(1)画出数据对应的散点图;(2)求线性回归方程,并在散点图中加上回归直线. 解 (1)数据对应的散点图如图所示:(2)x =109,y =23.2,∑=512i i x =60 975,∑=51i iiy x=12 952,bˆ=25125155x xyx yx i ii ii -•-∑∑==≈0.196 2aˆ=y -b ˆx ≈1.814 2 ∴所求回归直线方程为yˆ=0.196 2x +1.814 2. 11.某公司利润y 与销售总额x (单位:千万元)之间有如下对应数据:x 10 15 17 20 25 28 32 y11.31.822.62.73.3(1)画出散点图; (2)求回归直线方程;(3)估计销售总额为24千万元时的利润. 解 (1)散点图如图所示:(2)x =71(10+15+17+20+25+28+32)=21,y =71(1+1.3+1.8+2+2.6+2.7+3.3)=2.1,∑=712i i x =102+152+172+202+252+282+322=3 447,∑=71i iiy x=10×1+15×1.3+17×1.8+20×2+25×2.6+28×2.7+32×3.3=346.3,bˆ=27127177x x yx yx i i i ii -•-∑∑===221744731.22173.346⨯-⨯⨯-≈0.104, aˆ=y -b ˆx =2.1-0.104×21=-0.084, ∴yˆ=0.104x -0.084. (3)把x =24(千万元)代入方程得,yˆ=2.412(千万元). ∴估计销售总额为24千万元时,利润为2.412千万元.12.某种产品的广告费支出x 与销售额y (单位:百万元)之间有如下对应数据:x 2 4 5 6 8 y3040605070(1)画出散点图; (2)求回归直线方程;(3)试预测广告费支出为10百万元时,销售额多大? 解 (1)根据表中所列数据可得散点图如下:(2)列出下表,并用科学计算器进行有关计算:i 1 2 3 4 5 x i 2 4 5 6 8 y i3040605070x i y i60 160 300 300 560因此,x =525=5,y =5250 =50,∑=512i i x =145, ∑=512i i y =13 500, ∑=51i i i y x =1 380.于是可得:bˆ=25125155x xyx yx i ii ii -•-∑∑===55514550553801⨯⨯-⨯⨯-=6.5;aˆ=y -b ˆx =50-6.5×5=17.5. 因此,所求回归直线方程为:yˆ=6.5x +17.5. (3)根据上面求得的回归直线方程,当广告费支出为10百万元时,yˆ=6.5×10+17.5=82.5(百万元),即这种产品的销售收入大约为82.5百万元.§11.4 统计案例1.对有线性相关关系的两个变量建立的回归直线方程y ˆ=a ˆ+b ˆx 中,回归系数bˆ与0的大小关系为 .(填序号) ①大于或小于 ②大于 ③小于 ④不小于答案 ①2.如果有90%的把握说事件A 和B 有关系,那么具体计算出的数据χ2 2.706.(用“>”,“<”,“=”填空) 答案 >3.对两个变量y 与x 进行回归分析,分别选择不同的模型,它们的相关系数r 如下,其中拟合效果最好的模型是 .基础自测①模型Ⅰ的相关系数r 为0.98 ②模型Ⅱ的相关系数r 为0.80 ③模型Ⅲ的相关系数r 为0.50 ④模型Ⅳ的相关系数r 为0.25 答案 ①4.下列说法中正确的有:①若r >0,则x 增大时,y 也相应增大;②若r <0,则x 增大时,y 也相应增大;③若r =1或r =-1,则x 与y 的关系完全对应(有函数关系),在散点图上各个点均在一条直线上 . 答案 ①③例1 (14分)调查339名50岁以上人的吸烟习惯与患慢性气管炎的情况,获数据如下:患慢性气管炎未患慢性气管炎 总计 吸烟 43 162 205 不吸烟 13 121 134 合计56283339试问:(1)吸烟习惯与患慢性气管炎是否有关? (2)用假设检验的思想给予证明. (1)解 根据列联表的数据,得到χ2=))()()(()(2c d b d c a b a bc ad n ++++- 2分 =13428356205)1316212143(3392⨯⨯⨯⨯-⨯⨯=7.469>6.6356分 所以有99%的把握认为“吸烟与患慢性气管炎有关”.9分(2)证明 假设“吸烟与患慢性气管炎之间没有关系”,由于事件A ={χ2≥6.635}≈0.01,即A 为小概率事件,而小概率事件发生了,进而得假设错误,这种推断出错的可能性约有1%.14分例2 一台机器使用时间较长,但还可以使用.它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有 缺点零件的多少,随机器运转的速度而变化,下表为抽样试验结果:(1)对变量y 与x 进行相关性检验;(2)如果y 与x 有线性相关关系,求回归直线方程;(3)若实际生产中,允许每小时的产品中有缺点的零件最多为10个,那么,机器的运转速度应控制在什么范围内?解 (1)x =12.5,y =8.25,∑=41i iiy x=438,4x y =412.5,∑=412i i x =660,∑=412i i y =291,所以r =)4)(4(42412241241y yx xyx yx i ii ii ii --•-∑∑∑====)25.272291()625660(5.412438-⨯--=25.6565.25≈62.2550.25≈0.995 4.因为r >r 0.05,所以y 与x 有很强的线性相关关系.(2)yˆ=0.728 6x -0.857 1. (3)要使yˆ≤10⇒0.728 6x -0.857 1≤10, 所以x ≤14.901 3.所以机器的转速应控制在14.901 3转/秒以下.例3 下表是某年美国旧轿车价格的调查资料,今以x 表示轿车的使用年数,y 表示相应的年均价格,求y 关于x 的回归 方程.数x年均价格y(美元)2 651 1 943 1 494 1 087 765 538 484 290 226 204解作出散点图如图所示.可以发现,各点并不是基本处于一条直线附近,因此,y与x之间应是非线性相关关系.与已学函数图象比较,用yˆ=e a x bˆˆ 来刻画题中模型更为合理,令zˆ=ln yˆ,则zˆ=bˆx+aˆ,题中数据变成如下表所示:x 1 2 3 4 5 6 7 8 9 10z 7.8837.5727.3096.9916.646.2886.1825.675.4215.318相应的散点图如图所示,从图中可以看出,变换的样本点分布在一条直线附近,因此可以用线性回归方程拟合.由表中数据可得r≈-0.996.|r|>r0.05.认为x与z之间具有线性相关关系,由表中数据得bˆ≈-0.298,aˆ≈8.165,所以zˆ=-0.298x+8.165,最后回代zˆ=ln yˆ,即yˆ=e-0.298x+8.165为所求.1.某班主任对全班50名学生学习积极性和对待班级工作的态度进行了调查,统计数据如下表所示:积极参加班级工作不太主动参加班级工作合计学习积极性高18 7 25(1)如果随机抽查这个班的一名学生,那么抽到积极参加班级工作的学生的概率是多少?抽到不太主动参加班级工作且学习积极性一般的学生的概率是多少?(2)试运用独立性检验的思想方法分析:学生的学习积极性与对待班级工作的态度是否有关系?说明理由.解 (1)随机抽查这个班的一名学生,有50种不同的抽查方法,由于积极参加班级工作的学生有18+6=24人,所以有24种不同的抽法,因此由古典概型的计算公式可得抽到积极参加班级工作的学生的概率是P 1=5024=2512,又因为不太主动 参加班级工作且学习积极性一般的学生有19人,所以抽到不太主动参加班级工作且学习积极性一般的学生的概率是P 2=5019.(2)由2χ统计量的计算公式得2χ=25252624)761918(502⨯⨯⨯⨯-⨯⨯≈11.538,由于11.538>10.828,所以可以有99.9%的把握认为“学生的学习积极性与对待班级工作的态度有关系”.2.某个体服装店经营某种服装,一周内获纯利y (元)与该周每天销售这种服装的件数x 之间的一组数据如下:已知∑=712i i x =280, ∑=712i i y =45 309, ∑=71i i i y x =3 487,此时r 0.05=0.754.(1)求x ,y ;(2)判断一周内获纯利润y 与该周每天销售件数x 之间是否线性相关,如果线性相关,求出回归直线方程.解 (1)x =71(3+4+5+6+7+8+9)=6,y =71(66+69+73+81+89+90+91)≈79.86.(2)根据已知∑=712i i x =280, ∑=712i i y =45 309, ∑=71i i i y x =3 487,得相关系数 r =)86.79730945)(67280(86.7967487322⨯-⨯-⨯⨯-≈0.973.。
初中数学-概率与统计题知识点汇总-中考备考完美版
中考数学统计与概率(最新完美版)一、 选择题1.从1,2,﹣3三个数中,随机抽取两个数相乘,积是正数的概率是 ( )A 、0B 、13C 、23D 、12.下列事件为必然事件的是( )A 、打开电视机,它正在播广告B 、抛掷一枚硬币,一定正面朝上C 、投掷一枚普通的正方体骰子,掷得的点数小于7D 、某彩票的中奖机会是1%,买1张一定不会中奖 3.下列事件中,属于必然事件的是( )A .打开电视机,它正在播广告B .打开数学书,恰好翻到第50页C .抛掷一枚均匀的硬币,恰好正面朝上D .一天有24小时4.九年级一班5名女生进行体育测试,她们的成绩分别为70,80,85,75,85(单位: 分),这次测试成绩的众数和中位数分别是( )A .79,85B .80,79C .85,80D .85,855.有5张形状、大小、质地均相同的卡片,背面完全相同,正面分别印有等边三角形、平行四边形、菱形、等腰梯形和圆五种不同的图案.将这5张卡片洗匀后正面朝下放在桌面上,从中随机抽出一张,抽出的卡片正面图案是中心对称图形的概率为( )A .15B .25C .35D .456.数名射击运动员第一轮比赛成绩如下表所示;环数 7 8 9 10 人数4231则他们本轮比赛的平均成绩是( )A .7.8环B .7.9环 C. 8.l 环 D .8.2环 二、填空题1.已知地球表面陆地面积与海洋面积的比约为3:7.如果宇宙中飞来一块陨石落在地球上,则落在陆地上的概率是 .2.口袋中有2个红球和3个白球,每个球除颜色外完全相同,从口袋中随机摸出一个红球的概率是_ .3.甲、乙两个参加某市组织的省“农运会”铅球项目选拔赛,各投掷6次,记录成绩,计算平均数和方差的结果为: -x 甲 =13.5m , -x 乙 =13.5m ,S2甲=0.55,S 2乙=0.50,则成绩较稳定的是(填“甲”或“乙”).4.某年6月上旬,厦门市最高气温如下表所示:日期12 3 4 5 6 7 8 9 10 最高气温(℃) 30283032343127323330那么,这些日最高气温的众数为 ℃.5.一组数据10,14,20,24.19,1 6的极差是 。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
随机抽数
问题:给定一组数,可以是学号,姓名,等等。从中随机抽取n个n=1,2,3,……并显示
出来。
要求:1:n是可变的,即程序运行时,输入一个n值,随机抽出n个数据来。
2:随机抽取的数据可以是重复的;
3:随机抽取的数据不可以重复的。
设计思路:
1:分析问题的要求,并以此画出逻辑结构图;
2:由逻辑结构图分别写出每框的功能;
3:再将流程图写出(这就是伪代码)
4:利用伪代码写出程序,并调试运行。
方案1:(仅供参考)
一、先画出逻辑图
二、由逻辑结构图分别写出每框的功能:
S0. 随机抽数主程序。
1. 输入数据
1.1: 输入数组,输入要随机抽数的数组。
1.2: 输入抽取的个数。
2: 随机抽数。
2.1: 可以重复抽取数据。
2.2: 不可以随机抽取数据。
3. 显示结果。
3.1 显示抽取数据之前的数组。
3.2 显示抽取数据之后的数组,抽取的数据。
4. 输入数组,个数,数据。
5. 随机抽数过程:在数组范围内产生一个随机数,重复产生n次随机数。
6. 显示界面函数:显示已存在的数据;
流程图:
S0. 随机抽数主程序:
S 1:输入数据:
S 1.1: 输入数组,输入要随机抽数的数组,保存数组,调S3.1显示抽取数据
之前的数组;
S 1.2: 输入抽取的个数:输入抽取的个数并调S6显示界面函数显示出来。
S 1.3 调S2随机抽数;
S 2:随机抽数; 如果可以重复调S2.1, 否则调S2.2:
S 2.1 可以重复抽取数据:
调随机抽数过程S5在数组中抽取n个数据,调S3显示结果;
S2.2 不可以随机抽取数据:
对数组加标识符,并初始化;
调随机抽数过程S5在数组中抽取n个数据,调S3显示结果;
S3:显示结果。
S3.1 调S6显示抽取数据之前的数组,转入S7;
S3.2 调S6显示抽取数据之后的数组,及抽取的数据,转入S7。
S4. 输入数组,个数,数据。
S5. 随机抽数过程:给出一个数组,从中随机产生一个数。
S6. 显示界面函数。
S7. 结束。
方案2:
你说呢?……