随机抽题算法
高考数学一轮复习专题训练—随机抽样

随机抽样考纲要求1.理解随机抽样的必要性和重要性;2.会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法.会用随机抽样的基本方法解决一些简单的实际问题.知识梳理1.简单随机抽样(1)定义:设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n ≤N ),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样. (2)最常用的简单随机抽样的方法:抽签法和随机数法. 2.系统抽样(1)定义:当总体中的个体数目较多时,可将总体分成均衡的几个部分,然后按照事先定出的规则,从每一部分抽取一个个体得到所需要的样本,这种抽样方法叫做系统抽样. (2)系统抽样的操作步骤假设要从容量为N 的总体中抽取容量为n 的样本. ①先将总体的N 个个体编号;②确定分段间隔k ,对编号进行分段,当N n (n 是样本容量)是整数时,取k =Nn (否则,先剔除一些个体);③在第1段用简单随机抽样确定第一个个体编号l (l ≤k );④按照一定的规则抽取样本,通常是将l 加上间隔k 得到第2个个体编号(l +k ),再加k 得到第3个个体编号(l +2k ),……,依次进行下去,直到获取整个样本. 3.分层抽样(1)定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样. (2)应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样.1.不论哪种抽样方法,总体中的每一个个体入样的概率都是相同的.2.系统抽样一般也称为等距抽样,入样个体的编号相差分段间隔k的整数倍.3.分层抽样是按比例抽样,每一层入样的个体数为该层的个体数乘抽样比.诊断自测1.判断下列结论正误(在括号内打“√”或“×”)(1)简单随机抽样每个个体被抽到的机会不一样,与先后有关.()(2)系统抽样在起始部分抽样时采用简单随机抽样.()(3)分层抽样中,每个个体被抽到的可能性与层数及分层有关.()(4)要从1 002个学生中用系统抽样的方法选取一个容量为20的样本,需要剔除2个学生,这样对被剔除者不公平.()答案(1)×(2)√(3)×(4)×2.在“世界读书日”前夕,为了了解某地5 000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.在这个问题中,5 000名居民的阅读时间的全体是() A.总体B.个体C.样本的容量D.从总体中抽取的一个样本答案 A解析由题目条件知,5 000名居民的阅读时间的全体是总体;其中每1名居民的阅读时间是个体;从5 000名居民某天的阅读时间中抽取的200名居民的阅读时间是从总体中抽取的一个样本,样本容量是200.3.一个公司共有N名员工,下设一些部门,要采用等比例分层抽样的方法从全体员工中抽取样本容量为n的样本,已知某部门有m名员工,那么从该部门抽取的员工人数是________.答案nm N解析 每个个体被抽到的概率是n N ,设这个部门抽取了x 个员工,则x m =n N ,∴x =nmN.4.(2020·上饶一模)总体由编号为00,01,02,…,48,49的50个个体组成,利用下面的随机数表选取6个个体,选取方法是从随机数表第6行的第9列和第10列数字开始从左到右依次选取两个数字,则选出的第3个个体的编号为( ) 附:第6行至第9行的随机数表如下: 2635 7900 3370 9160 1620 3882 7757 4950 3211 4919 7306 4916 7677 8733 9974 6732 2748 6198 7164 4148 7086 2888 8519 1620 7477 0111 1630 2404 2979 7991 9683 5125 A .3 B .16 C .38 D .20答案 D解析 按随机数表法,从随机数表第6行的第9列和第10列数字开始从左到右依次选取两个数字,超出00~49及重复的不选,则编号依次为33,16,20,38,49,32,…,则选出的第3个个体的编号为20,故选D.5.(2021·郑州调研)某校有高中生1 500人,现采用系统抽样法抽取50人作问卷调查,将高一、高二、高三学生(高一、高二、高三分别有学生495人、490人、515人)按1,2,3,…, 1 500编号,若第一组用简单随机抽样的方法抽取的号码为23,则所抽样本中高二学生的人数为( ) A .15 B .16 C .17 D .18答案 C解析 采用系统抽样法从1 500人中抽取50人,所以将1 500人平均分成50组,每组30人,并且在第一组抽取的号码为23,所以第n 组抽取的号码为a n =23+(n -1)×30=30n -7,而高二学生的编号为496到985,所以496≤30n -7≤985,又n ∈N *,所以17≤n ≤33,则共有17人,故选C.6.(2018·全国Ⅲ卷)某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是________. 答案 分层抽样解析 因为不同年龄段的客户对公司的服务评价有较大差异,所以需按年龄进行分层抽样,才能了解到不同年龄段的客户对公司服务的客观评价.考点一 简单随机抽样及其应用1.下面的抽样方法是简单随机抽样的是( )A .在某年明信片销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式确定号码的后四位为2709的为三等奖B .某车间包装一种产品,在自动包装的传送带上,每隔30分钟抽一包产品,称其重量是否合格C .某学校分别从行政人员、教师、后勤人员中抽取2人、14人、4人了解对学校机构改革的意见D .用抽签方法从10件产品中选取3件进行质量检验 答案 D解析 A ,B 不是简单随机抽样,因为抽取的个体间的间隔是固定的;C 不是简单随机抽样,因为总体中的个体有明显的层次;D 是简单随机抽样.故选D.2.用简单随机抽样的方法从含有10个个体的总体中,抽取一个容量为3的样本,其中某一个体a “第一次被抽到”的可能性与“第二次被抽到”的可能性分别是( ) A.110,110 B .310,15C.15,310 D .310,310答案 A解析 在抽样过程中,个体a 每一次被抽中的概率是相等的,因为总体容量为10,故个体a “第一次被抽到”的可能性与“第二次被抽到”的可能性均为110,故选A.3.(2021·南昌一模)总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()7816657208026314070243699728019832049234493582003623486969387481A.08 B.07 C.02 D.01答案 D解析从第1行第5列和第6列组成的数65开始由左到右依次选出的数为08,02,14,07,01,所以第5个个体编号为01.感悟升华 1.简单随机抽样需满足:(1)被抽取的样本总体的个体数有限;(2)逐个抽取;(3)是不放回抽取;(4)是等可能抽取.2.简单随机抽样常有抽签法(适用于总体中个体数较少的情况)、随机数法(适用于个体数较多的情况).考点二系统抽样及其应用【例1】(1)(2021·太原调研)某校三个年级共有24个班,学校为了了解同学们的心理状况,将每个班编号,依次为1到24,现用系统抽样法,抽取4个班进行调查,若抽到的最小编号为3,则抽取的最大编号为()A.15 B.18 C.21 D.22(2)(2019·全国Ⅰ卷)某学校为了解1 000名新生的身体素质,将这些学生编号为1,2,…,1 000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验.若46号学生被抽到,则下面4名学生中被抽到的是()A.8号学生B.200号学生C.616号学生D.815号学生(3)中央电视台为了解观众对某综艺节目的意见,准备从502名现场观众中抽取10%进行座谈,现用系统抽样的方法完成这一抽样,则在进行分组时,需剔除________个个体,抽样间隔为________.答案 (1)C (2)C (3)2 10解析 (1)由已知得间隔数为k =244=6,则抽取的最大编号为3+(4-1)×6=21.(2)根据题意,系统抽样是等距抽样, 所以抽样间隔为1 000100=10.因为46除以10余6,所以抽到的号码都是除以10余6的数,结合选项知应为616.故选C. (3)把502名观众平均分成50组,由于502除以50的商是10,余数是2,所以每组有10名观众,还剩2名观众,采用系统抽样的方法抽样时,应先用简单随机抽样的方法从502名观众中抽取2名观众,这2名观众不参加座谈;再将剩下的500名观众编号为1,2,3,…,500,并均匀分成50段,每段含50050=10个个体.所以需剔除2个个体,抽样间隔为10.感悟升华 1.如果总体容量N 能被样本容量n 整除,则抽样间隔为k =Nn ,否则,可随机地从总体中剔除余数,然后按系统抽样的方法抽样,特别注意,每个个体被抽到的机会均是nN .2.系统抽样中依次抽取的样本对应的号码就是一个等差数列,首项就是第1组所抽取样本的号码,公差为间隔数,根据等差数列的通项公式就可以确定每一组内所要抽取的样本号码.【训练1】 (1)(2021·衡水调研)衡水中学高三(2)班现有64名学生,随机编号为0,1,2,…,63,依编号顺序平均分成8组,组号依次为1,2,3,…,8.现用系统抽样方法抽取一个容量为8的样本,若在第一组中随机抽取的号码为5,则在第6组中抽取的号码为________. (2)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示:若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是________. 答案 (1)45 (2)4解析 (1)分组间隔为648=8,∵在第一组中随机抽取的号码为5,∴在第6组中抽取的号码为5+5×8=45.(2)依题意,可将编号为1~35号的35个数据分成7组,每组有5个数据,从每组中抽取一人.成绩在区间[139,151]上共有20个数据,分在4个小组内,每组抽取1人,共抽取4人. 考点三 分层抽样及其应用角度1 求某层入样的个体数【例2】 某电视台在网上就观众对其某一节目的喜爱程度进行调查,参加调查的一共有 20 000人,其中各种态度对应的人数如下表所示:最喜爱 喜爱 一般 不喜欢 4 8007 2006 4001 600为此要进行分层抽样,那么在分层抽样时,每类人中应抽取的人数分别为( ) A .25,25,25,25 B .48,72,64,16 C .20,40,30,10 D .24,36,32,8答案 D解析 法一 因为抽样比为10020 000=1200,所以每类人中应抽取的人数分别为4 800×1200=24,7 200×1200=36,6 400×1200=32,1 600×1200=8.法二 最喜爱、喜爱、一般、不喜欢的比例为4 800∶7 200∶6 400∶1 600=6∶9∶8∶2,所以每类人中应抽取的人数分别为66+9+8+2×100=24,96+9+8+2×100=36,86+9+8+2×100=32,26+9+8+2×100=8.角度2 求总体或样本容量【例3】 (1)(2021·东北三省四校联考)某中学有高中生960人,初中生480人,为了了解学生的身体状况,采用分层抽样的方法,从该校学生中抽取容量为n 的样本,其中高中生有24人,那么n 等于( ) A .12B .18C .24D .36(2)(2020·西安调研)甲、乙两套设备生产的同类型产品共4 800件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测.若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为________件. 答案 (1)D (2)1 800解析 (1)根据分层抽样方法知n 960+480=24960,解得n =36.(2)由题设,抽样比为804 800=160.设甲设备生产的产品为x 件,则x60=50,∴x =3 000.故乙设备生产的产品总数为4 800-3 000=1 800.感悟升华 1.求某层应抽个体数量:按该层所占总体的比例计算.2.已知某层个体数量,求总体容量或反之求解:根据分层抽样就是按比例抽样,列比例式进行计算.3.分层抽样的计算应根据抽样比构造方程求解,其中“抽样比=样本容量总体容量=各层样本数量各层个体数量”.【训练2】 (1)(2020·郴州二模)已知我市某居民小区户主人数和户主对户型结构的满意率分别如图1和图2所示,为了解该小区户主对户型结构的满意程度,用分层抽样的方法抽取30%的户主进行调查,则样本容量和抽取的户主对四居室满意的人数分别为( )A .240,18B .200,20C .240,20D .200,18(2)(2021·合肥模拟)某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40种,10种,30种,20种,现从中抽取一个容量为20的样本进行食品安全检测,若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是________. 答案 (1)A (2)6解析 (1)样本容量n =(250+150+400)×30%=240,抽取的户主对四居室满意的人数为150×30%×40%=18.(2)抽样比为2040+10+30+20=15,则抽取的植物油类种数是10×15=2,抽取的果蔬类食品种数是20×15=4,所以抽取的植物油类与果蔬类食品种数之和是2+4=6.A 级 基础巩固一、选择题1.(2020·兰州二模)某学校为响应“平安出行”号召,拟从2 019名学生中选取50名学生加入“交通志愿者”,若采用以下方法选取:先用简单随机抽样方法剔除19名学生,剩下的2 000名再按照系统抽样的方法抽取,则每名学生入选的概率( ) A .不全相等 B .均不相等C .都相等,且为140D .都相等,且为502 019答案 D解析 先用简单随机抽样方法剔除19名学生,剩下的2 000名再按照系统抽样的方法抽取,则每名学生入选的概率相等,且为p =502 019,故选D. 2.(2021·永州模拟)现从已编号(1~50)的50位同学中随机抽取5位以了解他们的数学学习状况,用选取的号码间隔一样的系统抽样方法确定所选取的5位同学的编号可能是( ) A .5,10,15,20,25 B .3,13,23,33,43 C .1,2,3,4,5 D .2,10,18,26,34答案 B解析 抽样间隔为505=10,只有选项B 符合题意.3.(2020·长春一模)完成下列两项调查:①从某社区125户高收入家庭、280户中等收入家庭、95户低收入家庭中选出100户,调查社会购买能力的某项指标;②从某中学的15名艺术特长生中选出3名调查学习负担情况.宜采用的抽样方法依次是( ) A .①简单随机抽样,②系统抽样 B .①分层抽样,②简单随机抽样 C .①系统抽样,②分层抽样 D .①②都用分层抽样 答案 B4.在一个容量为N 的总体中抽取容量为n 的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p 1,p 2,p 3,则( ) A .p 1=p 2<p 3 B .p 2=p 3<p 1 C .p 1=p 3<p 2 D .p 1=p 2=p 3 答案 D解析 由随机抽样的知识知,三种抽样中,每个个体被抽到的概率都相等,故选D. 5. (2021·襄阳联考)如图是调查某学校高三年级男女学生是否喜欢数学的等高条形图,阴影部分的高表示喜欢数学的频率.已知该年级男、女生各500名(所有学生都参加了调查),现从所有喜欢数学的学生中按分层抽样的方式抽取32人,则抽取的男生人数为( )A .16B .32C .24D .8答案 C解析 由题中等高条形图可知喜欢数学的女生和男生的人数比为1∶3,,所以抽取的男生人数为24.故选C.6.某中学400名教师的年龄分布情况如图,现要从中抽取40名教师作样本,若用分层抽样方法,则40岁以下年龄段应抽取( )A .40人B .200人C .20人D .10人答案 C解析 由图知,40岁以下年龄段的人数为400×50%=200,若采用分层抽样应抽取200×40400=20(人).7.为了解1 000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为( ) A .50 B .40 C .25 D .20答案 C解析 由系统抽样的定义知,分段间隔为1 00040=25.8.某工厂在12月份共生产了3 600双皮靴,在出厂前要检查这批产品的质量,决定采用分层抽样的方法进行抽取,若从一、二、三车间抽取的产品数分别为a ,b ,c ,且a ,b ,c 构成等差数列,则第二车间生产的产品数为( )A .800双B .1 000双C .1 200双D .1 500双答案 C解析 因为a ,b ,c 成等差数列,所以2b =a +c ,即第二车间抽取的产品数占抽样产品总数的13,根据分层抽样的性质可知,第二车间生产的产品数占12月份生产总数的13,即为1 200双皮靴. 二、填空题9.某单位在岗职工共620人,为了调查工人用于上班途中的时间,决定抽取62名工人进行调查,若采用系统抽样方法将全体工人编号等距分成62段,再用简单随机抽样法得到第1段的起始编号为4,则第40段应抽取的个体编号为________. 答案 394解析 将620人的编号分成62段,每段10个编号,按系统抽样,所抽取工人编号成等差数列,因此第40段的编号为4+(40-1)×10=394.10.假设要考察某公司生产的500克袋装牛奶的三聚氰胺是否超标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时,将800袋牛奶按000,001,…,799进行编号,若从随机数表第7行第8列的数开始向右读,则得到的第4个样本个体的编号是________(下面摘取了随机数表第7行至第9行).答案 068解析 由随机数表知,前4个样本的个体编号分别是331,572,455,068.11.某企业三月中旬生产A ,B ,C 三种产品共3 000件,根据分层抽样的结果,企业统计员制作了如下的统计表格:由于不小心,表格中A A 产品的样本容量比C 产品的样本容量多10,根据以上信息,可得C 的产品数量是________件. 答案 800解析 设样本容量为x ,则x3 000×1 300=130,∴x =300.∴A 产品和C 产品在样本中共有300-130=170(件). 设C 产品的样本容量为y ,则y +y +10=170,∴y =80. ∴C 产品的数量为3 000300×80=800(件).12.某校高三年级共有30个班,学校心理咨询室为了了解同学们的心理状况,将每个班编号,依次为1到30,现用系统抽样的方法抽取5个班进行调查,若抽到的编号之和为75,则抽到的最小的编号为________. 答案 3解析 系统抽样的抽取间隔为305=6.设抽到的最小编号为x ,则x +(6+x )+(12+x )+(18+x )+(24+x )=75,所以x =3.B 级 能力提升13.我国古代数学算经十书之一的《九章算术》有一衰分问题:今有北乡八千一百人,西乡七千四百八十八人,南乡六千九百一十二人,凡三乡,发役三百人,则北乡遣( ) A .104人 B .108人C .112人D .120人答案 B解析 由题意知,抽样比为 3008 100+7 488+6 912=175,所以北乡遣175×8 100=108(人).14.下列抽取样本的方式属于简单随机抽样的个数为( ) ①从无限多个个体中抽取100个个体作为样本.②盒子里共有80个零件,从中选出5个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里. ③从20件玩具中一次性抽取3件进行质量检验.④某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛. A .0 B .1 C .2 D .3答案 A解析 ①不是简单随机抽样,因为被抽取样本的总体的个数是无限的,而不是有限的;②不是简单随机抽样.因为它是有放回抽样;③不是简单随机抽样.因为这是“一次性”抽取,而不是“逐个”抽取;④不是简单随机抽样.因为不是等可能抽样.故选A.15.某公路设计院有工程师6人,技术员12人,技工18人,要从这些人中抽取n 个人参加市里召开的科学技术大会.如果采用系统抽样和分层抽样的方法抽取,不用剔除个体,如果参会人数减少1人,在采用系统抽样时,需要在总体中先剔除2个个体,则n =________. 答案 18解析 总体容量为6+12+18=36,当样本容量为n 时,由题意知,系统抽样的间隔为36n ,分层抽样的比例是n36,抽取的工程师人数为n 36×6=n 6,技术员人数为n 36×12=n 3,技工人数为n 36×18=n2,所以n 应是6的倍数,36的约数,即n =6,12,18.当样本容量为(n -1)时,总体容量剔除以后是34人,系统抽样的间隔为34n -1,因为34n -1必须是整数,所以n 只能取18,即样本容量n =18.16.一个总体中有90个个体,随机编号0,1,2,…,89,依从小到大的编号顺序平均分成9个小组,组号依次为1,2,3,…,9.现用系统抽样方法抽取一个容量为9的样本,规定:如果在第1组随机抽取的号码为m,那么在第k组(k≥2)中抽取的号码个位数字与m+k的个位数字相同,若m=8,则k的值为________,在第8组中抽取的号码是________.答案876解析由题意知m=8,k=8,则m+k=16,也就是第8组抽取的号码个位数字为6,十位数字为8-1=7,故抽取的号码为76.。
RANSAC算法讲解

RANSAC算法讲解RANSAC是“Random Sample Consensus(随机抽样一致)”的缩写。
它可以从一组包含“局外点”的观测数据集中,通过迭代方式估计数学模型的参数。
它是一种不确定的算法——它有一定的概率得出一个合理的结果;为了提高概率必须提高迭代次数。
RANSAC的基本假设是:(1)数据由“局内点”组成,例如:数据的分布可以用一些模型参数来解释;(2)“局外点”是不能适应该模型的数据;(3)除此之外的数据属于噪声。
局外点产生的原因有:噪声的极值;错误的测量方法;对数据的错误假设。
RANSAC也做了以下假设:给定一组(通常很小的)局内点,存在一个可以估计模型参数的过程;而该模型能够解释或者适用于局内点。
一、示例一个简单的例子是从一组观测数据中找出合适的2维直线。
假设观测数据中包含局内点和局外点,其中局内点近似的被直线所通过,而局外点远离于直线。
简单的最小二乘法不能找到适应于局内点的直线,原因是最小二乘法尽量去适应包括局外点在内的所有点。
相反,RANSAC能得出一个仅仅用局内点计算出模型,并且概率还足够高。
但是,RANSAC并不能保证结果一定正确,为了保证算法有足够高的合理概率,我们必须小心的选择算法的参数。
二、概述RANSAC算法的输入是一组观测数据,一个可以解释或者适应于观测数据的参数化模型,一些可信的参数。
RANSAC通过反复选择数据中的一组随机子集来达成目标。
被选取的子集被假设为局内点,并用下述方法进行验证:1.有一个模型适应于假设的局内点,即所有的未知参数都能从假设的局内点计算得出。
2.用1中得到的模型去测试所有的其它数据,如果某个点适用于估计的模型,认为它也是局内点。
3.如果有足够多的点被归类为假设的局内点,那么估计的模型就足够合理。
4.然后,用所有假设的局内点去重新估计模型,因为它仅仅被初始的假设局内点估计过。
5.最后,通过估计局内点与模型的错误率来评估模型。
这个过程被重复执行固定的次数,每次产生的模型要么因为局内点太少而被舍弃,要么因为比现有的模型更好而被选用。
高中数学知识点:抽样方法

高中数学知识点:抽样方法
一、简单随机抽样
设一个总体的个体数为N,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时,各个体被抽到的概率相等,就称这样的抽样为简单随机抽样。
一般地如果用简单随机抽样从个体数为N的总体中抽取一个容量为n的样本那么每个个体被抽到的概率等于n/N.常用的简单随机抽样方法有:抽签法、随机数法。
1.抽签法
一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本。
2.随机数法
随机抽样中,另一个经常被采用的方法是随机数法,即利用随机数表、随机数骰子或计算机产生的随机数进行抽样。
二、活用随机抽样
系统抽样的最基本特征是“等距性”,每组内所抽取的号码需要依据第一组抽取的号码和组距是唯一确定,每组抽取样本的号码依次构成一个以第一组抽取的号码m为首项,组距d为公差的等差数列{an},第k组抽取样本的号码,
ak=m+(k-1)d,如本题中根据第一组的样本号码和组距,可
得第k组抽取号码应该为9+30*(k-1)
三、系统抽样
当总体中的个体数较多时,采用简单随机抽样显得较为费事,这时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样叫做系统抽样。
四、分层抽样。
9-2随机抽样

解析 (2)找到第 8 行第 7 列的数开始向右读,第一个符合条件的是 785;第二个数 916>799,舍去;第三个数 955>799,舍去;第四个数 567 符合题意,这样再依次读出结果为 199,507,175。 答案 (2)785,567,199,507,175
第18页
返回导航
赢在微点 无微不至
30 x 解析 由题意,设抽取的进口的标志灯的数量为 x,则300=20,所以 x=2。故选 A。 答案 A
第 9页
返回导航
赢在微点 无微不至
高考复习顶层设计 数学 理
3.(必修 3P64A 组 T5 改编)一个总体分为 A,B 两层,用分层抽样方法 从总体中抽取一个容量为 10 的样本。已知 B 层中每个个体被抽到的概率都 1 为12,则总体中的个体数为( A.40 C.80 ) B.60 D.120
赢在微点 无微不至
高考复习顶层设计 数学 理
第九章
算法初步、统计、统计案例
第二节 随机抽样
微知识·小题练
微考点·大课堂
第 1页
返回导航
赢在微点 无微不至
高考复习顶层设计 数学 理
★★★2018 考纲考题考情★★★ 考纲要求 真题举例 命题角度
1.理解随机抽样的必要性和 2017· 江苏高考· T3(5 重要性 2.会用简单随机抽样方法 从总体中抽取样本 3.了解分层抽样和系统抽 样方法 分)(分层抽样) 2015· 湖南高考· T12(5 分)(系统抽样) 2015· 湖北高考· T2(5 分)(简单随机抽样) 1.简单随机抽样 2.系统抽样 3.分层抽样
高考复习顶层设计 数学 理
2.(必修 3P100A 组 T2(2)改编)一段高速公路有 300 个太阳能标志灯,其 中进口的有 30 个,联合研制的有 75 个,国产的有 195 个,为了掌握每个标 志灯的使用情况,要从中抽取一个容量为 20 的样本,若采用分层抽样的方 法,抽取的进口的标志灯的数量为( A.2 C.5 ) B.3 D.13
第九章 第一节 随机抽样1

第 一 节
抓 基 础 明 考 向
随 机 抽 样
提 能 力
教 你 一 招
我 来 演 练
[备考方向要明了] 考 什 么 1.理解随机抽样的必要性和重要性. 2.会利用简单随机抽样方法从总体中抽取样本,了解分层
抽样和系统抽样的方法.
返回
怎 么 考
返回
40 解:设共有x名,则 x ×150=6. ∴x=1 000名. ∴该校四个专业学生共有1 000名.
返回
[巧练模拟]—————(课堂突破保分题,分分必保!)
5.(2012· 东北三校联考)某工厂生产甲、乙、丙三种型 号的产品,产品数量之比为3∶5∶7,现用分层抽 样的方法抽出容量为n的样本,其中甲种产品有18 件,则样本容量n=________.
6 x 设高二年级抽取x人,则有30=40,解得x=8.
[答案] B
返回
[例4] (2011· 山东高考)某高校甲、乙、丙、丁四个专
业分别有150、150、400、300名学生.为了解学生的 就业倾向,用分层抽样的方法从该校这四个专业共抽 取40名学生进行调查,应在丙专业抽取的学生人数为 ________.
A.与第几次抽样有关,第一次抽到的可能性最大
B.与第几次抽样有关,第一次抽到的可能性最小
C.与第几次抽样无关,每一次抽到的可能性相等 D.与第几次抽样无关,与抽取几个样本有关
返回
解析:由随机抽样的特点知某个体被抽到的可能性与 第几次抽样无关,每一次抽到的可能性相等.
答案:C
返回
[冲关锦囊] 1.一个抽样试验能否用抽签法,关键看两点:一是抽签 是否方便; 二是号签是否易搅匀,一般地当总体容 量和样本容量都较小时可用抽签法. 2.用简单随机抽样法抽出的个体带有随机性,个体间无
考试试题随机抽题算法

考试试题随机抽题算法考试试题随机抽题算法在现代教育体系中,考试是一种常见的评估学生学习成果的方式。
而试题的难易程度、内容覆盖范围以及试题数量的合理安排,直接影响到考试的公平性和准确性。
为了确保考试的公正性,许多学校和机构采用了试题随机抽题算法。
试题随机抽题算法的目的是通过随机选择试题,使得每个考生所面对的试题都是从一个试题库中抽取的,以此确保考生之间的公平性。
这种算法的实现方式有多种,下面将介绍其中一种较为常见的试题随机抽题算法。
首先,需要建立一个试题库,其中包含了所有可能出现的试题。
试题库中的试题可以按照不同的知识点、难易程度、类型等进行分类和标记。
试题库的建立需要考虑到学科的特点和教学目标,以便能够全面评估学生的知识水平和能力。
在考试开始前,需要确定考试的试题数量和考试的时间限制。
试题数量的确定需要考虑到考试的目的和学科的特点。
时间限制的设定需要根据试题数量和难易程度来合理分配,以确保考生有足够的时间完成考试。
接下来,根据考试的要求和试题库中的试题分类,确定每个分类下要抽取的试题数量。
这个过程可以根据试题分类的重要性和难易程度来进行权重设置,以确保考试的全面性和准确性。
然后,利用随机数生成器来随机选择试题。
随机数生成器可以根据设定的范围和规则来生成随机数。
在试题抽取过程中,可以根据每个分类下要抽取的试题数量来设定随机数生成的范围,以确保每个分类下的试题都有机会被抽取到。
最后,将抽取到的试题按照一定的顺序组成试卷。
试卷的组成可以按照试题分类、难易程度或者其他规则来进行。
在组卷过程中,需要注意试题的顺序和分布,以确保试卷的整体平衡和合理性。
试题随机抽题算法的实现需要考虑到多个因素,如试题库的建立、试题数量的确定、试题分类的设置、随机数生成的规则以及试卷的组成等。
这些因素的合理安排和权衡可以确保考试的公平性和准确性。
试题随机抽题算法在现代教育中发挥着重要的作用。
它不仅能够提高考试的公平性和准确性,还能够激发学生的学习兴趣和动力。
PPT随机抽题系统(附vba代码)

目录
• 系统概述 • 系统设计 • 系统操作流程 • 系统维护与更新 • 常见问题与解决方案 • 案例分享与实际应用
01
系统概T随机抽题系统是一个基于 PowerPoint平台开发的自动化工 具,用于在演示文稿中随机抽取 预设题目并展示给观众。
企业培训考核应用案例
案例概述
在企业培训考核中,PPT随机抽题系统可以用于检验员工的学习 成果和技能掌握情况。
实现方式
根据培训内容和要求,制作相应的PPT和题库,通过VBA代码实现 随机抽题和自动评分功能。
优势特点
能够快速有效地检验员工的学习成果,提高培训效果和员工参与度, 为企业提供客观准确的考核数据。
02
系统设计
数据库设计
数据库类型
选择合适的关系型数据库, 如Microsoft SQL Server 或MySQL,用于存储题库 和用户信息。
数据表设计
设计包含题目信息、用户 信息等数据表,并定义主 键、外键等关系。
字段设计
根据需求定义数据表的字 段,如题目ID、题目内容、 答案等。
用户界面设计
网络在线答题应用案例
案例概述
01
在网络在线答题应用中,PPT随机抽题系统可以用于各种知识竞
赛、趣味答题等活动。
实现方式
02
利用PPT的分享功能,将带有随机抽题系统的PPT分享到网络平
台,参与者通过在线答题参与活动。
优势特点
03
能够吸引大量参与者、提高活动的趣味性和互动性,同时保证
答题的公正性和客观性。
THANKS FOR WATCHING
感谢您的观看
通过VBA代码实现用户登录和身份验 证功能,确保系统安全性。
常用的随机抽样的方法

常用的随机抽样的方法
1. 简单随机抽样:从总体中随机选取n个样本,每个个体被抽取到的概率相等;
2. 分层随机抽样:将总体划分成不同的层次,然后从每一层中随机抽取相应数量的样本;
3. 整群随机抽样:将总体分为若干个群体,从每个群体中随机选取一个样本;
4. 系统随机抽样:从总体中随机选取一个个体,然后每隔k个个体,选取一个样本,直至达到所需数量的样本;
5. 分配式随机抽样:将总体分为若干个互相独立的子集,每个子集中随机选取一个样本;
6. 整数抽样:从整个总体中随机抽样n个样本,要求每个样本具有唯一的标识编号,之后用随机数生成器不断产生1到总体中个体数之间的随机整数,选择编号为该整数的样本,重复直至抽满n个样本。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
随机抽题算法
0 引言
随机抽题是在线考试系统中的核心部分,目前大部分的在线考试系统或无纸化考试系统大都采用了随机函数实现随机抽题,但大部分在线考试系统在随机抽题时存在抽题速度慢、试题覆盖面不稳定、重点不突出、灵活性差等问题。
本文讨论了优化随机抽题的方法,给出了具体的抽题公式和查询语句。
1 优化使用随机函数方法研究
原始在线考试系统中,使用随机函数从题库中抽取试题,抽题公式为Int(Rnd*M)公式1。
在抽取第一题时,直接将题号存放在指定的空数组中,表示抽取成功,以后每抽取一题,将题号和数组中已存在元素进行比较,若存在则抽取失败,若不存在则抽取成功,并将题号依次存储在该数组中,直到抽取结束。
这种抽题方法的缺陷是时间浪费。
这种时间浪费在单机的时候并不明显,但在B/S模式或C/S模式下,机器越多速度越慢。
为了解决重复抽题,避免试题抽取过慢,可采用分段法、分类法和分类分段结合法。
1.1分段法分段法是解决重复抽题最简单的方法,其原理是将题库中的试题M
分成N段,然后从每段中抽取一题,抽取公式为Int(Rnd*(M\N))+i*(M\N)(0≤i≤N-1)公式2。
分段法的优点显而易见,可以完全杜绝试题重复抽取,但对题库中试题的数量有要求,即M>2N,且题库越大、试题数量越多,抽取效果就越好。
在公式2中将M等分成N段,M并不一定能被N整除,也就是说采用公式2试题库最后M MOD N条试题永远不会被抽取,为了解决这个问题,可将公式2进行改进,设L=M MOD N,则抽取公式为Int(Rnd*(M\N+1))+i*(M\N+1)(0≤i≤L-1)公式3和Int(Rnd*(M\N))+i*(M\N)+L(L≤i≤N-1)公式4。
分段法避免了重复抽取,但无法控制试题的覆盖面及难易程度。
1.21.2 分类法分类法是在试题库的结构上添加相应分类字段,字段可以是章
节、内容等,将所有试题按章节或内容分类,从每一类中抽取一题,不仅可以解决试题的重复抽取还可以控制试题的覆盖面。
通常将分类字段的类型设置为整形,采用一组连续的整数作为分类字段的取值范围,这样方便在试题库中对分类进行循环查询,查询语句为select*from试题库where分类字段名=i查询1,设查询记录数为Mi,则抽题公式为Int(Rnd*Mi)公式5。
分类法可以保证试卷的覆盖面,但没有侧重点。
1.31.3 分类分段结合法分类分段结合法在抽取试题时先分类,然后根据设定给
类分段,每类的分段数可以不同,从每个分段中抽取一题。
这种方法要求在数据库中另建分类分段表,存贮每个分类中的抽题数量,数量可以是零,表示该类中不抽取,可以是大于零并小于该类题量的任何一个数Ni,表示将该类分成Ni段,每段抽取一题。
从实现角度上看,分段法和分类法使用的是一维循环,分类分段法使用的是二维循环;从访问数据库角度看,分段法和分类法仅访问试题库,分类分段法除了访问试题库外还要访问分类分段表。
2特殊要求下随机抽题的应对策略
在实际应用中,会对试题的抽取有一些特殊的要求。
如何合理利用随机函数,在同一个试题库中抽取出适合不同系别、专业使用的试卷?随机函数并不是万能的,不可能独立处理以上问题,但是可以创造一个环境,随机函数在这个环境中通过简单的计算公式和相应的算法为不同系别、专业抽取需求不同的试卷。
为了
营造这种环境,通常会通过两方面来实现:一方面是修改表结构;另一方面是提供一个界面可以针对不同系别、专业设计不同的抽题条件。
2.1修改表结构修改表结构通常会在试题库中添加章、节、难度系数、出题日
期、出题教师等字段。
添加章、节字段既可以精确抽题范围,也可以避免抽到未学习的章节。
在抽取试题时针对完全学习的章和学习过部分小节的章可以采用不同的查询方法,对完全学习的章,可以仅对章字段进行查询:select*from试题库where章=k查询2,其中k为章数,对学习过部分小节的章,除了对章字段查询外还要对节进行查询,可以针对某一节进行查询:select*from试题库where章=k and节=j查询3,j为节数,也可以针对与所有学习过的小节:select*from试题库where章=k and节in(j1,j2,…jn) 查询4,其中j1,j2,…jn为该章中所有学习过的节数。
难度系数字段可以根据系、专业学习的难易程度,抽取对应试题的字段,针对不同的章、节的学习程度不同可以有不同的难度系数,以查询3为例查询可改为:select*from试题库where章=k and节=j and难度系数=i查询5,i为难度系数值。
为了抽取方便,可以在试题库的表结构中添加出题日期字段,字段值为试题编辑日期,可以按日期的范围抽取出符合条件的试题。
每个老师教学的重点会有差别,使用其他教师的试题可能难以评定学生的学习成果,可在试题库中加入命题教师字段,其值为命题教师工号,可以使用该字段为教师所带班级抽取试题。
2.22.2 提供设置抽题条件界面试题库虽然需要很多人不断的维护,但其表结构
是相对稳定的,只是在题目数量和内容方面有所变化。
但是作为使用在线考试系统的系部、专业,每一年、每一个学期都会变化,他们的抽题要求不尽相同,因此,在考试系统的后台操作中需要一个设置系部、专业抽题要求的界面,在这个界面中可以通过简单的选择为每个系部、专业、班级设置若干抽题条件并存储在抽题条件数据表中。
学生抽题时先判断学生的系部、专业、班级,然后从抽题条件数据表中读取对应的抽题要求,并将其转化成查询语句,在试题库中查出符合条件的试题进行抽取。
3交换算法在随机抽题中的应用
在大部分在线考试系统中采用现场随机抽取,试题不完全相同;也有一部分考试系统中采用提前随机抽取,即在考试前由老师启动试题抽取程序,考试时所有的考生都使用这套试题,只是试题的顺序不同。
作为现场随机抽取的方法前面已经讨论了,下面重点讨论提前随机抽取,提前随机抽取前半部分由老师抽取一套试题和现场抽取实现方法完全相同,后半部分是从抽取的试题当中使用随机函数重新抽取一遍以保证试题顺序不同。
为了避免重复抽取,降低实现难度,有些考试系统在改变试题顺序时采用了随机函数结合交换算法的方法,设抽取的题目数量为M,将抽取的所有题号存储在数组中,下标从1到M,则抽题公式为j=Int(Rnd*M)+1公式6,使用循环For i=1toM,抽题公式放入循环,将下标为i 的数组元素值和下标为j的数组元素值互换,这样可以得到一个新的试题排列
4结束语
本文对随机抽题的方法进行了深入的研究。
文中不仅讨论了优化使用随机函数避免抽题重复的方法和满足特殊抽题要求的应对策略,而且在试题重新排列中引入了交换算法结合随机函数。
灵活运用,可以设计出高效率、灵活性强、大覆盖面、重点突出的抽题模块。
注:1.文中公式采用VB程序设计语言,并设题库中共有试题数M、需抽取试题数N、随机函数Rnd。