高中数学必修2《统计》知识点讲义(最新整理)

合集下载

高三数学统计知识点归纳

高三数学统计知识点归纳

高三数学统计知识点归纳数学统计是高中数学中的一个重要内容,旨在通过搜集观测数据并对其进行整理、分析和解释,从而得出结论。

本文将对高三数学统计知识点进行归纳和总结,以帮助同学们更好地掌握和应用这些知识。

一、描述统计学描述统计学是数学统计的基础,它通过搜集、整理和分析数据,揭示数据的特征和规律。

1. 数据的分类和整理数据可以分为定性和定量两种类型。

定性数据是指具有特征或属性的数据,如性别、颜色等;定量数据是指可用数量表示的数据,如身高、体重等。

将数据分类后,我们可以采用表格、频数分布表、频率分布图等方式对数据进行整理和展示。

2. 数据的汇总和呈现数据的汇总可以使用简单统计量,如平均数、中位数、众数和极差等来描述数据的集中趋势和离散程度。

同时,通过制作直方图、饼图、柱状图等图表,可以直观地展示数据的分布情况。

二、概率与统计概率与统计是数学统计的核心内容,它包括了概率的基本概念、随机变量与概率分布、统计推断等知识点。

1. 概率的基本概念概率是描述随机事件发生可能性的数值,常用概率公式包括频率概率、古典概型和几何概型等。

此外,概率运算法则也是概率计算的重要工具,包括加法法则和乘法法则。

2. 随机变量与概率分布随机变量是指在试验过程中可能取得不同值的变量,分为离散随机变量和连续随机变量。

离散随机变量的概率分布可以用概率函数或概率分布列来描述,连续随机变量的概率分布则可以用概率密度函数描述。

3. 统计推断统计推断是根据样本数据对总体特征进行推断和估计的过程。

它包括参数估计和假设检验两个方面。

参数估计可以利用样本统计量来估计总体参数,常见的估计方法有点估计和区间估计。

假设检验则通过构建假设和检验统计量来判断样本数据是否支持某种假设。

三、相关性分析与回归分析相关性分析和回归分析是统计学在实际问题中的应用,旨在研究变量之间的关系和预测。

1. 相关性分析相关性分析用来研究两个或多个变量之间的相关性强度和方向。

常见的相关性指标包括皮尔逊相关系数、斯皮尔曼等级相关系数等,用来度量变量之间的线性关系和等级关系。

高一下册《统计》知识点

高一下册《统计》知识点

高一下册《统计》知识点统计是指根据一定的方法、规则和程序,对所研究的对象(个体或现象)进行资料的收集、整理、描述、分析和解释的过程。

它是一门研究数据的科学,为我们提供了认识和了解客观世界的重要手段。

下面将介绍高一下册《统计》的一些重要知识点。

1. 数据的收集数据的收集是统计研究的基础。

常见的数据收集方法包括调查、实验和观测等。

在进行数据收集时,我们需要确定研究对象、制定调查方案、设计问卷或实验方案,并按照一定的规则和程序进行实施。

2. 数据的整理数据的整理是指对收集到的原始数据进行整理和分类,以便更好地进行后续的分析和解释。

常见的数据整理方法包括分类、排序、编码和录入等。

3. 数据的描述数据的描述是指对数据进行形容和概括,以便更好地了解数据的特征和规律。

常见的数据描述方法包括频数分布表、统计图表和数值指标等。

4. 数据的分析数据的分析是指在数据描述的基础上,通过运用统计学方法进行深入的研究和分析,以便找出数据之间的关系和规律。

常见的数据分析方法包括相关分析、回归分析和方差分析等。

5. 数据的解释数据的解释是指对数据分析结果进行解读和说明,从而对研究对象或现象提供合理的解决方案或建议。

数据的解释需要严谨、准确地表达,并结合具体的背景和领域知识进行解读和说明。

通过对以上统计知识点的学习和掌握,我们可以更好地理解和运用统计学,从而更好地分析和解释我们所研究的对象或现象。

统计不仅在科学研究中发挥着重要的作用,也广泛应用于经济、社会学、医学等领域,在我们的日常生活中也随处可见统计的身影。

总之,高一下册《统计》知识点涉及数据的收集、整理、描述、分析和解释等方面,通过学习和掌握这些知识,我们可以更好地认识和了解客观世界,为我们的学习和工作提供有力支持。

统计高三知识点总结

统计高三知识点总结

统计高三知识点总结1.高三统计学的基本概念统计学是一门研究数据收集、整理、分析和解释的学科。

在高三学习统计学时,我们需要掌握一些基本概念。

1.1 总体和样本总体是指我们要研究的所有个体或事物的集合。

样本是从总体中选择出来的一部分个体或事物。

1.2 参数和统计量参数是总体的数值特征,如总体的平均数、标准差等。

统计量是样本的数值特征,如样本的平均数、标准差等。

我们通常通过样本统计量来估计总体参数。

1.3 随机变量和概率分布随机变量是对随机事件进行数值化的变量。

概率分布描述了随机变量的取值和对应的概率。

2.描述统计描述统计是统计学的一个重要分支,用于对数据进行整理、概括和描述。

在高三中,我们主要学习了以下几个方面的描述统计方法。

2.1 数据的集中趋势数据的集中趋势是指数据中心的位置。

常用的统计量有均值、中位数和众数。

均值是所有数据之和除以数据个数,中位数是将数据按大小排列后,处于中间位置的数,众数是出现次数最多的数。

2.2 数据的离散程度数据的离散程度是指数据的扩散程度或变异程度。

常用的统计量有极差、方差和标准差。

极差是最大值与最小值之差,方差是每个数据与平均数的离差平方和的平均数,标准差是方差的平方根。

2.3 数据的分布形态数据的分布形态描述了数据的形状。

常用的图形有直方图、频数分布直方图和箱线图。

直方图用柱状图表示数据的频数分布情况,箱线图用箱体和须线展示数据的分布特征。

3.概率与统计推断概率与统计推断是统计学的另一个重要分支,用于通过样本数据来推断总体的特征。

3.1 概率概率是描述随机事件发生可能性的数值。

概率可用于计算事件发生的可能性,判断事件间的关系,以及预测未知的结果。

3.2 参数估计参数估计是通过样本统计量来估计总体参数。

常用的参数估计方法有点估计和区间估计。

点估计是通过单一的统计量来估计总体参数,区间估计是通过一个区间来估计总体参数,包含了真值的概率。

3.3 假设检验假设检验是用于检验某个关于总体的假设是否成立。

(完整版)高中数学必修2《统计》知识点讲义

(完整版)高中数学必修2《统计》知识点讲义

第二章统计一、三种抽样方法1、统计的的基本思想是:用样本的某个量去估计总体的某个量总体:在统计中,所有考察对象的全体。

个体:总体中的每一个考察对象。

样本:从总体中抽取的一部分个体叫做这个总体的一个样本。

样本容量:样本中个体的数目。

2、抽样方法:要求:总体中每个个体被抽取的机会相等(1)简单随机抽样:抽签法和随机数表法简单随机抽样的特点是:不放回、等可能.抽签法步骤(1)先将总体中的所有个体(共有N个)编号(号码可从1到N)(2)把号码写在形状、大小相同的号签上,号签可用小球、卡片、纸条等制作(3)将这些号签放在同一个箱子里,进行均匀搅拌(4)抽签时,每次从中抽出一个号签,连续抽取n次(5)抽出样本随机数表法步骤(1)将总体中的个体编号(编号时位数要统一);(2)选定开始的数字;(3)按照一定的规则读取号码;(4)取出样本(2)系统抽样系统抽样特点:容量大、等距、等可能.步骤:1.编号,随机剔除多余个体,重新编号2.分组 (段数等于样本容量),确定间隔长度 k=N/n3.抽取第一个个体编号为i4.依预定的规则抽取余下的个体编号为i+k, i+2k, …(3)分层抽样分层抽样特点:总体差异明显、按所占比例抽取、等可能.步骤:1.将总体按一定标准分层;2.计算各层的个体数与总体的个体数的比;3.按比例确定各层应抽取的样本数目4.在每一层进行抽样 (可用简单随机抽样或系统抽样)二、用样本估计总体1、用样本的频率分布估计总体的分布①作样本频率分布直方图的步骤:(1)求极差;(2)决定组距与组数; (组数=极差/组距)(3)将数据分组;(4)列频率分布表(分组,频数,频率);(5)画频率分布直方图。

根据频率分布表做频率分布直方图应注意两点:频率⑴纵轴的意义:组距⑵横轴的意义:样本内容(每个矩形下面是组距).例1、为了了解中学生的身高情况,对育才中学同龄的50名男学生的身高进行了测量,结果如下:(单位:cm)175 168 180 176 167 181 162 173 171 177171 171 174 173 174 175 177 166 163 160166 166 163 169 174 165 175 165 170 158174 172 166 172 167 172 175 161 173 167170 172 165 157 172 173 166 177 169 181列出样本的频率分布表,画出频率分布直方图.解:在这个样本中,最大值为181,最小值为157,它们的差是24,可以取组距为4,分成7组,根据题意列出样本的频率分布表如下:频率分布直方图(略)②茎叶图作图步骤:1.将每个数据分为茎(高位)和叶(低位)两部分.2.将最小茎和最大茎之间的数按大小顺序排成一列,写在左(右)侧;3.将各个数据的叶按大小次序写在其右(左)侧.例、某中学高二(2)班甲、乙两名同学自高中以来每场数学考试成绩如下:甲的得分:95,81,75,91,86,89,71,65,76,88,94,110,107;乙的得分:83,86,93,99,88,130,98,114,98,79,101.画出两人数学成绩茎叶图,请根据茎叶图对两人的成绩进行比较.解:甲、乙两人数学成绩的茎叶图如下图:甲乙5 65 6 1 7 98 9 6 1 8 6 3 84 15 9 3 9 8 87 10 3 10 11 4从这个茎叶图上可看出,乙同学的得分情况是大致对称的,中位数是99;甲同学的得分情况除一个特殊得分外,也大致对称,中位数是89.因此乙同学发挥比较稳定,总体得分情况比甲同学好.2、用样本的数据特征估计总体的数据特征(1)、在频率直方图中计算众数、平均数、中位数众数:在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。

部编版高中数学必修二第九章统计知识点归纳总结(精华版)

部编版高中数学必修二第九章统计知识点归纳总结(精华版)

(名师选题)部编版高中数学必修二第九章统计知识点归纳总结(精华版)单选题1、为了鼓励学生积极锻炼身体,强健体魄,某学校决定每学期对体育成绩在年级前100名的学生给予专项奖励.已知该校高三年级共有500名学生,如图是该年级学生本学期体育测试成绩的频率分布直方图.据此估计,能够获得该项奖励的高三学生的最低分数为()A.89B.88C.87D.86答案:B分析:根据题意确定出前100名的频率,进而判断出第100名的区间,然后根据频率求出答案.由题意,100500=0.2,[90,95)的频率为:0.02×5=0.1,[85,90)的频率为:0.05×5=0.25,则0.1<0.2<0.25,则第100名在[85,90)中,设分数为x,[x,90)的频率为:0.2−0.1=0.1,所以90−x5=0.2−0.10.25=0.10.25=25⇒x=88.故选:B.2、2021年3月,树人中学组织三个年级的学生进行“庆祝中国共产党成立100周年”党史知识竞赛.经统计,得到前200名学生分布的饼状图(如图)和前200名中高一学生排名分布的频率条形图(如图),则下列命题错误..的是()A.成绩前200名的200人中,高一人数比高二人数多30人B.成绩第1-100名的100人中,高一人数不超过一半C.成绩第1-50名的50人中,高三最多有32人D.成绩第51-100名的50人中,高二人数比高一的多答案:D分析:根据饼状图和条形图提供的数据判断.由饼状图,成绩前200名的200人中,高一人数比高二人数多200×(45%−30%)=30,A正确;=45<50,由条形图知高一学生在前200名中,前100和后100人数相等,因此高一人数为200×45%×12B正确;成绩第1-50名的50人中,高一人数为200×45%×0.2=18,因此高三最多有32人,C正确;第51-100名的50人中,高二人数不确定,无法比较,D错误.故选:D.3、新冠肺炎疫情的发生,我国的三大产业均受到不同程度的影响,其中第三产业中的各个行业都面临着很大的营收压力.2020年7月国家统计局发布了我国上半年国内经济数据,如图所示:图1为国内三大产业比重,图2为第三产业中各行业比重.以下关于我国上半年经济数据的说法正确的是()A.第一产业的生产总值与第三产业中“租赁和商务服务业”的生产总值基本持平B.第一产业的生产总值超过第三产业中“房地产业”的生产总值C.若“住宿餐饮业”生产总值为7500亿元,则“金融业”生产总值为32500亿元D.若“金融业”生产总值为41040亿元,则第二产业生产总值为166500亿元答案:D分析:利用扇形统计图和第三产业中各行业比重统计图的数据即可求解.对于A,57%×6%=3.42%<6%,错误;对于B,57%×13%=7.41%>6%,错误;×16%=4000(亿),错误;对于C,75003%×37%=166500亿元,正确.对于D,根据题意,第二产业生产总值为4104016%×57%故选:D.4、甲、乙两支曲棍球队在去年的国际比赛中,甲队的平均每场进球数为3.2,全年比赛进球个数的标准差为3;乙队的平均每场进球数为1.8,全年比赛进球个数的标准差为0.3.下列说法正确的个数为()①甲队的技术比乙队好;②乙队发挥比甲队稳定;③甲队的表现时好时坏.A.0B.3C.2D.1答案:B分析:根据平均数、方差的知识,对四个说法逐一分析,由此得出正确选项.∵甲队平均数大于乙队的平均数,∴甲队的技术比乙队好,又∵甲队的标准差大于乙队的标准差,∴乙队发挥比甲队稳定,甲队的表现时好时坏,故①②③都对.故选:B小提示:本题主要考查平均数、方差在实际生活中的应用,属于基础题.5、某汽车制造厂分别从A,B两类轮胎中各随机抽取了6个进行测试,下面列出了每一个轮胎行驶的最远里程(单位:103km).A类轮胎:94,96,99,99,105,107.B类轮胎:95,95,98,99,104,109.根据以上数据,下列说法正确的是()A.A类轮胎行驶的最远里程的众数小于B类轮胎行驶的最远里程的众数B.A类轮胎行驶的最远里程的极差等于B类轮胎行驶的最远里程的极差C.A类轮胎行驶的最远里程的平均数大于B类轮胎行驶的最远里程的平均数D.A类轮胎的性能更加稳定答案:D分析:根据众数、极差、平均数和方差的定义以及计算公式即可求解.解:对A:A类轮胎行驶的最远里程的众数为99,B类轮胎行驶的最远里程的众数为95,选项A错误;对B:A类轮胎行驶的最远里程的极差为13,B类轮胎行驶的最远里程的极差为14,选项B错误.对C:A类轮胎行驶的最远里程的平均数为100+−6−4−1−1+5+76=100,B类轮胎行驶的最远里程的平均数为100+−5−5−2−1+4+96=100,选项C错误.对D:A类轮胎行驶的最远里程的方差为(94−100)2+(96−100)2+(99−100)2×2+(105−100)2+(107−100)26=643,B类轮胎行驶的最远里程的方差为(95−100)2×2+(98−100)2+(99−100)2+(104−100)2+(109−100)26=763>643,故A类轮胎的性能更加稳定,选项D正确.故选:D.6、某购物广场开展的“买三免一”促销活动异常火爆,对其中一日8时至22时的销售额进行统计,组距为2小时的频率分布直方图如图所示.已知12时至l6时的销售额为90万元,则10时至12时的销售额为().A.60万元B.80万元C.100万元D.120万元答案:A分析:依据频率分布直方图的性质即可求得10时至12时的销售额.12时至l6时的频率为0.100×2+0.125×2=0.45,10时至12时的频率为0.150×2=0.3010时至12时的销售额0.300.45×90=60(万元)则故选:A7、某班统计一次数学测验成绩的平均分与方差,计算完毕才发现有个同学的分数还未录入,只好重算一次.已知原平均分和原方差分别为x̅,s2,新平均分和新方差分别为x̅1,s12,若此同学的得分恰好为x̅,则()A.x̅=x̅1,s2=s12B.x̅=x̅1,s2<s12C.x̅=x̅1,s2>s12D.x̅<x̅1,s2=s12答案:C分析:利用平均数和方差的公式即可求解.设这个班有n个同学,分数分别是a1,a2,a3,…,a n,第i个同学的成绩a i=x̅没录入,第一次计算时,总分是(n−1)x̅,方差s2=1n−1[(a1−x̅)2+(a2−x̅)2+⋅⋅⋅+(a i−1−x̅)2+(a i+1−x̅)2+⋅⋅⋅+(a n−x̅)2];第二次计算时,x̅1=(n−1)x̅+x̅n=x̅,方差s12=1n [(a1−x̅)2+(a2−x̅)2+⋅⋅⋅+(a i−1−x̅)2+(a i−x̅)2+(a i+1−x̅)2+⋅⋅⋅+(a n−x̅)2]=n−1ns2,故s2>s12.故选:C.8、下列抽样方法是简单随机抽样的是()A.某医院从200名医生中,挑选出50名最优秀的医生去参加抗疫活动B.从10个手机中逐个不放回地随机抽取2个进行质量检验C.从空间直角坐标系中抽取10个点作为样本D.饮料公司从仓库中的500箱饮料中一次性抽取前10箱进行质量检查答案:B分析:根据简单随机抽样的特点逐项判断可得答案.对于A,某医院从200名医生中,挑选出50名最优秀的医生去参加抗疫活动,每个人被抽到的机会不相等,故错误;对于B,从10个手机中逐个不放回地随机抽取2个进行质量检验,是简单随机抽样,故正确;对于C,从空间直角坐标系中抽取10个点作为样本,由于被抽取的样本的总体个数是无限的,所以不是简单随机抽样,故错误;对于D,饮料公司从仓库中的500箱饮料中一次性抽取前10箱进行质量检查,不是逐个抽取,所以不是简单随机抽样,故错误.故选:B.多选题9、某赛季甲乙两名篮球运动员各6场比赛得分情况如下表:B.甲运动员得分的中位数小于乙运动员得分的中位数C.甲运动员得分的平均值大于乙运动员得分的平均值D.甲运动员的成绩比乙运动员的成绩稳定答案:BD分析:按所给数据计算两人的极差,中位数,平均值,和方差.由题意甲的极差为34-9=25,中位数是21,均值为22,方差为s2=75,同样乙的极差为35-10=25,中位数是22,均值为22,方差为s乙2=8913.比较知BD都正确,故答案为BD.小提示:本题考查样本的数据特征,掌握极差、中位数、均值、方差等概念是解题基础,本题属于基础题.10、为评估一种农作物的种植效果,选了10块地作试验田.这10块地的亩产量(单位:kg)互不相等,且从小到大分别为x1,x2,⋅⋅⋅,x10,则下列说法正确的有()A.x1,x2,⋅⋅⋅,x10的平均数可以用来评估这种农作物亩产量稳定程度B.x1,x2,⋅⋅⋅,x10的标准差可以用来评估这种农作物亩产量稳定程度C.x10−x1可以用来评估这种农作物亩产量稳定程度D.x1,x2,⋅⋅⋅,x10的中位数为x5答案:BC分析:根据平均数、标准差、极差、中位数的定义即可求解.解:标准差和极差都可以用来评估这种农作物亩产量稳定程度,故BC正确.故A错误,中位数为x5+x62,故D错.故选:BC.11、在某文艺比赛中,由6名媒体代表组成的甲组、12名专家组成的乙组和12名观众代表组成的丙组分别给选手打分(100分制,选手得分为所有评委打分的平均分).已知甲组对某选手打分为;46,50,52,48,48,56,乙组、丙组对该选手打分的平均分分别为48和56,标准差分别为3.7和11.8,则()A.该选手的得分为51.6B.甲组打分的中位数为50C.相对于丙组,乙组打分稳定性更高D.相对于丙组,乙组对该选手评价更高答案:AC分析:计算出甲组打分平均分,再根据选手得分为所有评委打分的平均分即可求得该选手的得分,即可判断A;将46,50,52,48,48,56,按照从小到大得顺序排列,求得中位数,即可判断B;根据乙组、丙组对该选手打分的标准差即可判断C;根据乙组、丙组对该选手打分的平均分即可判断D.解:甲组打分平均分为46+50+52+48+48+56=50,6=51.6,故A正确;∴x̅=6×50+12×48+12×566+12+12将46,50,52,48,48,56,按照从小到大得顺序排列得46,48,48,50,52,56,=49,B错误;所以甲组打分的中位数为48+502根据标准差知乙组评委打分的波动小,稳定性更高,故C正确;根据平均数知丙组对选手评价更高,D错误.故选:AC.填空题12、某班学号1−8的学生铅球测试成绩如下表:答案:7分析:利用百分位数的计算方法即可求解.将以上数据从小到大排列为5.2,6.9,7.1,7.9,8.0,8.1,8.4,9.1;=7.8×25%=2,则第25百分位数第2项和第3项的平均数,即为6.9+7.12所以答案是:7.13、某校为了解学生的课外阅读情况﹐随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,该调查中,得到的数据为______.(填“观测数据”或“实验数据”)答案:观测数据.分析:根据数据收集的方式,结合观测数据和实验数据的定义,即可求解.由题意,从课外阅读的学生中﹐随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,这个数据为观测数据.所以答案是:观测数据.。

高中数学必修二统计概率知识点总结

高中数学必修二统计概率知识点总结

必修第二册第九章 统计知识点总结知识点一:简单随机抽样1. 全面调查和抽样调查2.简单随机抽样的概念放回简单随机抽样不放回简单随机抽样一般地,设一个总体含有N(N 为正整数)个个体,从中逐个抽取n (1≤n<N)个个体作为样本如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单随机抽样如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样.通过简单随机抽样获得的样本称为简单随机样本3.抽签法先把总体中的个体编号,然后把所有编号写在外观、质地等无差别的小纸片(也可以是卡片、小球等)上作为号签,并将这些小纸片放在一个不透明的盒里,充分搅拌.最后从盒中不放回地逐个抽取号签,使与号签上的编号对应的个体进入样本,直到抽足样本所需要的个体数.调查方式全面调查(普查)抽样调查定义对每一个调查对象都进行调查的方法,称为全面调查,又称普查根据一定目的,从总体中抽取一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法,称为 抽样调查相关概念总体:在一个调查中,我们把调查对象的全体称为总体.个体:组成总体的每一个调查对象称为个体样本:把从总体中抽取的那部分个体 称为样本.样本量:样本中包含的个体数称为 样本量4.随机数法(1)定义:先把总体中的个体编号,用随机数工具产生已编号范围内的整数随机数,把产生的随机数作为抽中的编号,使与编号对应的个体进入样本,重复上述过程,直到抽足样本所需要的个体数.(2)产生随机数的方法:(i)用随机试验生成随机数;(ii)用信息技术生成随机数.5.总体均值和样本均值(1)总体均值:一般地,总体中有N个个体,它们的变量值分别为Y1,Y2,…,Y N,则称Y=Y1+Y2+⋯+Y NN =1N∑i=1NY i为总体均值,又称总体平均数.(2)总体均值加权平均数的形式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Y k,其中Y i出现的频数f i(i=1,2,…,k),则总体均值还可以写成加权平均数的形式Y=1N ∑i=1kf i Y i.(3)如果从总体中抽取一个容量为n的样本,它们的变量值分别为y1,y2,…,y n,则称y=y1+y2+⋯+y nn =1n∑i=1ny i为样本均值,又称样本平均数.6.分层随机抽样的相关概念(1)分层随机抽样的定义:一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.(2)比例分配:在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.(3)进行分层随机抽样的相关计算时,常用到的关系①样本容量n总体容量N =该层抽取的个体数该层的个体数;②总体中某两层的个体数之比等于样本中这两层抽取的个体数之比;③样本的平均数和各层的样本平均数的关系:w=mm+n x+nm+ny=MM+Nx+NM+Ny.1.画频率分布直方图的步骤(1)求极差:极差为一组数据中最大值与最小值的差;(2)决定组距与组数:当样本容量不超过100时,常分成5-12组,为方便起见,一般取等长组距,并且组距应力求“取整”;(3)将数据分组;(4)列频率分布表:一般分四列:分组、频数累计、频数、频率.其中频数合计应是样本容量,频率合计是⑥1;.(5)画频率分布直方图:横轴表示分组,纵轴表示频率组距=频率,各小长方形的面积的总和等于1.小长方形的面积=组距×频率组距2.其他统计图表统计图表主要应用扇形图直观描述各部分数据在全部数据中所占的比例条形图和直方图直观描述不同类别或分组数据的频数和频率反映统计对象在不同时间(或其他合适情形)的发展折线图变化情况1.第p百分位数:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.2.计算一组n个数据的第p百分位数的步骤第1步,按从小到大排列原始数据.第2步,计算i=n×p%.第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.3.四分位数:第25百分位数,第50百分位数,第75百分位数,这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.知识点四:总体集中趋势的估计1.众数、中位数和平均数的定义(1)众数:一组数据中出现次数最多的数.(2)中位数:一组数据按大小顺序排列后,处于中间位置的数.如果这组数据是偶数个,则取中间两个数据的平均数.(3)平均数:一组数据的和除以数据个数所得到的数.2.众数、中位数、平均数与频率分布直方图的关系(1)平均数:在频率分布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.(2)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.(3)众数:众数是最高小矩形底边的中点所对应的数据.2.众数、中位数、平均数与频率分布直方图的关系众数众数是最高小长方形底边的中点所对应的数据,表示样本数据的中心值中位数①在频率分布直方图中,中位数左边和右边的直方图面积相等,由此可以估计中位数的值,但是有偏差;②表示样本数据所占频率的等分线平均数①平均数等于每个小长方形的面积乘小长方形底边中点的横坐标之和;②平均数是频率分布直方图的重心,是频率分布直方图的平衡点1.一组数据x1,x2,…,x n的方差和标准差数据x1,x2,…,x n的方差为1n ∑i=1n(x i-x)2=1n∑i=1nx i2-x2,标准差为√1n∑i=1n(x i-x)2.2.总体方差和总体标准差(1)总体方差和标准差:如果总体中所有个体的变量值分别为Y1,Y2,…,Y N,总体的平均数为Y,则称S2= 1N ∑i=1N(Y i-Y)2为总体方差,S=√S2为总体标准差.(2)总体方差的加权形式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Y k,其中Y i出现的频数为f i(i=1,2,…,k),则总体方差为S2= 1N ∑i=1kf i(Y i-Y)2.3.样本方差和样本标准差如果一个样本中个体的变量值分别为y1,y2,…,y n,样本平均数为y,则称s2= 1n ∑i=1n(y i-y)2为样本方差,s=√s2为样本标准差.4.标准差的意义标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.5.分层随机抽样的方差设样本容量为n,平均数为x,其中两层的个体数量分别为n1,n2,两层的平均数分别为x1,x2,方差分别为s12,s22,则这个样本的方差为s2=n1n [s12+(x1-x)2]+n2n[s22+(x2-x)2].必修第二册第十章概率知识点总结知识点一:有限样本空间与随机事件1.随机试验的概念和特点(1)随机试验:我们把对随机现象的实现和对它的观察称为随机试验,简称试验,常用字母E表示.(2)随机试验的特点:(i)试验可以在相同条件下重复进行;(ii)试验的所有可能结果是明确可知的,并且不止一个;(iii)每次试验总是恰好出现这些可能结果中的一个,但事先不能确定出现哪一个结果.2.样本点和样本空间定义字母表示样本点我们把随机试验E的每个可能的基本结果称为样本点用ω表示样本点样本空间全体样本点的集合称为试验E的样本空间用Ω表示样本空间有限样本空间如果一个随机试验有n个可能结果ω1,ω2,…,ωn,则称样本空间Ω={ω1,ω2,…,ωn}为有限样本空间Ω={ω1,ω2,…,ωn}3.事件的类型我们将样本空间Ω的子集称为随机事件,简称事件,并把只包含一个样本点的事件称为基本事件.随机事件一般用大写字母A,B,C,…表示.在每次试验中,当且仅当A中某个样本点出现时,称为事件A发生.Ω作为自身的子集,包含了所有的样本点,在每次试验中总有一个样本点发生,所以Ω总会发生,我们称Ω为必然事件.而空集⌀不包含任何样本点,在每次试验中都不会发生,我们称⌀为不可能事件.必然事件与不可能事件不具有随机性.为了方便统一处理,将必然事件和不可能事件作为随机事件的两个极端情形.这样,每个事件都是样本空间Ω的一个子集.知识点二:事件的关系和运算1.包含关系定义一般地,若事件A 发生,则事件B 一定发生,我们就称事件B 包含事件A(或事件A 包含于事件B)含义 A 发生导致B 发生 符号表示B ⊇A(或A ⊆B)图形表示特殊情形如果事件B 包含事件A,事件A 也包含事件B,即B ⊇A 且A ⊇B,则称事件A 与事件B 相等,记作A=B2.并事件(和事件)定义一般地,事件A 与事件B 至少有一个发生,这样的一个事件中的样本点或者在事件A 中,或者在事件B 中,我们称这个事件为事件A 与事件B 的并事件(或 和事件)含义 A 与B 至少有一个发生符号表示A ∪B(或A+B)图形表示3.交事件(积事件)定义一般地,事件A 与事件B 同时发生,这样的一个事件中的样本点既在事件A中,也在事件B 中,我们称这样的一个事件为事件A 与事件B 的交事件(或积 事件)含义 A 与B 同时发生 符号表示A ∩B(或AB)图形表示4.互斥(互不相容)一般地,如果事件A与事件B不能同时发生,也就是说A∩B是一个不可能定义事件,即A∩B=⌀,则称事件A与事件B互斥(或互不相容)含义A与B不能同时发生符号表示A∩B=⌀图形表示5.互为对立一般地,如果事件A与事件B在任何一次试验中有且仅有一个发生,即A∪B=定义Ω,且A∩B=⌀,那么称事件A与事件B互为对立.事件A的对立事件记为A 含义A与B有且仅有一个发生符号表示A∩B=⌀,且A∪B=Ω图形表示6.清楚随机事件的运算与集合运算的对应关系有助于解决此类问题.符号事件的运算集合的运算A 随机事件集合A A的对立事件A的补集AB 事件A与B的交事件集合A与B的交集A∪B 事件A与B的并事件集合A与B的并集知识点三:古典概型1.古典概型的定义试验具有如下共同特征:(1)有限性:样本空间的样本点只有有限个;(2)等可能性:每个样本点发生的可能性相等.我们将具有以上两个特征的试验称为古典概型试验,其数学模型称为古典概率模型,简称古典概型.2.古典概型的概率计算公式一般地,设试验E是古典概型,样本空间Ω包含n个样本点,事件A包含其中的k个样本点,则定义事件A的概率P(A)= kn =n(A)n(Ω),其中n(A)和n(Ω)分别表示事件A和样本空间Ω包含的样本点个数.知识点四:概率的基本性质1.概率的基本性质性质1 对任意的事件A,都有P(A)≥0.性质2 必然事件的概率为1,不可能事件的概率为0,即P(Ω)=1,P(⌀)=0.性质3 如果事件A与事件B互斥,那么P(A∪B)=P(A)+P(B).性质4 如果事件A与事件B互为对立事件,那么P(B)=1-P(A),P(A)=1-P(B).性质5 如果A⊆B,那么P(A)≤P(B).性质6 设A,B是一个随机试验中的两个事件,我们有P(A∪B)=P(A)+P(B)-P(A∩B).知识点五:事件的相互独立性1.相互独立事件的定义:对任意两个事件A与B,如果P(AB)=P(A)P(B)成立,则称事件A 与事件B相互独立,简称为独立.2.相互独立事件的性质:当事件A,B相互独立时,则事件A与事件B相互独立,事件A与事件B相互独立,事件A与事件B相互独立.【提示】公式P(AB)=P(A)P(B)可以推广到一般情形:如果事件A1,A2,…,A n相互独立,那么这n个事件同时发生的概率等于每个事件发生的概率的积,即P(A1A2·…·A n)=P(A1)P(A2)·…·P(A n).3. 两个事件是否相互独立的判断方法(1)直接法:由事件本身的性质直接判定两个事件发生是否相互影响.(2)公式法:若P(AB)=P(A)P(B),则事件A,B为相互独立事件.4.求相互独立事件同时发生的概率的步骤:①首先确定各事件之间是相互独立的.②求出每个事件的概率,再求积.5.事件间的独立性关系已知两个事件A,B相互独立,它们的概率分别为P(A),P(B),则有事件表示概率A,B同时发生AB P(A)P(B)A,B都不发生A B P(A)P(B)A,B恰有一个发生(A B)∪(A B) P(A)P(B)+P(A)P(B)A,B中至少有一个发生(A B)∪(A B)∪(AB) P(A)P(B)+P(A)P(B)+P(A)P(B)A,B中至多有一个发生(A B)∪(A B)∪(A B) P(A)P(B)+P(A)P(B)+P(A)P(B)。

第4章统计知识点清单高二下学期数学湘教版选择性

第4章统计知识点清单高二下学期数学湘教版选择性

新教材湘教版2019版数学选择性必修第二册第4章知识点清单目录第4章统计4. 1 成对数据的统计相关性4. 2 一元线性回归模型4. 3 独立性检验第4章统计4. 1 成对数据的统计相关性一、散点图1. 散点图将成对观测数据用直角坐标系中的点表示,这些点称为散点,由坐标系及散点形成的数据图叫作散点图,散点图直观地描述了变量之间的关系形态.2. 线性相关关系如果两个变量之间的关系近似地表现为一条直线,则称它们有线性相关关系,简称为相关关系.3. 线性相关如果一个变量的取值完全依赖于另一个变量,各观测点落在一条直线上,则称它们线性相关,这实际上就是函数关系.二、相关系数1. 定义一般地,对n个成对观测数据(x1,y1),(x2,y2),…,(x n,y n),我们用{x i}表示数据x1,x2,…,x n,{y i}表示数据y1,y2,…,y n,用x=1n ∑n i=1x i,y=1n∑n i=1y i分别表示{x i}与{y i}的均值,用s x=√1n ∑n i=1(x i−x)2,s y=√1n∑n i=1(y i−y)2分别表示{x i}与{y i}的标准差.记s xy=x1y1+x2y2+···+x n y nn −x y=1n∑n i=1(x i−x )(y i−y ),则当s x s y≠0时,我们称r xy=s xys x s y =1n∑n(x i−x)(y i−y)√1n∑i=1(x i−x)2 · 1n∑i=1(y i−y)2=n i=1i i−nx y√(∑xi2ni=1−nx2)·(∑y i2ni=1−ny2)为{x i}和{y i}的相关系数.2. 相关系数的性质(1)r xy的取值范围是[1,1]. 当0<r xy<1时,称{x i}和{y i}正相关;当1<r xy<0时,称{x i}和{y i}负相关;当r xy=0时,称{x i}和{y i}不相关.(2)|r xy|越接近于1,变量x,y的线性相关程度越高,这时数据(x1,y1),(x2,y2),…,(x n,y n)分散在一条直线附近.(3)|r xy|越接近于0,变量x,y的线性相关程度越低.(4) r xy具有对称性,即r xy=r yx.(5) r xy仅仅是变量x与y之间线性相关程度的一个度量. r xy=0只表示两个变量之间不存在线性相关关系,并不说明变量之间没有关系,它们之间可能存在非线性关系.三、相关系数与向量夹角1. 利用向量夹角的余弦值表示相关系数把两组成对数据分别看作n维空间的两个向量(x1,x2,…,x n),(y1,y2,…,y n),再将向量的每个元素都减去均值,形成a=(x1x,x2x,…,x n x),b=(y1y,y2y,…,y n y),从而有cos<a,b>=a⋅b|a||b|=n i=1i−x)(y i−y)√∑i=1(x i−x)2⋅∑i=1(y i−y)2.2. 相关程度与向量夹角的关系(1)当<a,b>∈[0,π2)时,余弦值越大表示两个向量的夹角越小,两组数据的正相关程度越高;余弦值越小表示两个向量的夹角越大,两组数据的正相关程度越低.(2)当<a,b>∈(π2,π]时,余弦值越大表示两个向量的夹角越小,两组数据的负相关程度越低;余弦值越小表示两个向量的夹角越大,两组数据的负相关程度越高.(3)当<a,b>=π2时,余弦值为0,这说明两组数据不相关.四、两个变量相关性的判断 1. 利用散点图判断两个变量的相关性若散点落在一条直线附近,则认为这两个变量有线性相关关系. 一般地,如果变量x 和y正相关,那么大多数散点将分布在第一、三象限,对应的成对数据同号的居多;如果变量x和y负相关,那么大多数散点将分布在第二、四象限,对应的成对数据异号的居多.2. 利用相关系数判断两个变量的相关性|r xy|刻画了样本点集中于某条直线的程度. |r xy|越接近于1,散点图中的散点分布越接近于一条直线,两个变量的线性相关程度越高.3. 利用向量的夹角判断两个变量的相关性由相关系数r xy=cos<a,b>,结合相关程度与向量夹角的关系可直接判断两个变量的相关性.4. 2 一元线性回归模型一、回归直线方程1. 回归直线与回归直线方程我们常常用一条直线来反映所给出的散点图的分布趋势,找出与散点图中各点散布趋势相似的直线,使各点经过或充分靠近该直线,这样所得到的直线就可以比较科学地反映实际问题中两个变量之间的相关关系. 这条直线叫作回归直线,这条直线的方程叫作回归直线方程.2. 回归分析(1)由散点图求出回归直线并进行统计推断的过程叫作回归分析.(2)在回归分析中,被预测或被解释的变量称为因变量,用y表示. 用来预测或解释因变量的变量称为自变量,用x表示.二、一元线性回归模型1. 一元线性回归方程如果具有相关关系的两个变量x,y可用方程y=a+bx来近似刻画,则称此式为y关于x的一元线性回归方程,其中a,b称为回归系数.由于我们是利用样本数据(一组观测值)去估计总体的回归直线方程,因此我们在a ,b ,y 的上方加记号“∧”以区别实际的a ,b ,y ,此时得到估计的回归直线方程形式为y ^=a ^+b ^x ,它是根据样本数据求出的回归方程的估计. 2. 一元线性回归模型(1)当自变量x 取值x i (i=1,2,…,n)时,我们将根据回归直线方程估计出的y ^i 与实际观 测值y i 的误差,即y i y ^i =y i (a ^+b ^x i )(i=1,2,…,n),称为随机误差,记作e i .(2)我们把y i =a ^+b ^x i +e i (i=1,2,…,n)这一描述因变量y 如何依赖于自变量x 和随机误 差e i 的方程称为一元线性回归模型. 3. 最小二乘法(1)用随机误差的平方和即Q=∑ n i=1(y i−a ^−b ^x i )2作为总随机误差来刻画各估计值与实际值之间的误差. 若总随机误差最小,则这条直线就是所要求的回归直线. 由于平 方又叫二乘方,所以这种使“随机误差平方和最小”的方法叫作最小二乘法. (2)(x ,y )称为样本中心,回归直线一定过样本中心. (3)令x =1n ∑x in i=1,y=1n ∑y in i=1,则Q 取最小值时,a ^,b ^的计算公式为b ^=∑ n i=1(x i −x)(y i −y)∑ n i=1(x i −x)2=∑ n i=1x i y i −nxy∑ n i=1x i2−nx 2,a ^=yb ^x 此时,用最小二乘法得到的回归直线方程为y ^=a ^+b ^x ,其中a ^是回归直线在y 轴上的截 距, b ^是回归直线的斜率. 三、一元线性回归模型的应用1. 一般地,运用一元线性回归模型思想解决实际问题的基本步骤如下: (1)确定研究对象,明确哪个变量是因变量,哪个变量是自变量; (2)运用相关系数的计算公式,分析自变量与因变量之间的关系;(3)运用最小二乘原理估计一元线性回归方程的系数,建立一元线性回归方程; (4)根据一元线性回归方程进行预测. 知识拓展 研究两个变量的关系时,依据样本画出散点图,从整体上看,如果样本点没有分布在一条直线附近,就称这两个变量之间不具有线性相关关系. 当两个变量不具有线性相关关系时,依据样本点的分布选择合适的曲线方程来拟合数据,可通过变量代换,利用一元线性回归模型建立两个变量间的非线性回归方程. 常见的非线性回归方程的转换方式如下:四、回归直线方程的求解与应用 1. 回归直线方程中系数的两种求法 (1)公式法:利用公式求出回归系数b ^, a ^.(2)待定系数法:利用回归直线必过样本中心(x , y )求回归系数b ^, a ^.2. 回归分析的两种题型及解题策略(1)利用回归直线方程进行预测:把回归直线方程看作一次函数的解析式,求函数值. (2)利用回归直线判断正、负相关:决定两个变量是正相关关系还是负相关关系的是回归系数b ^.五、非线性回归分析1. 建立非线性回归模型的基本步骤 (1)确定研究对象,明确涉及的变量;(2)画出确定好的变量间的散点图,观察它们之间的关系(是否存在非线性关系); (3)由经验确定非线性回归方程的类型(如我们观察到数据呈非线性关系,一般选用反比例函数型、指数函数型、对数函数型模型等);(4)通过换元,将非线性回归模型转化为一元线性回归模型; (5)按照公式计算回归直线方程中的参数,得到回归直线方程; (6)消去新元,得到非线性回归方程.4. 3 独立性检验一、列联表 1. 列联表一般地,对于两个分类变量X 和Y ,X 有两个取值:A 和A ,Y 也有两个取值:B 和B ,我们可得到下面的频数分布表:像上表这样,将两个(或两个以上)分类变量进行交叉分类得到的频数分布表称为列联表,称X ,Y 为分类变量. 2. 2× 2列联表由于所涉及的两个分类变量X ,Y 均有两个变量值,所以称上表为2×2列联表. 二、独立性检验1. 统计量χ2的计算公式:χ2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.2. 独立性检验的概念利用统计量χ2来确定在多大程度上可以认为“两个分类变量有关系”的方法,称为两个分类变量的独立性检验. 3. 独立性检验的步骤利用独立性检验推断“X 与Y 有关系”,可按下面的步骤进行: (1)提出统计假设H 0:X 与Y 之间没有关系; (2)根据2×2列联表及χ2的公式计算χ2的观测值; (3)查临界值表确定临界值x 0,然后做出判断.4. 临界值表表示在H0成立的情况下,事件“χ≥x0”发生的概率.5. 变量独立性判断的依据(1)如果χ2>10. 828,就有不少于99. 9%的把握认为“X与Y之间有关系”;(2)如果χ2>6. 635,就有不少于99%的把握认为“X与Y之间有关系”;(3)如果χ2>2. 706,就有不少于90%的把握认为“X与Y之间有关系”;(4)如果χ2≤2. 706时,就认为还没有充分的证据显示“X与Y之间有关系”,但也不能做出结论“H0成立”,即认为X与Y没有关系.三、由χ2进行独立性检验1. 应用独立性检验解决实际问题大致包括的几个主要环节(1)提出统计假设H0:分类变量X和Y无关(相互独立),并给出在问题中的解释;(2)根据抽样数据整理出2×2列联表,计算χ2的值,并与临界值x0比较;(3)根据检验规则得出推断结论;(4)在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.注意:上述几个环节的内容可以根据不同情况进行调整. 例如,在有些时候,分类变量的抽样数据列联表是问题中给定的.四、独立性检验与统计、概率的综合应用1. 通过频率分布直方图中的数据作2×2列联表,从而对事件进行独立性检验,准确读取频率分布直方图中的数据,进行分组统计是解题的关键. 解决独立性检验的问题要注意明确两类主体,明确研究的两类问题,在写出2×2列联表中a,b,c,d的值时,注意一定要对应.。

(完整版)高中数学必修2《统计》知识点讲义.docx

(完整版)高中数学必修2《统计》知识点讲义.docx

第二章统计一、三种抽样方法1、的的基本思想是:用本的某个量去估体的某个量体:在中,所有考察象的全体。

个体:体中的每一个考察象。

本:从体中抽取的一部分个体叫做个体的一个本。

本容量:本中个体的数目。

2、抽方法:要求:体中每个个体被抽取的机会相等(1)随机抽:抽法和随机数表法随机抽的特点是:不放回、等可能.抽法步( 1)先将体中的所有个体(共有N 个)号(号可从 1 到 N)( 2)把号写在形状、大小相同的号上,号可用小球、卡片、条等制作( 3)将些号放在同一个箱子里,行均匀拌(4)抽,每次从中抽出一个号,抽取n 次(5)抽出本随机数表法步(1)将体中的个体号 ( 号位数要一 ) ;( 2)定开始的数字;( 3)按照一定的取号;( 4)取出本(2)系抽系抽特点:容量大、等距、等可能.步 :1.号 , 随机剔除多余个体 , 重新号2.分 ( 段数等于本容量 ), 确定隔度 k=N/n3.抽取第一个个体号 i4. 依定的抽取余下的个体号i+k, i +2k, ⋯(3)分抽分抽特点:体差异明、按所占比例抽取、等可能.步: 1. 将体按一定准分 ;2.算各的个体数与体的个体数的比;3.按比例确定各抽取的本数目4.在每一行抽 ( 可用随机抽或系抽 )二、用样本估计总体1、用样本的频率分布估计总体的分布①作样本频率分布直方图的步骤:(1)求极差;(2)决定组距与组数 ; ( 组数=极差 / 组距 )(3)将数据分组;(4)列频率分布表(分组,频数,频率);(5)画频率分布直方图。

根据频率分布表做频率分布直方图应注意两点:频率⑴纵轴的意义:组距⑵横轴的意义:样本内容(每个矩形下面是组距).例 1、为了了解中学生的身高情况, 对育才中学同龄的50名男学生的身高进行了测量, 结果如下:(单位: cm)175168180176167181162173171177171171174173174175177166163160166166163169174165175165170158174172166172167172175161173167170172165157172173166177169181列出样本的频率分布表, 画出频率分布直方图.解:在这个样本中, 最大值为 181, 最小值为 157, 它们的差是24, 可以取组距为4, 分成 7 组 , 根据题意列出样本的频率分布表如下:分组频数频率156.5 ~ 160.530.06160.5 ~ 164.540.08164.5 ~ 168.5120.24168.5 ~ 172.5120.24172.5 ~ 176.5130.26176.5 ~ 180.540.08180.5 ~ 184.520.04合计50 1.00频率分布直方图( 略 )②茎叶图作图步骤:1.将每个数据分为茎 ( 高位 ) 和叶 ( 低位 ) 两部分 .2. 将最小茎和最大茎之间的数按大小顺序排成一列, 写在左 ( 右 ) 侧;3.将各个数据的叶按大小次序写在其右( 左 ) 侧.例、某中学高二(2) 班甲、乙两名同学自高中以来每场数学考试成绩如下:甲的得分: 95,81,75,91,86,89,71,65,76,88,94,110,107;乙的得分: 83,86,93,99,88,130,98,114,98,79,101.画出两人数学成绩茎叶图, 请根据茎叶图对两人的成绩进行比较.解:甲、乙两人数学成绩的茎叶图如下图:甲乙565 6 1 798 9 6 1 8 6 3 84 15 9 3 9 8 87 10 310 114从这个茎叶图上可看出, 乙同学的得分情况是大致对称的, 中位数是99;甲同学的得分情况除一个特殊得分外,也大致对称, 中位数是89. 因此乙同学发挥比较稳定, 总体得分情况比甲同学好.2、用样本的数据特征估计总体的数据特征( 1)、在频率直方图中计算众数、平均数、中位数众数:在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第二章统计
一、三种抽样方法
1、统计的的基本思想是:用样本的某个量去估计总体的某个量
总体:在统计中,所有考察对象的全体。

个体:总体中的每一个考察对象。

样本:从总体中抽取的一部分个体叫做这个总体的一个样本。

样本容量:样本中个体的数目。

2、抽样方法:要求:总体中每个个体被抽取的机会相等
(1)简单随机抽样:抽签法和随机数表法
简单随机抽样的特点是:不放回、等可能.
抽签法步骤
(1)先将总体中的所有个体(共有N个)编号(号码可从1到N)
(2)把号码写在形状、大小相同的号签上,号签可用小球、卡片、纸条等制作
(3)将这些号签放在同一个箱子里,进行均匀搅拌(4)抽签时,每次从中抽出一个号签,连续抽取n次(5)抽出样本
随机数表法步骤
(1)将总体中的个体编号(编号时位数要统一);(2)选定开始的数字;(3)按照一定的规则读取号码;(4)取出样本
(2)系统抽样
系统抽样特点:容量大、等距、等可能.
步骤:
1.编号,随机剔除多余个体,重新编号
2.分组 (段数等于样本容量),确定间隔长度 k=N/n
3.抽取第一个个体编号为i
4.依预定的规则抽取余下的个体编号为i+k, i+2k, …
(3)分层抽样
分层抽样特点:总体差异明显、按所占比例抽取、等可能.
步骤:1.将总体按一定标准分层;
2.计算各层的个体数与总体的个体数的比;
3.按比例确定各层应抽取的样本数目
4.在每一层进行抽样 (可用简单随机抽样或系统抽样)
例如:
5. 回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法。

其基本步骤是:①画出两个变量的散点图;
②求回归直线方程;
③并用回归直线方程进行预报。

相关文档
最新文档