高中必修三统计知识点整理

合集下载

必修3统计知识点复习

必修3统计知识点复习

必修3统计知识点复习一、本章知识结构二、知识点复习1、统计的的基本思想是:用样本的某个量去估计总体的某个量总体:在统计中,所有考察对象的全体。

个体:总体中的每一个考察对象。

样本:从总体中抽取的一部分个体叫做这个总体的一个样本。

样本容量:样本中个体的数目。

2、抽样方法:要求:总体中每个个体被抽取的机会相等(1)简单随机抽样:抽签法和随机数表法简单随机抽样的特点是:不放回、等可能.抽签法步骤(1)先将总体中的所有个体(共有N个)编号(号码可从1到N)(2)把号码写在形状、大小相同的号签上,号签可用小球、卡片、纸条等制作(3)将这些号签放在同一个箱子里,进行均匀搅拌(4)抽签时,每次从中抽出一个号签,连续抽取n次(5)抽出样本随机数表法步骤(1)将总体中的个体编号(编号时位数要统一);(2)选定开始的数字;(3)按照一定的规则读取号码;(4)取出样本(2)系统抽样系统抽样特点:容量大、等距、等可能.步骤:1.编号,随机剔除多余个体,重新编号2.分段 (段数等于样本容量),确定间隔长度 k=N/n3.抽取第一个个体编号为i4.依预定的规则抽取余下的个体编号为i+k, i+2k, …(3)分层抽样分层抽样特点:总体差异明显、按所占比例抽取、等可能.步骤:1.将总体按一定标准分层;2.计算各层的个体数与总体的个体数的比;3.按比例确定各层应抽取的样本数目4.在每一层进行抽样 (可用简单随机抽样或系统抽样)三种抽样方法的比较:3、用样本估计总体1)用样本的频率分布估计总体的分布作样本频率分布直方图的步骤:(1)求极差;(2)决定组距与组数; (组数=极差/组距)(3)将数据分组;(4)列频率分布表(分组,频数,频率);(5)画频率分布直方图。

茎叶图作图步骤:1.将每个数据分为茎(高位)和叶(低位)两部分.2.将最小茎和最大茎之间的数按大小顺序排成一列,写在左(右)侧;3.将各个数据的叶按大小次序写在其右(左)侧. 直方图的优点是:任何情况都能用; 直方图的缺点是:有信息丢失.茎叶图的优点是:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示。

高中数学必修三第13章-统计-知识点

高中数学必修三第13章-统计-知识点

高中数学必修三第13章:统计-知识点1、在统计问题中,研究对象的全体叫做总体,总体中的每一个对象叫做个体,总体中所含个体的数量称为总体的容量。

总体中抽取一部分个体叫做总体的一个样本,样本所含个体的数量叫做样本容量。

2、按照收集数据的不同方法,可以将数据分为观测数据和实验数据。

3、普查是大规模的全面调查,对总体的每个个体分别进行调查,优点是能准确反应总体的情况,缺点是调查范围大,耗时耗力,有时候还会破坏调查对象。

抽样调查,是从总体中抽取样本进行调查的方法,优点是省时省力,缺点是数据的精确性较差。

4、简单随机抽样:逐个抽取的方法,总体中每一个个体都有同样的概率被抽中,适用于个体之间差异较小和数目较少时,包括抽签法和随机数法。

5、分层随机抽样:当总体由差异明显的几个部分组成时,先把总体分成若干部分,然后从不同的部分中独立、随机地抽取样本。

适用于总体情况复杂,各单位之间差异较大,单位较多的情况。

6、系统抽样:先编号,然后分成若干段,在第一段中用简单随机抽样抽出一个编号,然后依次加上间隔数,直到获取整个样本。

该方法操作简便,不易出错。

7、一组数据的最大值和最小值的差称为极差,又称全距,每个小组的区间端点之间的距离叫做组距,组距的选取决定了组数的多少,极差=组距×组数。

将样本分组后,每个小组内的数据个数称为频数,频率=频数/样本容量。

8、在频率分布直方图中,纵坐标是频率/组距,所以,计算某一组的频率时,一定要记住用纵坐标去乘以组距,频率分布直方图中所有矩形的面积之和为 1 。

9、在频率分布直方图中,从左到右依次连接各矩形上底边的中点,就得到频率分布折线图。

10、茎叶图:适用于数据不多的时候,先把数据分成“茎”和“叶”两部分,然后把“茎”由小到大,由上往下写成一列,并在其左边和右边画一条竖直的线,最后把“叶”写在它所属的“茎”的同一侧,由小到大排成一行。

12 11、散点图:适用于 有相关性 的数据,比如身高和体重,将身高作为横坐标,体重作为 纵坐标 ,在平面直角坐标系中绘制出相应的 点,就得到了身高和体重的散点图。

(完整word版)高中必修三统计知识点整理(20190607191608)

(完整word版)高中必修三统计知识点整理(20190607191608)

高中数学必修 3 知识点总结第二章统计简单随机抽样1.简单随机抽样,也叫纯随机抽样。

就是从整体中不加任何分组、划类、排队等,完整随机地抽取检查单位。

特色是:每个样本单位被抽中的可能性同样(概率相等),样本的每个单位完整独立,相互间无必定的关系性和排挤性。

简单随机抽样是其它各样抽样形式的基础。

往常不过在整体单位之间差异程度较小和数目较少时,才采纳这类方法。

2.简单随机抽样常用的方法:( 1 )抽签法;⑵随机数表法;⑶计算机模拟法;⑷使用统计软件直接抽取。

在简单随机抽样的样本容量设计中,主要考虑:① 整体变异状况;② 同意偏差范围;③ 概率保证程度。

3.抽签法:(1 )给检核对象集体中的每一个对象编号;(2 )准备抽签的工具,实行抽签(3 )对样本中的每一个个体进行丈量或检查例:请检查你所在的学校的学生做喜爱的体育活动状况。

4.随机数表法:例:利用随机数表在所在的班级中抽取10 位同学参加某项活动。

2.1.2 系统抽样1.系统抽样(等距抽样或机械抽样):把整体的单位进行排序,再计算出抽样距离,而后依据这一固定的抽样距离抽取样本。

第一个样本采纳简单随机抽样的方法抽取。

K(抽样距离)=N(整体规模)/n(样本规模)前提条件:整体中个体的摆列对于研究的变量来说,应是随机的,即不存在某种与研究变量有关的规则散布。

能够在调查同意的条件下,从不一样的样本开始抽样,对照几次样本的特色。

假如有明显差异,说明样本在整体中的散布承某种循环性规律,且这类循环和抽样距离重合。

2.系统抽样,即等距抽样是实质中最为常用的抽样方法之一。

因为它对抽样框的要求较低,实行也比较简单。

更为重要的是,假如有某种与检查指标有关的协助变量可供使用,整体单元按协助变量的大小次序排队的话,使用系统抽样能够大大提升估计精度。

2.1.3 分层抽样1.分层抽样(种类抽样):1先将整体中的全部单位依据某种特色或标记(性别、年纪等)区分红若干种类或层次,而后再在各个种类或层次中采纳简单随机抽样或系用抽样的方法抽取一个子样本,最后,将这些子样本合起来构成整体的样本。

高一必修三统计知识点总结

高一必修三统计知识点总结

高一必修三统计知识点总结统计学是一门研究数据收集、整理、分析和解释的学科。

在高一必修三中,我们学习了一些基础的统计知识,包括数据的收集、图表的绘制、概率的计算等。

下面是对这些知识点的总结:一、数据的收集数据的收集是统计学的起点,我们需要了解如何进行数据的有效收集。

常见的数据收集方法包括实地观察、问卷调查和实验等。

在收集数据时,我们需要注意数据的可靠性和代表性,以便后续的统计分析能够得出准确的结论。

二、数据的整理与描述在将数据收集到手后,我们需要对数据进行整理和描述,以便更好地理解和分析数据。

数据的整理包括数据的分类、分组和排序等。

数据的描述则可以通过频数分布表、频数分布直方图和频率分布曲线等图表形式进行展示,帮助我们对数据有更清晰的认识。

三、图表的绘制与解读图表是数据展示的重要方式,通过图表可以直观地呈现数据的分布和规律。

常见的图表类型有条形图、折线图、饼图等。

在绘制图表时,我们需要选择合适的图表类型,并注意图表的标签、标题和比例尺等要素的准确性,以确保数据的准确性和可读性。

四、概率的计算与应用概率是统计学中的核心概念之一,它用于描述事件发生的可能性。

在概率计算中,我们学习了基本概率公式和条件概率公式,并通过实际问题进行概率的应用。

例如,我们可以利用概率来计算掷骰子得到某个特定点数的概率,或者计算从一副扑克牌中抽到某个指定花色的概率。

五、抽样与推断统计抽样是统计学中重要的方法之一,通过从总体中抽取一部分样本进行研究,可以推断出总体的一些特征。

在推断统计中,我们学习了抽样误差的概念,以及如何通过样本数据来估计总体参数,并对估计结果进行推断和判断。

总结:在高一必修三中,我们学习了基础的统计知识,包括数据的收集、整理与描述、图表的绘制与解读、概率的计算与应用以及抽样与推断统计等。

通过对这些知识点的学习和掌握,我们可以更好地理解和分析数据,从而做出准确的推断和判断。

统计学在现实生活中有着广泛的应用,它不仅可以帮助我们了解事物的变化规律,还可以指导我们进行决策和解决实际问题。

数学必修三统计和概率知识点总结

数学必修三统计和概率知识点总结

数学必修三统计和概率知识点总结
数学必修三统计和概率的主要知识点包括:
1. 统计:
- 样本调查与总体推断:样本的选择和调查方法,通过样本推断总体特征;
- 随机变量与概率分布:离散型和连续型随机变量的概念,概率质量函数和概率密度函数;
- 期望与方差:随机变量的期望值和方差;
- 离散型随机变量的分布:二项分布、泊松分布等离散型随机变量的性质;
- 连续型随机变量的分布:均匀分布、正态分布等连续型随机变量的性质;
- 多元随机变量与边缘分布:多个随机变量之间的关系与边缘分布;
- 相关与回归:随机变量之间的相关性和回归分析;
- 统计与误差:抽样误差和非抽样误差。

2. 概率:
- 随机事件与概率:样本空间、随机事件和概率的概念;
- 概率的运算:事件的和、积以及互斥事件的概率;
- 条件概率:在已知一事件发生的条件下,另一事件发生的概率;
- 事件的独立性:事件之间的独立性和联合概率;
- 正态分布的应用:正态分布的特性、标准正态分布的应用;
- 抽样与抽样分布:抽样的概念,样本均值的分布;
- 参数估计:点估计和区间估计;
- 假设检验:零假设和备择假设的提出,检验统计量的构造。

以上是数学必修三统计和概率的主要知识点总结,具体内容可根据教材的要求进行深入学习和了解。

必修3统计知识点复习

必修3统计知识点复习

必修3统计知识点复习在数学的学习中,必修 3 中的统计部分是一个重要的知识板块。

它不仅在学术研究中有着广泛的应用,也与我们的日常生活息息相关。

接下来,让我们一起系统地复习一下这部分的重要知识点。

一、随机抽样随机抽样是获取数据的重要方法之一,常见的随机抽样方法有简单随机抽样、系统抽样和分层抽样。

简单随机抽样是从总体中逐个抽取个体,每个个体被抽取的概率相等。

抽签法和随机数表法是实现简单随机抽样的常用方式。

系统抽样则是将总体平均分成若干部分,然后按照一定的规则,从每一部分抽取一个个体。

在进行系统抽样时,要注意抽样间隔的计算。

分层抽样是将总体分成若干层,然后从每一层中按照一定比例抽取样本。

这种抽样方法能够充分考虑总体的层次差异,使得样本更具代表性。

二、用样本估计总体1、频率分布表和频率分布直方图通过收集数据,整理得到频率分布表。

根据频率分布表,可以绘制出频率分布直方图。

频率分布直方图能够直观地展示数据的分布情况,包括众数、中位数和平均数等特征值。

众数是一组数据中出现次数最多的数据值;中位数是将数据从小到大排序后,位于中间位置的数值(如果数据个数为奇数),或者中间两个数的平均值(如果数据个数为偶数);平均数则是所有数据的总和除以数据的个数。

2、茎叶图茎叶图也是用来展示数据分布的一种方式。

它由“茎”和“叶”两部分组成,能够保留原始数据的信息,同时便于直观地比较数据。

3、样本的数字特征除了上面提到的众数、中位数和平均数,样本的方差和标准差也是重要的数字特征。

方差描述了一组数据的离散程度,方差越大,说明数据的离散程度越大;标准差则是方差的平方根。

三、变量间的相关关系1、相关关系的概念变量之间的关系分为函数关系和相关关系。

函数关系是一种确定性的关系,而相关关系则是一种非确定性的关系。

2、散点图通过绘制散点图,可以初步判断两个变量之间是否存在相关关系。

如果散点图中的点大致分布在一条直线附近,则称这两个变量线性相关。

高中数学必修三统计总结

高中数学必修三统计总结
n i 1 i
n
n i 1 i
i 1
i 1 i
( 2)
(y y ) (xi x ) xi y i n x y i d i 1 i 1 n 2 n 2 2 x n x ( x x ) i i 1 i i 1
n
a y bx

(3)得出回归方程:
的个体,再将取出的各个个体合起来作为样本
二、用样本估计总体 1、用样本的频率分布估计总体分布 (1)频率分布表:①求极差=最大值-最小值
②决定组数与组距 ③再将数据分组 ④列表:分组 频数
频率 频数 样本容量 组距 频率2)频率分布直方图: 长方形的高 频率 组距 (3)频率分布折线图:连接频率分布直方图中各长方形上端的中点 (4)总体密度曲线:样本容量增加,组数增加,组距减小。频率分布折线图





(3)标准差:方差的算术平方根叫做标准差
s 1 n x x 2 x x 2 x x 2 1 2 3





三、变量间的相关关系 (x n ,y n) 1、求回归方程: (x1 ,y 1)(x 2 ,y 2)(x 3 ,y 3) n n n n 1 ( 1) x 1 xi y i x y y x2
第二章 统计
人教版数学必修三
一、随机抽样 1、放回抽样 2、不放回抽样 (1)简单随机抽样 ①抽签法:编号 制签 搅拌 抽签确定样本 ②随机数法:编号 确定开始的数字 随机数表选号 确定样本 N (2)系统抽样:编号 分段间隔 K n 确定第一个个体编号
(n 1)K
取样本
(3)分层抽样:将总体分成互不相交的层,按照一定比例,从各层中一定数量

高中必修三统计知识点整理共8页

高中必修三统计知识点整理共8页

必修3知识点总结—统计2.1.1 简单随机抽样1.简单随机抽样,也叫纯随机抽样。

就是从总体中不加任何分组、划类、排队等,完全随机地抽取调查单位。

特点是:每个样本单位被抽中的可能性相同(概率相等),样本的每个单位完全独立,彼此间无一定的关联性和排斥性。

简单随机抽样是其它各种抽样形式的基础。

通常只是在总体单位之间差异程度较小和数目较少时,才采用这种方法。

2.简单随机抽样常用的方法:(1)抽签法;⑵随机数表法;⑶计算机模拟法;⑷使用统计软件直接抽取。

在简单随机抽样的样本容量设计中,主要考虑:①总体变异情况;②允许误差范围;③概率保证程度。

3.抽签法:(1)给调查对象群体中的每一个对象编号;(2)准备抽签的工具,实施抽签(3)对样本中的每一个个体进行测量或调查例:请调查你所在的学校的学生做喜欢的体育活动情况。

4.随机数表法:例:利用随机数表在所在的班级中抽取10位同学参加某项活动。

2.1.2系统抽样1.系统抽样(等距抽样或机械抽样):把总体的单位进行排序,再计算出抽样距离,然后按照这一固定的抽样距离抽取样本。

第一个样本采用简单随机抽样的办法抽取。

K(抽样距离)=N(总体规模)/n(样本规模)前提条件:总体中个体的排列对于研究的变量来说,应是随机的,即不存在某种与研究变量相关的规则分布。

可以在调查允许的条件下,从不同的样本开始抽样,对比几次样本的特点。

如果有明显差别,说明样本在总体中的分布承某种循环性规律,且这种循环和抽样距离重合。

2.系统抽样,即等距抽样是实际中最为常用的抽样方法之一。

因为它对抽样框的要求较低,实施也比较简单。

更为重要的是,如果有某种与调查指标相关的辅助变量可供使用,总体单元按辅助变量的大小顺序排队的话,使用系统抽样可以大大提高估计精度。

2.1.3分层抽样1.分层抽样(类型抽样):先将总体中的所有单位按照某种特征或标志(性别、年龄等)划分成若干类型或层次,然后再在各个类型或层次中采用简单随机抽样或系用抽样的办法抽取一个子样本,最后,将这些子样本合起来构成总体的样本。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

必修3知识点总结—统计简单随机抽样1.简单随机抽样,也叫纯随机抽样。

就是从总体中不加任何分组、划类、排队等,完全随机地抽取调查单位。

特点是:每个样本单位被抽中的可能性相同(概率相等),样本的每个单位完全独立,彼此间无一定的关联性和排斥性。

简单随机抽样是其它各种抽样形式的基础。

通常只是在总体单位之间差异程度较小和数目较少时,才采用这种方法。

2.简单随机抽样常用的方法:(1)抽签法;⑵随机数表法;⑶计算机模拟法;⑷使用统计软件直接抽取。

在简单随机抽样的样本容量设计中,主要考虑:①总体变异情况;②允许误差范围;③概率保证程度。

3.抽签法:(1)给调查对象群体中的每一个对象编号;(2)准备抽签的工具,实施抽签(3)对样本中的每一个个体进行测量或调查例:请调查你所在的学校的学生做喜欢的体育活动情况。

4.随机数表法:例:利用随机数表在所在的班级中抽取10位同学参加某项活动。

2.1.2系统抽样1.系统抽样(等距抽样或机械抽样):把总体的单位进行排序,再计算出抽样距离,然后按照这一固定的抽样距离抽取样本。

第一个样本采用简单随机抽样的办法抽取。

K(抽样距离)=N(总体规模)/n(样本规模)前提条件:总体中个体的排列对于研究的变量来说,应是随机的,即不存在某种与研究变量相关的规则分布。

可以在调查允许的条件下,从不同的样本开始抽样,对比几次样本的特点。

如果有明显差别,说明样本在总体中的分布承某种循环性规律,且这种循环和抽样距离重合。

2.系统抽样,即等距抽样是实际中最为常用的抽样方法之一。

因为它对抽样框的要求较低,实施也比较简单。

更为重要的是,如果有某种与调查指标相关的辅助变量可供使用,总体单元按辅助变量的大小顺序排队的话,使用系统抽样可以大大提高估计精度。

2.1.3分层抽样1.分层抽样(类型抽样):先将总体中的所有单位按照某种特征或标志(性别、年龄等)划分成若干类型或层次,然后再在各个类型或层次中采用简单随机抽样或系用抽样的办法抽取一个子样本,最后,将这些子样本合起来构成总体的样本。

两种方法:1.先以分层变量将总体划分为若干层,再按照各层在总体中的比例从各层中抽取。

2.先以分层变量将总体划分为若干层,再将各层中的元素按分层的顺序整齐排列,最后用系统抽样的方法抽取样本。

2.分层抽样是把异质性较强的总体分成一个个同质性较强的子总体,再抽取不同的子总体中的样本分别代表该子总体,所有的样本进而代表总体。

分层标准:(1)以调查所要分析和研究的主要变量或相关的变量作为分层的标准。

(2)以保证各层内部同质性强、各层之间异质性强、突出总体内在结构的变量作为分层变量。

(3)以那些有明显分层区分的变量作为分层变量。

3.分层的比例问题:(1)按比例分层抽样:根据各种类型或层次中的单位数目占总体单位数目的比重来抽取子样本的方法。

(2)不按比例分层抽样:有的层次在总体中的比重太小,其样本量就会非常少,此时采用该方法,主要是便于对不同层次的子总体进行专门研究或进行相互比较。

如果要用样本资料推断总体时,则需要先对各层的数据资料进行加权处理,调整样本中各层的比例,使数据恢复到总体中各层实际的比例结构。

例1 某大学为了支援我国西部教育事业,决定从2007应届毕业生报名的18名志愿者中,选取6人组成志愿小组.请用抽签法和随机数表法设计抽样方案.解抽签法:第一步:将18名志愿者编号,编号为1,2,3, (18)第二步:将18个号码分别写在18张外形完全相同的纸条上,并揉成团,制成号签;第三步:将18个号签放入一个不透明的盒子里,充分搅匀;第四步:从盒子中逐个抽取6个号签,并记录上面的编号;第五步:所得号码对应的志愿者,就是志愿小组的成员. 随机数表法:第一步:将18名志愿者编号,编号为01,02,03, (18)第二步:在随机数表中任选一数作为开始,按任意方向读数,比如第8行第29列的数7开始,向右读;第三步:从数7开始,向右读,每次取两位,凡不在01—18中的数,或已读过的数,都跳过去不作记录,依次可得到12,07,15,13,02,09.第四步:找出以上号码对应的志愿者,就是志愿小组的成员.例2 某工厂有1 003名工人,从中抽取10人参加体检,试用系统抽样进行具体实施. 解 (1)将每个人随机编一个号由0001至1003. (2)利用随机数法找到3个号将这3名工人剔除. (3)将剩余的1 000名工人重新随机编号由0001至1000.(4)分段,取间隔k=100001=100将总体均分为10段,每段含100个工人.(5)从第一段即为0001号到0100号中随机抽取一个号l.(6)按编号将l ,100+l ,200+l,…,900+l 共10个号码选出,这10个号码所对应的工人组成样本.例3 (14分)某一个地区共有5个乡镇,人口3万人,其中人口比例为3∶2∶5∶2∶3,从3万人中抽取一个300人 的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法并写出具体过程. 解 应采取分层抽样的方法.过程如下:(1)将3万人分为五层,其中一个乡镇为一层.(2)按照样本容量的比例随机抽取各乡镇应抽取的样本. 300×153=60(人);300×152=40(人); 300×155=100(人);300×152=40(人); 300×153=60(人),因此各乡镇抽取人数分别为60人,40人,100人,40人,60人.(3)将300人组到一起即得到一个样本.2.2.2用样本的数字特征估计总体的数字特征1、本均值:nx x x xn+++=212、.样本标准差:nx x x x x x s s n 222212)()()(-++-+-==3.用样本估计总体时,如果抽样的方法比较合理,那么样本可以反映总体的信息,但从样本得到的信息会有偏差。

在随机抽样中,这种偏差是不可避免的。

虽然我们用样本数据得到的分布、均值和标准差并不是总体的真正的分布、均值和标准差,而只是一个估计,但这种估计是合理的,特别是当样本量很大时,它们确实反映了总体的信息。

4.(1)如果把一组数据中的每一个数据都加上或减去同一个共同的常数,标准差不变. (2)如果把一组数据中的每一个数据乘以一个共同的常数k ,标准差变为原来的k 倍.(3)一组数据中的最大值和最小值对标准差的影响,区间)3,3(s x s x +-的应用;“去掉一个最高分,去掉一个最低分”中的科学道理.例1 为了解A ,B 两种轮胎的性能,某汽车制造厂分别从这两种轮胎中随机抽取了8个进行测试,下面列出了每一个轮胎行驶的最远里程数(单位:1 000 km ) 轮胎A 96, 112, 97, 108, 100, 103, 86, 98 轮胎B108,101,94,105,96,93,97,106(1)分别计算A ,B 两种轮胎行驶的最远里程的平均数,中位数; (2)分别计算A ,B 两种轮胎行驶的最远里程的极差、标准差; (3)根据以上数据你认为哪种型号的轮胎性能更加稳定 解 (1)A 轮胎行驶的最远里程的平均数为: 898861031001089711296+++++++=100,中位数为:298100+ =99; B 轮胎行驶的最远里程的平均数为: 810697939610594101108+++++++=100,中位数为:297101+=99. (2)A 轮胎行驶的最远里程的极差为:112-86=26, 标准差为:v1.0 可编辑可修改s=821430831242222222+++++++=2221≈;B 轮胎行驶的最远里程的极差为:108-93=15, 标准差为: s=86374561822222222+++++++=2118≈.(3)由于A 和B 的最远行驶里程的平均数相同,而B 轮胎行驶的最远里程的极差和标准差较小,所以B 轮胎性能更加 稳定.例2(14分)某化肥厂甲、乙两个车间包装肥料,在自动包装传送带上每隔30 min 抽取一包产品,称其重量,分别 记录抽查数据如下: 甲:102, 101, 99, 98, 103, 98, 99; 乙:110, 115,90,85,75,115,110.(1)这种抽样方法是哪一种 (2)将这两组数据用茎叶图表示;(3)将两组数据比较,说明哪个车间产品较稳定. 解 (1)因为间隔时间相同,故是系统抽样.(2)茎叶图如下:(3)甲车间: 平均值:1x =71(102+101+99+98+103+98+99)=100, 方差:s 12=71[(102-100)2+(101-100)2+…+(99-100)2]≈ 6.乙车间:平均值:2x =71(110+115+90+85+75+115+110)=100,方差:s 22=71[(110-100)2+(115-100)2+…+(110-100)2]≈ 4. ∵1x =2x ,s 12<s 22,∴甲车间产品稳定.2.3.2两个变量的线性相关1、概念:(1)回归直线方程 (2)回归系数 2.最小二乘法 3.直线回归方程的应用(1)描述两变量之间的依存关系;利用直线回归方程即可定量描述两个变量间依存的数量关系(2)利用回归方程进行预测;把预报因子(即自变量x )代入回归方程对预报量(即因变量Y )进行估计,即可得到个体Y 值的容许区间。

(3)利用回归方程进行统计控制规定Y 值的变化,通过控制x 的范围来实现统计控制的目标。

如已经得到了空气中NO 2的浓度和汽车流量间的回归方程,即可通过控制汽车流量来控制空气中NO 2的浓度。

4.应用直线回归的注意事项(1)做回归分析要有实际意义; (2)回归分析前,最好先作出散点图; (3)回归直线不要外延。

5. 回归直线方程的推导设x 与y 是具有线性相关关系的两个变量,且相应于样本的一组观测值的n 个点的坐标分别是:112233(,),(,),(,),,(,)n n x y x y x y x y ,下面给出回归方程的推导。

设所求的回归方程为ˆybx a =+,其中,a b 是待确定的参数,那么: ˆi i ybx a =+,(1,2,3,,i n =),样本中各个点的偏差是ˆ()i i i i y yy bx a -=-+,(1,2,3,,i n =)显然,上面的各个偏差的符号有正、有负,如果将他们相加会相互抵消一部分,,因此他们的和不能代表n 个点与回归直线在整体上的接近程度,而是采用n 个偏差的平方和Q 来表示n 个点与相应直线(回归直线)在整体上的接近程度。

即2211ˆ()()n ni i i i i i Q y yy bx a ===-=--∑∑=2222112233()()()()n n y bx a y bx a y bx a y bx a --+--+--++--求出当Q 取最小值时的,a b 的值,就求出了回归方程。

相关文档
最新文档