(完整word版)生物统计学复习资料(整理)
生物统计学复习资料

第一章1.生物统计学(Biostatistics)是数理统计在生物学研究中的应用,它是应用数理统计的原理和方法来分析和解释生物界各种现象和试验调查资料的一门学科。
属于应用统计学的一个分支。
是一门应用数学。
2.统计学(Statistics)是把数学的语言引入具体的科学领域,将所研究的问题抽象为数学问题的过程, 是收集、分析、列示和解释数据的一门科学.3.生物统计学是研究生命过程中以样本推断总体的一门学科。
4.生物统计学的基本类容:①试验设计:如何合理地进行调查或试验设计②统计分析:如何科学地整理、分析所收集来的具有变异的资料,揭示出隐藏其内部的规律性。
5.生物统计学的基本作用:①提供整理和描述数据资料的科学方法,确定某些性状和特性的数量特征.②运用显著检验,判断试验结果的可靠性或可行性。
③提供由样本推断总体的方法。
④提供试验设计的的一些重要原则。
6.常用的统计学术语:一.总体与样本具有相同性质的个体所组成的集合称为总体;总体有分为有限总体和无限总体。
组成总体的基本单元称为个体从总体中抽出若干个体所构成的集合称为样本(sample);(总体中的一部分)构成样本的每个个体称为样本单位;样本中所包含的个体数目叫样本容量或样本大小,样本容量常记为n。
一般在物学研究中,通常n<30的样本叫小样本,n ≥30的样本叫大样本。
二、参数与统计数描述总体特征的数量称为参数,也称参量。
常用希腊字母表示参数,例如用μ表示总体平均数,用σ表示总体标准差;描述样本特征的数量称为统计数,也称统计量。
常用英文字母表示统计数,例如用X-表示样本平均数,用S表示样本标准差.三、变量与常数变量,或变数,指相同性质的事物间表现差异性或差异特征的数据。
常数,表示能代表事物特征和性质的数值,通常由变量计算而来,在一定过程中是不变的.变量包括定量变量和定性变量,定性变量又可分为连续变量(可以有任何小数出现)和非连续变量(只有整数出现)。
(完整word版)生物统计学期末复习题库及答案.docx

第一章填空1.变量按其性质可以分为(连续)变量和(非连续)变量。
2.样本统计数是总体(参数)的估计值。
3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。
4.生物统计学的基本内容包括(试验设计)和(统计分析)两大部分。
5.生物统计学的发展过程经历了(古典记录统计学)、(近代描述统计学)和(现代推断统计学)3 个阶段。
6.生物学研究中,一般将样本容量(n≥30)称为大样本。
7.试验误差可以分为(随机误差)和(系统误差)两类。
判断1.对于有限总体不必用统计推断方法。
(×)2.资料的精确性高,其准确性也一定高。
(×)3.在试验设计中,随机误差只能减小,而不能完全消除。
(∨ )4.统计学上的试验误差,通常指随机误差。
(∨ )第二章填空1.资料按生物的性状特征可分为(数量性状资料)变量和(质量性状资料)变量。
2.直方图适合于表示(连续变量)资料的次数分布。
3.变量的分布具有两个明显基本特征,即(集中性)和(离散性)。
4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(变异数)。
5.样本标准差的计算公式 s=(x 2 (x) 2 n )。
判断题n11.计数资料也称连续性变量资料 ,计量资料也称非连续性变量资料。
(×)2.条形图和多边形图均适合于表示计数资料的次数分布。
(×)3.离均差平方和为最小。
(∨)4.资料中出现最多的那个观测值或最多一组的中点值 ,称为众数。
(∨ )5.变异系数是样本变量的绝对变异量。
(×)单项选择1.下列变量中属于非连续性变量的是 ( C ).A.身高B.体重C.血型D.血压2.对某鱼塘不同年龄鱼的尾数进行统计分析 ,可做成 ( A )图来表示 .A.条形B.直方C.多边形D.折线3.关于平均数 ,下列说法正确的是 ( B ).A.正态分布的算术平均数和几何平均数相等 .B.正态分布的算术平均数和中位数相等 .C.正态分布的中位数和几何平均数相等 .D.正态分布的算术平均数、中位数、几何平均数均相等。
生物统计学 复习资料

A提出无效假设与备择假设
H0:= 246,HA:> 246
B计算t值
经计算得:=252,S=9.115
所以
= == 2.281
C查临界t值,作出统计推断
t=2.281 >单侧t0.05(11),P< 0.05,否定H0:=246,接受HA:>246,可以认为该批饲料维生素C含量符合规定要求。
P(-∞<t<-2.131)+(2.131<t<+∞)=0.05。
由附表4可知,当df一定时,概率P越大,临界t值越小;概率P越小,临界t值越大。当概率P一定时,随着df的增加,临界t值在减小,当df=∞时,临界t值与标准正态分布的临界u值相等。
第三章
1、用山楂加工果冻儿,传统工艺平均每100g山楂出果冻儿500g.现采用一种新工艺进行加工,测定了16次,得知每100g山楂出果冻儿平均数为520g,标准差为S=12g,问新工艺与传统工艺之间有无显著差异?
在此例中,总体方差未知,而样本容量又不大,所以应该用t测验。其测验步骤如下:
A提出假设.H0:=0,即新工艺和传统工艺之间无显著差异;对HA:0,即新工艺和传统工艺之间存在显著差异.
B确定显著水平.
C检验计算
均数标准差:
统计量t值:
自由度:df=n-1=16-1=15(t0.01(df=15)=2.947)
【例5.3】某种猪场分别测定长白后备种猪和蓝塘后备种猪90kg时的背膘厚度,测定结果如表5-3所示。设两品种后备种猪90kg时的背膘厚度值服从正态分布,且方差相等,问该两品种后备种猪90kg时的背膘厚度有无显著差异?
表5-3长白与蓝塘后备种猪背膘厚度
生物统计复习资料(精品)

第一章 统计数据的搜集与整理1.1.3 抽样从总体获得样本的过程称抽样,抽样的目的是希望通过对样本的研究推断其总体。
抽样方法有随机抽样、分类抽样等。
1.1.4 随机抽样要求总体中的任何个体都有同等的机会被抽到;要求抽样时不受任何主观因素的影响。
1.1.5 放回式抽样和非放回式抽样放回式抽样:从总体中抽出一个个体,记下它的特征后,放回总体中,再做第二次抽样。
非放回式抽样:从总体中抽出个体后,不再放回。
1.2.1 连续型数据和离散型数据连续型数据(度量数据):与某种标准做比较所得到的数据.例如:长度,时间,重量。
对连续型数据进行分析的方法,通常称为变量的方法。
离散型数据(记数数据):由记录不同类别个体的数目所得到的数据.例如:尾数,成活或死亡个数对离散型数据进行分析的方法,通常称为属性的方法。
1.3 样本的几个特征数1.3.1 平均数:数据集中点的度量 1.3.2 标准差:数据的变异程度平均离差 样本方差 标准差1.3.3 偏斜度和峭度偏斜度:度量数据围绕众数呈不对称的程度。
用三阶中心矩m3 :nx x MD ∑-=||1)(22--=∑n x x s 1)(2--=∑n x x s nx x m ∑-=33)(m 3 =0 ,说明曲线对称于平均数,此时平均数等于中位数也等于众数。
m 3 >0,说明曲线向左偏斜,称左偏或正偏,此时众数小于中位数,而中位数小于平均数。
m 3<0,说明曲线向右偏斜面,称右编或负偏,此时平均数小于中位数,而中位数小于众数。
偏斜度 判断方法同m 3 峭度1.3.4 变异系数CV:用来表明样本标准差对平均数的变异幅度。
可以用来判断数据整齐程度,变异系数比较小的数据组比较整齐。
第二章 概率和概率分布2.1 概率的基本概念自然现象:确定性现象和非确定性现象(随机现象),统计学所研究的是非确定性现象. 2.1.1 概率的统计定义设k 次随机试验,成功事件A 出现l 次,则称l /k 是K 次随机试验中成功的频率。
《生物统计学》复习资料

《生物统计学》复习资料一、填空题1.变量之间的相关关系主要有两大类:(正相关)和(负相关)。
2.试验误差可以分为(随机误差)和(系统误差)两类。
3.样本标准差的计算公式( )。
解析:4.方差分析必须满足(正态性)、(方差齐性)和可加性3个基本假定。
5.在假设检验中,如果检验样本间差异是否极显著,则显著水平a取值为(0.05)。
6.在分析变量之间的关系时,一个变量X确定,Y是随着X变化而变化,两变量呈因果关系,则X称为(自变量),Y称为(因变量)。
二、单项选择题1.抽取样本的基本首要原则是(B)A、统一性原则B、随机性原则C、完全性原则D、重复性原则2.如果对各观测值加上一个常数a,其标准差(D)A、扩天√a倍B、扩大a倍C、扩大a²倍D、不变3.在一组数据中,其中一个数据9的离均差是3,那么该组数据的平均数是(B)A、12B、10C、6D、34.平均数是反映数据资料(B)0的代表值。
A、变异性B、集中性C、差异性D、独立性5.方差分析适合于(A)数据资料的均数假设检验。
A、两组以上B、两组C、一组D、任何6.在假设检验中,是以(A)为前提。
A、肯定假设B、备择假设C、无效假设D、有效假设7.统计学研究的事件属于(D)事件。
A、不可能事件B、必然事件C、小概率事件D、随机事件8.下列属于大样本的是(A)。
A、40B、25C、20D、109.在方差分析中,已知总自由度是15,组间自由度是3,组内自由度是(B)A、18B、12C、10D、510.已知数据资料有10对数据,并呈线性回归关系,它的总自由度、回归自由度和残差自由度分别是(C)A、9、1和8B、1、8和9C、8、1和9D、9、8和1三、判断题(正确的打√,错误的打×。
)1.对于有限总体不必用统计推断方法。
(×)2. 资料的精确性高,其准确性也一定高。
(×)3. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。
《生物统计学》复习资料

《生物统计学》复习资料2012.06 一、名词解释。
★集团:也称总体或母体,是符合指定条件的所有个体所组成(有限与无限)。
☆集团参数:由集团的全部个体观测值按一定方法计算出来的、反应集团特征的数值。
☆个体:构成集团的基本单位;对每个个体的同一特征(性状)进行观测可得到1个观测数据。
☆样本:按一定方法从集团中抽取出的一部分个体构成一个样本。
☆样本统计量:由样本中的全部个体观测值按一定方法计算出来的、反应样本特征的数值。
★偶然误差(机误):由非研究因素(环境条件)的随机波动对研究对象的影响而行成的试验指标的随机变化(实际观测值以真值为对称中心随机波动)。
☆系统误差:由非研究因素(环境条件)的趋势性(方向性)变化对研究对象的影响而行成的试验指标的方向性变化(实际观测值表现为普遍比真值大或小)。
☆准确度:实际观测值与真值间的符合程度。
☆精确度:实际观测值相互间的符合程度。
☆重复:每个处理在试验结束后能获得2个或更多的观测值。
★局部控制(区组化):将试验空间分范围地控制环境因素,使其对处理小区的影响达到最大程度的一致。
☆随机排列:各处理在小区中的位置由机会(而非主观意愿)决定且每个处理被安排在每个小区的机会要相等。
☆重复区:试验空间内人为根据环境变化情况划分的、各种非研究因素能够保持最大程度一致性的区域。
☆小区:安排试验处理的最小空间区域。
☆试验方案(狭义):根据试验目的和要求所拟定进行比较的一组试验处理的总称。
★试验因子:对试验对象在某方面的表现(试验指标)有影响的,试验过程中需要进行考查的条件。
★试验因素:有待比较的一组处理的因子。
★试验处理:预先设计好实施在试验单位上的一种具体措施。
☆试验水平:在试验中被人为设置的每种状态。
★试验指标:在某一项研究活动中,并不可能对所有的经济性状都进行研究,故而只能确定其中的某一个或某几个性状为需要进行研究和分析的目标性状,其余均为非目标性状,则相应的目标性状即为试验研究中的试验指标。
《生物统计学》复习

《⽣物统计学》复习《⽣物统计附试验设计》总复习⼀、主要内容1、基础知识①掌握⽣物统计的特点、基本概念,理解⽣物统计的作⽤;②了解资料的分类⽅法,掌握各类资料的初步整理⽅法;③掌握反映资料集中性和离中性的三个基本的统计量(平均数、标准差和变异系数)的概念、性质及计算;④掌握各种事件的概念和运算(和事件、积事件、互斥事件、对⽴事件、独⽴事件、完全事件);⑤掌握概率的定义、概率的计算、⼩概率事件实际不可能性原理(统计学上进⾏显著性检验的基本依据);⑥掌握⽣物科学研究中常⽤的概率分布:正态分布、⼆项分布、泊松分布、χ2分布、t 分布、F分布⑦理解样本平均数的抽样分布和样本平均数差数的分布。
⑧理解试验的⽬的是:由样本推断总体⑨掌握统计的原理和⽅法⼤数定理中⼼极限定理理论分布抽样分布2、假设检验⽅法①掌握u检验和t 检验——主要⽤于检验样本平均数(百分数)与总体平均数(百分数)或者两个处理平均数(百分数)差异是否显著;②掌握χ2检验——主要⽤于由质量性状得来的次数资料的显著性检验;③掌握⽅差分析——主要⽤于检验多个处理平均数间差异是否显著;3、统计分析⽅法①掌握简单相关与回归相分析②了解多元回归与相关分析③了解协⽅差分析4、试验设计⽅法①了解试验设计的基本概念、任务、特点与要求,掌握试验设计的基本原则(三原则);③掌握完全随机试验设计、配对设计、随机区组设计、拉丁⽅试验设计、交叉设计、正交设计的概念、原理、⽅法,结果的统计分析,各种⽅法的优错点;④掌握样本含量的确定;⑤了解调查设计的⽅法;⼆、基本概念1、总体——具有相同性质的个体所组成的集合2、样本——从总体中抽出的若⼲个个体所构成的集合3、样本容量——⼜称“样本数”,⼜称“样本⼤⼩”。
n4、样本单位——构成样本的每⼀个个体。
5、变量——相同性质的事物间表现差异性或差异特征的数据6、常数——代表事物特征和性质的数值7、参数——总体特征的度量8、统计数——从样本中计算所得的数值 9、效应——引起试验差异的作⽤称为效应10、试验误差——受⾮处理因素的影响使观测值与试验处理真值之间产⽣的差异称为试验误差。
生物统计学总复习重点

b
f(y)
P(a y b) a f (y)dy ?
Y ab
f(t)
df─>∞(标准正态曲线)
df=5
df=1
t
不同自由度下的t 分布图
f(χ2)
χ2分布
χ2
1.4 f( F)
1.2
1.0
0.8
0.6
0.4
0.2
0.0
0
1
F 分布曲线
df1 1, df2 5
df1 5, df2 5
df1 10, df2 10
2F
3
4
假设检验
小概率原理(P≤α)
反证法(假定H0成立,然后根据样本 结果推论是否为小概率事件,如果是
则拒绝H0 ,否则不拒绝。)
检验假设:
1. H0: =0 2. HA:=0
假设检验是在H0成立的前提下,从样本数据中寻找证据 来拒绝H0, “接受” HA。 如果样本证据不足,即P>,则只能不拒绝H0 ,暂且认 为H0正确; 如果证据充分,即P ≤ ,则有理由拒绝H0 ,认为差异有 统计学意义。
为什么?“接受零假设”的正确表述应当是什么? 方差分析的条件? 回归与相关分析的区别与联系 用样本直线回归方程,由X预测Y时,为什么不能任意外推?
有A、B、C、D、E、F 6个品种,拟设计一
品种比较试验。已知试验地西部肥沃,东部
贫瘠,应用什么
试验设计比较合理?
若上题中的试验地的土质状况较为均匀,则
275
322
在人为控制的不同无机磷含量x (ppm) 的土壤中种植玉 米,播后38天测定玉米植株中磷的含量y (ppm),现根据9 对观察值,已算得 x=13,y=80 ,sxx=734 ,syy=2274 , sxy = 1040,试完成:(1) 直线回归方程;(2) 对回归方程作 方差分析。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
生物统计学复习资料第一章1.生物统计学的基本作用:1)提供整理和描述数据资料的科学方法,确定某些性状和特征的数量特征。
2)判断试验结果的可靠性3)提供由样本推断总体的方法4)提供试验设计的一些重要原则3.总体:具有相同性质的个体所组成的集合4.个体:组成整体的基本单元5.样本:从总体中抽出的若干个体所构成的集合6.变量:相同性质的事物间表现差异性的某项特征。
按其性质分为连续变量和非连续变量。
变量可以是定量的,也可以是定性的。
7.连续变量:表示在变量范围内可抽出某一范围的所有值8.非连续变量:也称离散型变量,表示在变量数列中,仅能取得固定数值,并且通常是整数。
9.常数:是不能给予不同数值的变量,它代表事物特征和性质的数值,通常由变量计算而来,在一定过程中是不变的。
10.参数:对总体特征的度量11.统计数:由测定样本的全部重复观测值算得的描述样本的特征的数。
12.效应:试验因素相对独立的作用13.误差:是试验中不可控因素所引起的观测值偏离真值的差异14.随机误差:由于试验中许多无法控制的偶然因素所造成的试验结果与真实结果之间的差异,不可避免。
15.系统误差:由于试验处理以外的其他条件明显不一致所产生的带有倾向性或定向性的偏差,可避免。
16.错误:是指在试验过程中,人为因素所引起的差错。
17.准确性:在调查或试验中某一试验指标或性状的观测值与真实值接近程度18.精确性:指调查或试验中同一试验指标或性状的重复观测值彼此接近程度的大小。
第二章1.次数分布:在不同区间内变量出现的次数所构成的分布。
2.资料根据生物的形状特性,可分为数量性状和质量性状3.间断性变数:指用计数方法获得的数据,其各个观测值必须以整数表示,在两个相邻整数间不允许带有小数的值存在。
4.连续性变数:指称量、度量或测量方法所得到得数据,其各个观测值并不限制于整数,在两个数值之间可以有微量数值差异的第三个数值存在5.质量性状资料的方法:统计次数法,评分法统计次数法:于一定总体或样本内,统计其具有某个性状的个体数目及具有不同性状的个体数目,按类别及其次数或相对次数给分法:给予每类性状以相对数量的方法。
6.试验资料搜集方法:调查和试验7.资料调查方法:普查和抽样调查抽样调查:根据一定的原则对研究对象抽取一部分个体进行测量或度量,把得到的数据资料作为样本进行统计处理,然后利用样本特征数对总体进行推断。
8.随机抽样满足条件:1)总体中每个个体被抽中的机会均相等;2)总体中任意一个个体是否被抽中是相互独立的9.统计表要求:1)标题:简明扼要,准确地说明表的内容,有时须注明时间、地点2)标目:分横纵两项,横列在表的左侧,纵列表上端,须注明计算单位3)数字:一律用阿拉伯数字,以小数点对齐,无数字用“/”表示 4)线条:多用三线条。
上下两条边路略粗10.统计图绘制的要求:1)标题简明扼要,列于图的下方2)横纵坐标两轴有刻度,注明单位3)横轴从左至右,纵轴由下而上,数值由小至大,图形长宽约为5.4或6.5 4)图中要不同颜色或线条代表不同的事物时,应有图例说明11.计数资料基本采用单项式分组法进行整理12.计量资料的整理一般采用组距式分组法13.次数分布图分类:条形图、饼图、直方图、多边形图、散点图14.变量的基本特征:1)集中性:变量在趋势上有着向某一中心聚集,或者说以某一数值为中心而分布的性质。
特征数是平均值2)离散性:变量有着离中分散变异的性质。
特征数是变异数,常用的指标是极差、方差、标准差和变异系数15.平均数的种类:算术平均数、中位数、纵数、几何平均数17.标准差的作用;1) 表示变量分布的离散度2) 利用标准差的大小,可以概括的估计出变量的次数分布及各类观测值在总体中所占有的比例3) 估计平均数的标准误4) 进行平均数的区间估计和变异系数的计算18.组距:根据极差分成若干组,每组的距离相等,称为组距。
组距=极差/组数19.自由度:样本内独立且能自由变动的离均差的个数。
20.变异系数:样本的标准差除以平均数的百分比21. 平均数的用处:①平均数指出了一组数据的中心位置,标志着资料所代表性状的数量水平和质量水平; ②作为样本或资料的代表数据与其他资料进行比较。
平均数的特征:①离均差之和为零; ②离均差平方和为最小。
21.标准差的用处: ①标准差的大小,受实验后调查资料中的多个观测值的影响,如果观测值之间的差异大,离均差就越大; ②在计算标准差是如果对观察值加上一个或减去一个a ,标准差不变;如果给各观测值乘以或除以一个常数a ,所得的标准差就扩大或缩小a 倍; ③在正态分布中,X+-S 内的观测值个数占总个数的68.26%,X-+2s 内的观测值个数占总个数的95.49%,x-+3s 内的观测值个数占总个数的99.73%。
标准差的特征: ①表示变量分布的离散程度; ②标准差的大小可以估计出变量的次数分布及各类观测值在总体中所占的比例; ③估计平均数的标准差; ④进行平均数区间估计和变异数的计算。
22.比较总体和样本的平均数、标准差:总体平均数µ=∑x/N,式中分母为总体观察个数N ; 样本平均数x=∑x/n ,公式中n 是样本容量; 样本平均数是总体平均数的无偏估计值。
总体和样本标准差都等于离均差的平方和除以样本容量; 而总体标准差σ= ,分母上是总体观测值个数N; 而样本标准差是s=1n x x 2-∑-)( ,分母上是样本自由度n-1. 样本标准差s 是总体标准差σ的无偏估计值。
第三章:1.事件:一种事物常存在几种可能出现的情况,每种情况都为一次事件。
2.随机事件:在一定条件下,可能出现,也可能不出现的事件。
3.随机现象:在原本条件不变的条件下,重复进行观察,其结果未必相同的现象。
随机现象三个特征:1)试验可以在相同条件下多次重复且相互独立;2)给定条件下每次试验结果不只一个;3)每次试验不能预料出现那种结果,但可以大概预知。
4.常见的理论分布:离散型随机变量的二项分布、泊松分布、连续型随机变量的正态分布5.事件的相互关系:1)和事件:事件A 和事件B 至少有一件发生而构成的新事件2)积事件:事件A 和事件B 同时发生而构成的新事件3)互斥事件:事件A 和事件B 不能同时发生4)对立事件:事件A 和事件B 必有一个发生,但二者不能同时发生5)独立事件:事件A 的发生或事件B 的发生毫无关系6)完全事件:如果多个事件A1、A2…两两互斥,切每次试验结果必然发生其一6.加法定理是互斥事件A 和B 的和事件的概率等于事件A 和事件B 的概率之和7.乘法定理是独立事件的概率的乘积8.大数定理:样本容量越大,样本统计数与总体参数之差越小9.二项分布、泊松分布与正态分布的关系:如果n 相当大或p 与q 基本接近时,二项分布接近于正态分布;当λ较大时,泊松分布也接近正态分布。
10.正态分布的特征:1)当x=u 是,f(x)有最大值πσ212)当x-u 的绝对值相等时,f (x )值也相等,正态分布是以u 为中心向左右两侧对称分布3) (X-u)/σ的绝对值越大,f (x )值也越小,但f (x )永不会等于0,所以正态分布以x 轴为渐近线4)正态分布的曲线完全由参数u 和σ决定,u 确定正态分布曲线在x 轴上的中心位置,减小,曲线左移,增大曲线右移。
σ确定正态分布曲线的展开程度,越小,曲线展开程度越小,曲线越陡高,反之亦然5)正态分布曲线在x=u+σ处各有一个拐点,曲线通过拐点是改变弯曲的方向6)正态分布的概率密度曲线与渐近线X轴所围成的全部面积必然等于111.无偏估计值:如果参数所有样本的某一统计数的平均数等于总体的相应参数(1)样本平均数是总体平均数的无偏估计值(2)样本方差是总体方差的无偏估计值(3)样本标准差不是总体的标准差的无偏估计值12.中心极限定理:如果被抽样总体不是正态总体,但具有平均数u和σ2,当样本容量n不断增大,样本平均数的分布也越来越接近正态分布,且具有平均数u 和方差σ2/n13.t分布的特征:1)t 分布曲线是左右对称,围绕平均数u=0向两侧递降2)t 分布受自由度df=n-1的制约,每个自由度都有一条t分布曲线3)和正态分布相比,t分布的顶部偏低,尾部偏高,自由度大于等于30时,其曲线就比较接近正态分布曲线,当自由度趋向于无穷大时和正态分布曲线重合14.重置抽样(放回式抽样):指从总体中抽取一个个体,记下其特征数后再放回总体的抽样方法。
15.非重置抽样(不放回式抽样):指从总体中抽取一个个体,记下其特征数后不再放回的抽样方法。
16.抽样分布:指从总体中按一定的样本容量随机抽取全部所有可能的样本,由这些样本计算的统计数组成的分布。
17.无偏估计:指在统计数上如果所有可能样本的统计数的平均数等于总体相应的参数,则称这个统计数为总体相应参数的无偏估计量。
18.频率与概率之间的转化:事件A在n次重复试验中发生了m次,则比值m/n称为事件A发生的频率,记为W(A);事件A在n次重复试验中发生了m次,当试验次数n不断增加时,事件A发生的频率W(A)就越来越接近某一确定值p,则p即为事件A发生的概率。
二者的关系是:当试验次数n充分大时,频率转化为概率。
19.正态分布、标准正态分布、正态分布曲线的特点正态分布是一种连续型随机变量的概率分布,它的分布特征是大多数变量围绕在平均数左右,由平均数到分布的两侧,变量数减小,即中间多,两头少,两侧对称。
U=0,σ²=1的正态分布为标准正态分布。
正态分布具有以下特点:标准正态分布具有以下特点:①、正态分布曲线是以平均数μ为峰值的曲线,当x=μ时,f(x)取最大值πσ21;②、正态分布是以μ为中心向左右两侧对称的分布 ③、σux -的绝对值越大,f(x)值就越小,但f(x)永远不会等于0,所以正态分布以x 轴为渐近线,x 的取值区间为(-∞,+∞); ④、正态分布曲线完全由参数μ和σ来决定 ⑤、正态分布曲线在x=μ±σ处各有一个拐点;⑥、正态分布曲线与x 轴所围成的面积必定等于1。
正态分布具有两个参数μ和σ,μ决定正态分布曲线在x 轴上的中心位置,μ减小曲线左移,增大则曲线右移;σ决定正态分布曲线的展开程度,σ越小曲线展开程度越小,曲线越陡,σ越大曲线展开程度越大,曲线越矮宽。
第四章1. 统计推断是根据理论分布由一个样本或一系列样本所得的结果来推断总体特征的过程。
2.参数估计则是由丫根本结果对总体参数在一定概率水平下所做出的估计。
参数估计包括点估计和区间估计。
3.统计推断包括假设检验和参数估计两个方面任务:分析误差产生的原因,确定差异的性质,排除误差干扰,从而对总体的特征做出正确的判断。
4.假设检验:根据总体的理论分布和小概率原理,对未知或不完全知道的总体提出两种彼此对立的假设,然后由样本的实际结果,经过一定的计算,做出在一定概率意义上应该接受的那种假设推断。