最新生物统计学的应用实验指导书

最新生物统计学的应用实验指导书
最新生物统计学的应用实验指导书

目录

前言 (2)

Excel 在描述统计中的应用 (2)

Excel 在推断统计中的应用 (6)

实验一常用计算方法及描述统计量分析 (12)

试验二假设检验 (17)

试验三方差分析 (20)

试验四回归与相关分析 (25)

试验五生物信息学研究与分析 (27)

练习作业 (30)

前言

统计学是系统介绍有关如何测定、搜集、整理和分析客观现象总体数量特征的方法论科学。随着科学技术和社会经济的不断发展,统计学的应用领域也越来越广阔,特别是随着计算机科学的发展,基于大量数据处理的统计学在探求客观事物规律性方面越发显得重要,而统计学与计算机数据处理的结合也越来越紧密。

统计分析软件是数据分析的主要工具,完整的数据分析过程包括:数据的收集,数据的整理,数据的分析。统计学为数据分析过程提供一套完整的科学的方法论。统计软件为数据分析提供了实现手段。

统计分析软件的一般特点:功能全面,系统地集成了多种成熟的统计分析方法;有完善的数据定义、操作和管理功能;方便地生成各种统计图形和统计表格;使用方式简单,有完备的联机帮助功能;软件开放性好,能方便地和其他软件进行数据交换。

常用统计软件简介:eviews是tsp(dos版)的windows版本,以界面的友善、使用的简单而著称,基本上操作是傻瓜式,但是非常实用,处理回归方程是它的长处,能处理一般的回归包括多元回归问题。因为没有用dos操作系统了,所以这个软件很少用。

SAS真正的巨无霸,被誉为国际上的标准统计软件和最权威的组合式优秀统计软件。但是图形操作界面比较糟糕,一切围绕编程设计;人机对话界面太不友好,学习起来较困难(要编程);说明书非常难懂;价格贵的人直跳。

SPSS软件。这个软件的界面友好,使用简单,但是功能很强大,也可以编程,eviews能处理的它全能处理,另外横截面数据的处理是它的强项,能处理多变量问题,如进行因素分析、主成份分析、聚类分析、生存分析等。

matlab软件。这是一种工科软件,功能非常强大,在建筑、工程中使用比较多,做出来的图形能够用完美来形容,编程能力很强,不过用在统计上有点大才小用,编程也相对复杂。但是用做数学建模绝对是个好的工具。

EXCEL也能做一些简单直观的统计分析,如果已经安装宏的话还能做一些数值分析,也很实用。我们主要学习采用excel软件来处理相关实验数据。

Excel 在描述统计中的应用

在使用Excel 进行数据分析时,要经常使用到Excel 中一些函数和数据分析工具。其中,函数是Excel 预定义的内置公式。它可以接受被称为参数的特定数值,按函数的内置语法结构进行特定计算,最后返回一定的函数运算结果。例如,SUM 函数对单元格或单元格区域执行相加运算,PMT 函数在给定的利率、贷款期限和本金数额基础上计算偿还额。函数的语法以函数名称开始,后面是左圆括号、以逗号隔开的参数和右圆括号。参数可以是数字、文本、形如TRUE 或FALSE 的逻辑值、数组、形如#N/A 的错误值,或单元格引用。给定的参数必须能产生有效的值。参数也可以是常量、公式或其它函数。

Excel还提供了一组数据分析工具,称为“分析工具库”,在建立复杂的统计分析时,使用现成的数据分析工具,可以节省很多时间。只需为每一个分析工具提供必要的数据和参数,该工具就会使用适宜的统计或数学函数,在输出表格中显示相应的结果。其中的一些工具在生成输出表格时还能同时产生图表。如果要浏览已有的分析工具,可以单击“工具”菜单中的“数据分析”命令。如果“数据分析”命令没有出现在“工具”菜单上,则必须运行“安装”程序来加载“分析工具库”。安装完毕之后,必须通过“工具”菜单中的“加载宏”命令,在“加载宏”对话框中选择并启动它。

一、描述统计工具

(一)简介:此分析工具用于生成对输入区域中数据的单变量分析,提供数据趋中性和易变性等有关

信息。

(二)操作步骤:

1.用鼠标点击工作表中待分析数据的任一单元格。

2.选择“工具”菜单的“数据分析”子菜单。

3.用鼠标双击数据分析工具中的“描述统计”选项。

4.出现“描述统计”对话框,对话框内各选项的含义如下:

输入区域:在此输入待分析数据区域的单元格范围。一般情况下Excel会自动根据当前单元格确定待

分析数据区域。

分组方式:如果需要指出输入区域中的数据是按行还是按列排列,则单击“行”或“列”。

标志位于第一行/列:如果输入区域的第一行中包含标志项(变量名),则选中“标志位于第一行”复选

框;如果输入区域的第一列中包含标志项,则选中“标志位于第一列”复选框;如果输入区域没有标志项,

则不选任何复选框,Excel 将在输出表中生成适宜的数据标志。

均值置信度:若需要输出由样本均值推断总体均值的置信区间,则选中此复选框,然后在右侧的编辑

框中,输入所要使用的置信度。例如,置信度95%可计算出的总体样本均值置信区间为10,则表示:在5%

的显著水平下总体均值的置信区间为(X-10,X +10)。

第K 个最大/小值:如果需要在输出表的某一行中包含每个区域的数据的第k 个最大/小值,则选中

此复选框。然后在右侧的编辑框中,输入k 的数值。

输出区域:在此框中可填写输出结果表左上角单元格地址,用于控制输出结果的存放位置。整个输出结

果分为两列,左边一列包含统计标志项,右边一列包含统计值。根据所选择的“分组方式”选项的不同,Excel

将为输入表中的每一行或每一列生成一个两列的统计表。

新工作表:单击此选项,可在当前工作簿中插入新工作表,并由新工作表的A1 单元格开始存放计算

结果。如果需要给新工作表命名,则在右侧编辑框中键入名称。

新工作簿:单击此选项,可创建一新工作簿,并在新工作簿的新工作表中存放计算结果。

汇总统计:指定输出表中生成下列统计结果,则选中此复选框。

这些统计结果有:平均值、标准误差、中值、众数、标准偏差、方差、峰值、偏斜度、极差(全距)

最小值、最大值、总和、样本个数。

5.填写完“描述统计”对话框之后,按“确定”按扭即可。

(三)结果说明:描述统计工具可生成以下统计指标,按从上到下的顺序其中包括样本的平均值(x),

S/),组中值(Medium),众数(Mode), 样本标准差(S),样本方差(S2), 峰度值,偏度值,极差标准误差(n

(Max-Min),最小值(Min),最大值(Max),样本总和,样本个数(n)和一定显著水平下总体均值的置信区间。

二.直方图工具

(一)简介:直方图工具,用于在给定工作表中数据单元格区域和接收区间的情况下,计算数据的个别和累积频率,可以统计有限集中某个数直方图确定考试成绩的分布情况,它会给出考分出现在指定成绩区间的学生个数,而用户必须把存放分段区间的单元地址范围填写在在直方图工具对话框中的“接收区域”框中。

(二)操作步骤:

1.用鼠标点击表中待分析数据的任一单元格。

2.选择“工具”菜单的“数据分析”子菜单。

3.用鼠标双击数据分析工具中的“直方图”选项。

4.出现“直方图”对话框,对话框内主要选项的含义如下:

输入区域:在此输入待分析数据区域的单元格范围。

接收区域(可选):在此输入接收区域的单元格范围,该区域应包含一组可选的用来计算频数的边界值。这些值应当按升序排列。只要存在的话,Excel 将统计在各个相邻边界直之间的数据出现的次数。如果省略此处的接收区域,Excel 将在数据组的最小值和最大值之间创建一组平滑分布的接收区间。

标志:如果输入区域的第一行或第一列中包含标志项,则选中此复选框;如果输入区域没有标志项,则清除此该复选框,Excel 将在输出表中生成适宜的数据标志。

输出区域:在此输入结果输出表的左上角单元格的地址。如果输出表将覆盖已有的数据,Excel 会自动确定输出区域的大小并显示信息。

柏拉图:选中此复选框,可以在输出表中同时显示按降序排列频率数据。如果此复选框被清除,Excel 将只按升序来排列数据。

累积百分比:选中此复选框,可以在输出结果中添加一列累积百分比数值,并同时在直方图表中添加累积百分比折线。如果清除此选项,则会省略以上结果。

图表输出:选中此复选框,可以在输出表中同时生成一个嵌入式直方图表。

5.按需要填写完“直方图”对话框之后,按“确定”按扭即可。

(三)结果说明:完整的结果通常包括三列和一个频率分布图,第一列是数值的区间范围,第二列是数值分布的频数,第三列是频数分布的累积百分比。

三、利用Excel绘制散点图

(一)简介:散点图是观察两个变量之间关系程度最为直观的工具之一,利用Excel 的图表向导,可以非常方便的创建并且改进一个散点图,也可以在一个图表中同时显示两个以上变量之间的散点图。

(二)操作步骤:数据如图附-3所示,

可按如下步骤建立变量x-y,x-z 的散点图:

1.拖动鼠标选定数值区域A2:C12,不包括数据上面的标志项。

2.选择“插入”菜单的“图表”子菜单,进入图表向导。

3.选择“图表类型”为“散点图”,然后单击“下一步”。

4.确定用于制作图表的数据区。Excel 将自动把你前面所选定的数据区的地址放入图表数据区的内。

5. 在此例之中,需要建立两个系列的散点图,一个是x-y 系列的散点图,一个是x-z 系列的散点图,因此,必须单击“系列”标签,确认系列1的“X值”方框与“数值方框”分别输入了x,y数值的范围,在系列2的“X值”方框与“数值方框”分别输入了x,z数值的范围。在此例中,这些都是Excel 已经默认的范围,所以,可忽略第 5 步,直接单击“下一步”即可。

6. 填写图表标题为“X-Y 与X-Z散点图”,X轴坐标名称为“X”与Y轴坐标名称“Y/Z”,单击“下一步”。

7. 选择图表输出的位置,然后单击“完成”按扭即生成图附-4的图表。

(三)结果说明:如图附-4 所示,Excel 中可同时生成两个序列的散点图,并分为两种颜色显示。通过散点图可观察出两个变量的关系,为变量之间的建立模型作准备。

四、数据透视表工具

(一)简介:数据透视表是Excel 中强有力的数据列表分析工具。它不仅可以用来作单变量数据的次数分布或总和分析,还可以用来作双变量数据的交叉频数分析、总和分析和其它统计量的分析。

(二)操作步骤:如图附-5所示,表中列出学生两门功课评定结果,

可按如下步骤建立交叉频数表:

1.选中图附-5 中表格中有数据的任一单元格,然后选择“数据”菜单的“数据透视表”子菜单,进入数据透视表向导。

2.选择“Microsoft Excel 数据清单或数据库”为数据源。单击“下一步”。

3.选择待分析的数据的区域,一般情况下Excel会自动根据当前单元格确定待分析数据区域,因此你只要直接单击“下一步”按扭即可。

4.确定数据透视表的结构,在此例中,要建立的是一个交叉频数表,分别按语文和数学的成绩对学生的人数进行交叉频数分析,因此可按图附-6将三个按扭“学号”、“语文”、“数学”分别拖放到表格的指定部位,并且双击“求和项:学号”,将其改为记数项,结果如图附-6所示,然后单击“下一步”按扭。

图附-6

5.选择数据透视表的显示位置之后,单击“完成按扭”,可出现如图附-7所示的数据透视表。

图附-7

(三)结果说明:如图附-7 的结果所示,数据透视表可以作为一个交叉频数分析工具。完成数据透视表之后,可按需要修改数据表的显示格式。例如,如果想要把表格中的频数替换成为百分比数。可以用鼠标右击频数的任一单元格,选择“字段”子菜单,单击“选项”按扭,将“数据显示方式”替换成为“占总和的百分比”,然后单击“确定”按扭即可。按同样方式,可将数据透视表修改成为其它不同样式。

五、排位与百分比工具

(一)简介:此分析工具可以产生一个数据列表,在其中罗列给定数据集中各个数值的大小次序排位和相应的百分比排位。用来分析数据集中各数值间的相互位置关系。

(二)操作步骤:

1.用鼠标点击表中待分析数据的任一单元格。

2.选择“工具”菜单的“数据分析”子菜单。

3.用鼠标双击数据分析工具中的“排位与百分比”选项。

4.填写完“排位与百分比”对话框,单击“确定”按扭即可。

(三)结果说明:输出的结果可分为四列,第一列“点”是数值原来的存放位置,第二列是相应的数值,第三列是数值的排序号,第四列是数值的百分比排位,它的计算方法是:小于该数值的数值个数/(数值总个数-1)。

Excel 在推断统计中的应用

一、由样本推断总体

(一)简介:利用Excel 的几个函数,如求平均函数A VERAGE、标准差函数STDEV、T 分布函数TINV等的组合使用可以构造出一个专门用于实现样本推断总体的Excel 工作表。以下例子先计算样本的平均数和标准差,然后在一定置信水平上估计总体均值的区间范围。

(二)操作步骤:

1.构造工作表。如图附-13所示,首先在各个单元格输入以下的内容,其中左边是变量名,右边是相应的计算公式。

2. 为表格右边的公式计算结果定义左边的变量名。选定A4:B6,A8:B8和A10:B15 单元格(先选择第一部分,再按住CTRL 键选取另外两个部分),选择“插入”菜单的“名称”子菜单的“指定”选项,用鼠标点击“最左列”选项,然后点击“确定”按扭即可。

3. 输入样本数据,和用户指定的置信水平0.95,如图附-13所示。

4. 为样本数据命名。选定D1:D11 单元格,选择“插入”菜单的“名称”子菜单的“指定”选项,用鼠标点击“首行”选项,然后点击“确定”按扭,得到图附-14所示的计算结果。

图附-13

(三)结果说明:以上例子说明如何交叉组合使用Excel 的公式和函数,以构造出一个能实现样本推断总体有关计算的Excel 工作表。实际上,在用Excel 进行数据统计处理之时,许多统计功能可以使用和上例类似的方法,通过组合使用Excel的各类统计函数和公式加以实现的。

图附-14

二、假设检验

(一)简介:假设检验是统计推断中的重要内容。以下例子利用Excel 的正态分布函数NORMSDIST、判断函数IF 等,构造一张能够实现在总体方差已知情况下进行总体均值假设检验的Excel 工作表。

(二)操作步骤:

1.构造工作表。如图附-15所示,首先在各个单元格输入以下的内容,其中左边是变量名,右边是相应的计算公式。

2. 为表格右边的公式计算结果定义左边的变量名。选定A3:B4,A6:B8,A10:A11,A13:A15和A17:B19 单元格,选择“插入”菜单的“名称”子菜单的“指定”选项,用鼠标点击“最左列”选项,然后点击“确定”按扭即可。

3.输入样本数据,以及总体标准差、总体均值假设、置信水平数据。如图附-16所示。

4.为样本数据命名。选定C1:C11单元格,选择“插入”菜单的“名称”子菜单的“指定”选项,用鼠标点击“首行”选项,然后点击“确定”按扭,得到如图附-16中所示的计算结果。

图附-15

图附-16

(三)结果说明:如图附-16 所示,该例子的检验结果不论是单侧还是双侧均为拒绝Ho 假设。所以,根据样本的计算结果,在5%的显著水平之下,拒绝总体均值为35 的假设。同时由单侧显著水平的计算结果还可以看出,在总体均值是35 的假设之下,样本均值小于等于31.4 的概率仅为0.020303562。

三、双样本等均值假设检验

(一)简介:双样本等均值检验是在一定置信水平之下,在两个总体方差相等的假设之下,检验两个总体均值的差值等于指定平均差的假设是否成立的检验。我们可以直接使用在Excel 数据分析中提供双样本等均值假设检验工具进行假设检验。以下通过一例说明双样本等均值假设检验的操作步骤。例子如下,某工厂为了比较两种装配方法的效率,分别组织了两组员工,每组9人,一组采用新的装配方法,另外一组采用旧的装配方法。18个员工的设备装配时间图附-17中表格所示。根据以下数据,是否有理由认为新的装配方法更节约时间?

(二)操作步骤:以上例子可按如下步骤进行假设检验。

1. 选择“工具”菜单的“数据分析”子菜单,双击“t-检验: 双样本等方差假设”选项,则弹出图附-18 所示对话框。

2. 分别填写变量1 的区域:$B$1:$B$10,变量2 的区域:$D$1:$D$10,由于我们进行的是等均值的检验,填写假设平均差为0,由于数据的首行包括标志项选择标志选项,所以选择“标志”选项,再填写显著水平α为0.05,然后点击“确定”按扭。则可以得到图附-19所示的结果。

(三)结果分析:如图附-19中所示,表中分别给出了两组装配时间的平均值、方差和样本个数。其中,合并方差是样本方差加权之后的平均值,Df 是假设检验的自由度它等于样本总个数减2,t统计量是两个样本差值减去图附-19 假设平均差之后再除于标准误差的结果,“P(T<=t)单尾”是单尾检验的显著水平,“t 单尾临界”是单尾检验t 的临界值,“P(T<=t)双尾”是双尾检验的显著水平,“t 双尾临界”是双尾检验t 的临界值。由下表的结果可以看出t 统计量均小于两个临界值,所以,在5%显著水平下,不能拒绝两个总体均值相等的假设,即两种装配方法所耗时间没有显著的不同。

假设平均差之后再除于标准误差的结果,“P(T<=t)单尾”是单尾检验的显著水平,“t 单尾临界”是单尾检验t 的临界值,“P(T<=t)双尾”是双尾检验的显著水平,“t 双尾临界”是双尾检验t 的临界值。由下表的结果可以看出t 统计量均小于两个临界值,所以,在5%显著水平下,不能拒绝两个总体均值相等的假设,即两种装配方法所耗时间没有显著的不同。

Excel中还提供了以下类似的假设检验的数据分析工具,它们的名称和作用如下:

1.“t-检验:双样本异方差假设”:此分析工具可以进行双样本student t-检验,与双样本等方差假设检验不同,该检验是在两个数据集的方差不等的前提假设之下进行两总体均值差额的检验,故也称作异方差t-检验。可以使用t-检验来确定两个样本均值实际上是否相等。当进行分析的样本个数不同时,可使用此检验。如果某一样本组在某次处理前后都进行了检验,则应使用“成对检验”。

2.“t-检验:成对双样本均值分析”:此分析工具可以进行成对双样本学生氏t-检验,用来确定样本均值是否不等。此t-检验并不假设两个总体的方差是相等的。当样本中出现自然配对的观察值时,可以使用此成对检验,例如,对一个样本组进行了两次检验,抽取实验前的一次和实验后的一次。

3.“z - 检验:双样本均值分析”:此分析工具可以进行方差已知的双样本均值z - 检验。此工具用于检验两个总体均值之间存在差异的假设。例如,可以使用此检验来确定两种汽车模型性能之间的差异情况。

四、线性回归分析

(一)简介:线性回归分析通过对一组观察值使用“最小二乘法”直线拟合,用来分析单个因变量是如何受一个或几个自变量影响的。例子如图附-34所示,表中是我国1987年至1997 年的布匹人均产量和人均纱产量,试用线性回归分析的方法分析两组数据之间的关系。

(二)操作步骤

1.选择“工具”菜单的“数据分析”子菜单,双击“回归”选项,弹出回归分析对话框。其中主要选项的含义如下:Y 值输入区域,在此输入对因变量数据区域,该区域必须由单列数据组成;X 值输入区域,在此输入对自变量数据区域,Excel 将对此区域中的自变量从左到右按升序排列,自变量的个数最多为16;置信度,如果需要在汇总输出表中包含附加的置信度信息,则选中此复选框,然后在右侧的编辑框中,输入所要使用的置信度,95%为默认值;常数为零,如果要强制回归线通过原点,则选中此复选框;输出区域,在此输入对输出表左上角单元格的引用。汇总输出表至少需要有七列的宽度,包含的内容有anova 表、系数、y 估计值的标准误差、r2 值、观察值个数,以及系数的标准误差;新工作表,单击此选项,可在当前工作簿中插入新工作表,并由新工作表的A1 单元格开始粘贴计算结果,如果需要给新工作表命名,则在右侧的编辑框中键入名称;新工作簿,单击此选项,可创建一新工作簿,并在新工作簿中的新工作表中粘贴计算结果;残差,如果需要以残差输出表的形式查看残差,则选中此复选框;标准残差,如果需要在残差输出表中包含标准残差,则选中此复选框;残差图,如果需要生成一张图表,绘制每个自变量及其残差,则选中此复选框;线形拟合图,如果需要为预测值和观察值生成一个图表,则选中此复选框;正态概率图,如果需要绘制正态概率图,则选中此复选框。

2.按如下方式填写对话框:X 值输入区域为$B$1:$B$12, Y 值输入区域为$C$1:$c$12, 并选择“标志”和“线性拟合图”两个复选框,然后单击“确定”按扭即可。

(三)结果分析

按照如上的操作步骤即可得到图附-35下表的计算结果。结果可以分为四个部分,第一部分是回归统计的结果包括多元相关系数、可决系数R2、调整之后的相关系数、回归标准差以及样本个数。第二部分是方差分析的结果包括可解释的离差、残差、总离差和它们的自由度以及由此计算出的F统计量和相应的显著水平。第三部分是回归方程的截距和斜率的估计值以及它们的估计标准误差、t统计量大小双边拖尾概率值、以及估计值的上下界。根据这部分的结果可知回归方程为Y=8.46433*X-18.288。第四部分是样本散点图,其中蓝色的点是样本的真实散点图,红色的点是根据回归方程进行样本历史模拟的散点。如果觉得散点图不够清晰可以用鼠标拖动图形的边界达到控制图形大小的目的。用相同的方法可以进行多元线性方程的参数估计,还可以在自变量中引入虚拟变量以增加方程的拟合程度。对于非线性的方程的参数估计,可以在进行样本数据的线性化处理之后,再按以上步骤进行参数估计。

五、相关系数分析工具

(一)简介:此分析工具可用于判断两组数据之间的关系。可以使用“相关系数”分析工具来确定两个区域中数据的变化是否相关,即,一个集合的较大数据是否与另一个集合的较大数据相对应(正相关);或者一个集合的较小数据是否与另一个集合的较小数据相对应(负相关);还是两个集合中的数据互不相关(相关系数为零)。

(二)操作步骤:采用图附-3表中的数据,可按如下步骤计算变量x,y,z之间的相关系数。

1.用鼠标点击表中待分析数据的任一单元格。

2.选择“工具”菜单的“数据分析”子菜单。

3.用鼠标双击数据分析工具中的“相关系数”选项。

4.填写完“相关系数”对话框,单击“确定”按扭即可得到各个变量的相关系数矩阵,结果如图附-36 所示。

(三)结果说明:以上下三角矩阵计算出三个变量x,y,z 两两之间的相关系数,如变量x,y之间的相关系数为:0.929167,所以可以判断x,y之间存在着较高的正线性相关关系。

实验部分

实验一常用计算方法及描述统计量分析

实验目的:了解相关统计软件,掌握用EXCEL和SPSS等软件计算描述统计量并作统计分析图。

一、用EXCEL软件实现统计描述

【相关软件介绍,见前面内容(略),上机演示,学生练习。】

二、用EXCEL中的数据分析工具计算描述统计量的具体步骤:

1、选择“工具”下拉菜单

2、选择“数据分析”选项

3、在分析工具中选择“描述统计”

4、当出现对话框时

在“输入区域”方框内键入A1:A50

在“输出选项”中选择输出区域(在此选择“新工作表”)选择“汇总统计”(该选项给出全部描述统计量)

选择“确定”

三、用SPSS软件实现统计描述

四、用EXCEL作频数分布表和图形的步骤:

一)、直方图:

1、在第一列中输入全部分析数据

2、选择“工具”下拉菜单

3、选择“数据分析”选项

4、在分析工具中选择“直方图”

5、当出现对话框时

在“输入区域”方框内键入B2:B101

在“接收区域”:C14

在“输出区域”方框内键入E3

选择“累计百分率”

选择“图表输出”

选择“确定”

二)、箱体图:

步骤1:准备要绘图原始数据于Excel工作表上[A1:C11]

A B C

1no Y1Y2

2115.6317.22

3217.4418.19

4317.8320.71

5419.4021.70

6519.5322.54

7620.4922.76

8722.1922.91

9822.4023.07

10922.5523.82

111023.4725.50

步骤二:制作绘制Boxplot所需数据组,工作表上[A13:C18],注意顺序内容不可更改

A B C

13统计量Y1Y2

14Q118.22 20.96

15Q015.63 17.22

16Q220.01 22.65

17Q423.47 25.50

18Q322.35 23.03

表中Q0~Q4的Q为四分位数,0~4分别代表第0~4分位数,可用函数求得,如Y1的Q0~Q4如表所示

Q1第1分位数第25%点值=Quartile(B2:B11, 1)

Q0第0分位数第0点值(最小值)=Quartile(B2:B11, 0)

Q2第2分位数第50%点值(中位值)=Quartile(B2:B11, 2)

Q4第4分位数第100%点值(最大值)=Quartile(B2:B11, 4)

Q3第3分位数第75%点值=Quartile(B2:B11,3)

步骤三:开始制作绘制Boxplot

1 选取[B13:C18]

2 点[图表向导] 选[折线图] 的第一个折线图(不要数据点,通常默认为数据点折线图),

点[下一步],在[数据区域]卷标下,自[系列产生在] 点[行]←重点

3 进入图表选项后取消勾选[网络线],取消勾选[图例] 后完成[图表向导],此图表显示五条线

4 用鼠标点图中的任一线后取右键,叫出[数据系列格式],在[选项] 卷标下,勾选[高低点连线] 与[涨/跌柱线],此后原为灰色的[分类间距] 变黑,内有数字默认为150,不必更动(有需要时可变更此数改变箱线图的箱宽),点击[确定] 后就会出现箱线图。

步骤四:开始润饰Boxplot 图

此为Excel 图表操作基本功夫故不详述,润饰内容

1 更改刻度为15~28,主要刻度为2.5

2 更改中位数的[数据标记]为『-』,因为无数据点的折线图看不到中位数,故需要让其显示,作法是点击联结Y1与Y2间五条线的中线(正常操作是黄色线),鼠标右键叫出[数据点格式],在[图案] 卷标下[线形] 点[无],[数据标记] 点[自订义],[样式] 选『-』(较长横线),[前颜色] 请自订鲜艳颜色如蓝色,[大小] 取5 (最高14)

3 取消Y1 与Y2间的4条连结线

练习:1、箱图制作

2、误差条图

3、雷达图

4、直方图,《生物统计学》书中例题,作业题2.9,练习题1和2。

试验二假设检验

一、单样本假设检验

1、方差检验的计算方法

设H0:μ=μ0,且原始数据在A1:A20位置。

①在空单元(设为B1)中输入公式:

“=Var(A1:A20)*19/σ0^2↙”

其中Var为EXCEL的内部函数,功能为求指定数据的方差.“↙”为回车键。

②在B2格中输入:

“=Chidist(B1,19)”

这一步是计算统计量所对应的概率,相当于查表。注意函数Chidist返回的是单尾概率,而不是分布函数。

③将B2中数据与α比较来确定是否接受H0:

双边检验:若α/2

单边检验:若H A为σ>σ0:当B2>α时接受H0;

若H A为σ<σ0:当B2<1-α时接受H0。

一般地,在实际应用中都是将上述步骤可通过一次输入如下公式来完成:

“=Chidist(Var(A1:A20)*19/σ0^2,19)↙”

注意:大小写没有区分。

2、均值检验方法

设H0:μ=μ0,且原始数据在A1:A20位置。

(1)总体方差σ0已知的情况

①在空单元格(设为C1)中输入:

“=ZTEST(A1:A20,μ0,σ0)↙”

内部函数ZTEST可以直接算出u统计量所对应的单尾开率值。注意它返回的也是单尾概率,而不是分布函数。

②仍按前面讲的比较B1与α的同样方法比较C1与α,并决定是否接受H0。

(2)总体方差σ0未知——t检验

①在空单元格D1-D20中均匀填充上μ0。

②在空单元格E1中输入:

“=TTEST(A1:A20,D1:D20,tails,1)↙”

其中tails为一参数,当进行单尾检验时,把它换成1;进行双尾检验时,换成2。最后的1也是一个参数,一般配对检验为1,方差相等为2,方差不等为3。

③把E1格中计算出来的值与α比较,E1>α时,接受H0。E1<α时,拒绝H0。

例1、已知某种玉米平均穗重μ0=300g,标准差σ=9.5g,喷药后,随机抽取9个果穗,重量分别为(单位g):308,305,311,298,315,300,321,294,320。问这种药对果穗重量是否有影响?

解:如表1-1,把果穗重原始数据填入A2:A10单元。

检验方差是否变化:在B4单元里输入:

“=Chidist(Var(A4:A12)*8/9.5^2,8)”

回车后显示数字0.414234,由于这一数字在0.025和0.975之间,因此接受H0,认为方差没有变化。

检验均值是否变化:

由于方差已知,可采用ZTEST,在B8中输入:

“=ZTEST(A2:A10,300,9.5)”

回车后显示数字0.005763。由于这一数字小于0.025,大于0.005,因此拒绝H0,喷药前后果穗重差异显著,但未达到极显著。

也可以当作方差未知,直接进行T检验:

在C2:C10单元格中填充数字300。

在D4单元格中输入:

“=TTEST(A2:A10,C2:C10,2,1)”

回车后显示数字0.037208,由于这一数字小于0.05,大于0.01,因此拒绝H0,喷药前后果穗重差异仍为显著,但未达到极显著水平。

表1-1 例1计算结果(μ0=300,σ0=9.5)

二、双样本假设检验

1、方差检验的计算方法-F检验

原假设H0:σ=σ0,备择假设H A:σ≠σ0

假设两组数据分别位于A1:A10,B1:B10。

①在空单元格C1中输入:

“=FTEST(A1:A10,B1:B10)↙”

注意FTEST返回的是双尾概率,因此可以直接与α比较。

②比较:C1>α时,接受H0。C1<α时,拒绝H0。

2、均值检验方法

(1)两总体方差已知——u检验

①在空单元格D1中输入:

“=(AVERAGE(A1:A10)- AVERAGE(B1:B10))/

SQRT(σ12/count(A1:A10)+σ22/count(B1:B10))↙”

这一步计算统计量的值,用了以下几个函数:A VERAGE计算平均数;SQRT计算平方根;count计算指定区域中数字的个数。σ12,σ22应直接输入数值。

②在D2中输入:

“=Normsdist(D1)↙”

③将D2的数值与α比较:

双边检验:若α/2

单边检验:上尾检验;若H A为μ1>μ2:当D2<1-α时接受H0;

下尾检验:若H A为μ1<μ2:当D2>α时接受H0。

注意:由于Normsdist函数返回的是分布函数,而不是尾区概率,因此这里单边检验的接受域与使用Chidist和Ztest函数时正好相反。使用时请特别注意所用函数返回的到底是分布函数还是尾区概率,否则单边检验时很容易出错误。

(2)两总体方差未知

由于Ttest函数中已考虑了方差未知时的各种可能,因此使用中很方便,只需改变以下参数的取值就可以了。

①在空格E1中输入:

“=TTEST(A1:A10,B1:B10,tails,type)↙”

其中tails为一参数,当进行单尾检验时,把它换成1;进行双尾检验时,换成2。type也是一个参数,一般配对检验为1,方差相等为2,方差不等为3。

使用时直接把参数换为相应的数值即可。由于函数返回的数值为尾区概率,因此可直接与α相比。

②把E1的数值与α比较,E1>α时,接受,否则拒绝H0。

注意:单尾检验中不管两个均值谁大Ttest给出的概率都是相同的,因此在上尾检验(H A:μ1>μ2)中第一个样本均值偏小,或下尾检验(H A:μ1<μ2)中第一个样本均值偏大,都有错误拒绝H0的可能,使用时需要特别注意。

例2 两发酵法生产青霉素的工厂,其产品收率的方差分别为σ12=0.46,σ22=0.37,现甲工厂测得25个数据,x=3.71g/L,乙工厂测得30个数据,y=3.46 g/L,问它们的收率是否相同?

解:由于两总体方差已知,可采用正态分布进行检验,在空格E3中输入

“=Normsdist((3.71-3.46)/SQRT(0.46/25+0.37/30))”

回车后显示数字0.923073,由于这一数字在0.025和0.975之间,因此接受H0,认为这两个工厂的收率相同。

练习:1、验证课本上的例题。

2、课本中的作业题4.6、4.10、4.11。

3、练习题3、5、8

试验三方差分析

方差分析是重要的统计方法之一,它主要用于比较多组数据的平均数是否相同。利用EXCEL的统计函数可以手工进行方差分析,也可以利用宏进行自动计算。本实验首先介绍方差分析的手工计算方法,然后再介绍利用宏进行自动计算的方法。

一、方差分析的手工计算方法:

我们通过例题来学习:

一)、单因素方差分析

例3-1 用四种不同配合饲料饲养30日龄小鸡,10天后计算平均日增重,得到如下表中的数据,4钟饲料效果是否相同?

表3-1 1 0天后小鸡的平均日增重

饲料日增重x ij/g

1 55 49 6

2 45 51

2 61 58 52 68 70

3 71 65 56 73 59

4 8

5 90 7

6 78 69

解:把数据输入EXCEL,得到表3-2。H0:各饲料无显著差异。

表3-2 计算结果

(1)计算各饲料日增重平均值:在B8中输入:“=Average(B3:B7)”

回车后,显示数字52.4。然后把B8复制到C8:E8,得到各平均值。

(2)计算SS T:在B10中输入:“=Var(B3:E7)”

回车后,显示数字146.02895。这是全部原始数据的样本方差。

在D10中输入:“=19*B10”

回车后,显示数字2774.55。这就是总平方和SS T。公式中19 =ab-1,a=4,b=5。

(3)计算SS A:在B11中输入:“=Var(B8:E8)”

回车后,显示数字127.23667。这是各平均值的样本方差。

在D11中输入:“=15*B11”

回车后,显示数字1908.55。这就是总平方和SS A。公式中15=b(a-1)。

(4)计算SS e:在D12中输入:“=D10-D11”

应用统计学实验导书

应用统计学实验指导书 统计实验一MINITAB的基本操作、描述统计与区间估计 班级专业:工业工程10-2班姓名:裴琦斐学号:01100303 日期: 一、实验目的 1. 了解MINITAB的基本命令与操作、熟悉MINITAB数据输入、输出与编辑方法; 2. 熟悉MINITAB用于描述性统计的基本菜单操作及命令; 3. 会用MINITAB求密度函数值、分布函数值、随机变量分布的上下侧分位数; 4. 会用MINITAB进行参数区间估计. 二、实验准备 1. 参阅教材《工程统计学》P241~P246; 2. 采用的命令: 统计(S)>基本统计量> 描述性统计;统计(S)>图表>直方图; 图表>柱状图; 计算> 概率分布> 二项/ 正态/ F / t; 统计(S)>基本统计量> 1 Z单样本; 统计(S)>基本统计量> 1 T单样本等. 三、实验内容 1.测量100株玉米的单株产量(单位:百克),记录如下100个数据. 4.5 3.3 2.7 3.2 2.9 3.0 3.8 4.1 2.6 3.3 2.0 2.9 3.1 3.4 3.3 4.0 1.6 1.7 5.0 2.8 3.7 3.5 3.9 3.8 3.5 2.6 2.7 3.8 3.6 3.8 3.5 2.5 2.8 2.2 3.2 3.0 2.9 4.8 3.0 1.6 2.5 2.0 2.5 2.4 2.9 5.0 2.3 4.4 3.9 3.8 3.4 3.3 3.9 2.4 2.6 3.4 2.3 3.2 1.8 3.9 3.0 2.5 4.7 3.3 4.0 2.1 3.5 3.1 3.0 2.8 2.7 2.5 2.1 3.0 2.4 3.5 3.9 3.8 3.0 4.6 1.5 4.0 1.8 1.5 4.3 2.4 2.3 3.3 3.4 3.6 3.4 3.5 4.0 2.3 3.4 3.7 1.9 3.9 4.0 3.4 ①请求出以下统计量: 样本数,平均值,中位数,截尾平均数,样本标准差, 样本平均数的标准差,最大值,最小值,第1、3个四分位数; ②求出频率与频数分布; ③作出以上数据的频率直方图. 2. 产生一个F(20,10)分布,并画出其图形. 3. 用MINITAB菜单命令求χ2(9)分布的双侧0.05分位数. 4. 设鱼被汞污染后,鱼的组织中含汞量X~N(μ, σ 2),从一批鱼中随机地抽出6条进行检验, 测得鱼组织的含汞量(ppm)为:2.06,1.93,2.12,2.16,1.98,1.95, (1) 求这一批鱼的组织中平均含汞量的点估计值; (2) 根据以往历史资料知道σ=0.10,以95%的置信水平,求这一批鱼的组织中平均含汞量 的范围;

生物统计学 实验报告 大肠杆菌

A 题 细胞体内代谢物浓度预测 随着基因组、转录组、蛋白质组等各种“组学”研究计划的蓬勃开展,生命科学进入了“组学”时代。代谢组学作为系统生物学的重要分支,其研究的重点是细胞内代谢物种类与浓度的定性和定量分析以及代谢网络的构建和模拟。 对代谢物的检测及浓度测定主要采用实验方法,包括核磁共振、气相色谱-质谱联用和液相色谱-质谱联用等技术。但由于代谢物种类繁多,且大部分浓度较低(μM 数量级),尤其是胞内代谢物提取难度非常大,精确测定其浓度异常困难,而且实验测定需要消耗大量财力物力和人力,因此通过计算机方法对代谢物浓度预测和分析变得越来越重要。 活细胞的代谢物浓度由什么决定?除了一些特定的代谢和酶的作用以外,有没有那种能全局影响浓度值的性质? 试根据附件中的数据完成如下问题: 1 根据不同类型的数据,分析代谢物浓度与其物理化学性质之间的关系。 2 筛选合适的物理化学性质,建立预测代谢物浓度的预测模型,并对此模型进行评价; 1.线性插补法处理缺失数据 原理:用该列数据缺失值前一个数据和后一个数据建立线性插值,然后用缺失点在线性插值函数的函数值填充该缺失值,即: 在于消除不同变量的量纲的影响,而且标准化转化不会改变变量的相关系数。 代谢物浓度:取对数 代谢物理化性质:标准差标准化法 )1,1( m j n i S x x x j j ij ij ≤≤≤≤-=' 式中:.)(11,1121∑∑==--= =n i j ij j n i ij j x x n S x n x 3.SAS 软件建立多元线性回归方程 回归模型一般形式: u X b X b X b b Y k k +++++= (22110)

生物统计学实验指导

《生物统计学》实验教学教案 [实验项目] 实验一平均数标准差及有关概率的计算 [教学时数] 2课时。 [实验目的与要求] 1、通过对平均数、标准差、中位数、众数等数据的计算,掌握使用计算机计算统计量的方法。 2、通过对正态分布、标准正态分布、二项分布、波松分布的学习,掌握使用计算机计算有关概率和分位数的方法。为统计推断打下基础。 [实验材料与设备] 计算器、计算机;有关数据资料。 [实验内容] 1、平均数、标准差、中位数、众数等数据的计算。 2、正态分布、标准正态分布有关概率和分位数的计算。 3、二项分布有关概率和分位数的计算。 4、波松分布有关概率和分位数的计算。 [实验方法] 1、平均数、标准差、中位数、众数等数据的计算公式。 平均数=Average(x1x2…x n) 几何平均数=Geomean(x1x2…x n) 调和平均数=Harmean(x1x2…x n) 中位数=median(x1x2…x n) 众数=Mode(x1x2…x n) 最大值=Max(x1x2…x n) 最小值=Min(x1x2…x n) 平方和(Σ(x- )2)=Devsq(x1x2…x n) x 样本方差=Var (x1x2…x n) 样本标准差=Stdev(x1x2…x n) 总体方差=Varp(x1x2…x n) 总体标准差=Stdevp(x1x2…x n) 2、正态分布、标准正态分布有关概率和分位数的计算。 一般正态分布概率、分位数计算:

概率=Normdist(x,μ,σ,c) c 取1时计算 -∞-x 的概率 c 取0时计算 x 的概率 分位数=Norminv(p, μ, σ) p 取-∞到分位数的概率 练习: 猪血红蛋白含量x 服从正态分布N(12.86,1.332),(1) 求猪血红蛋白含量x 在11.53—14.19范围内的概率。(0.6826)(2) 若P(x <1l )=0.025,P(x >2l )=0.025,求1l ,2l 。 (10.25325) L1=10.25 L2=15.47 标准正态分布概率、分位数计算: 概率=Normsdist(x) c 取1时计算 -∞--x 的概率 c 取0时计算 x 的概率 分位数=Normsinv(p) p 取-∞到分位数的概率 练习: 1、已知随机变量u 服从N(0,1),求P(u <-1.4), P(u ≥1.49), P (|u |≥2.58), P(-1.21≤u <0.45),并作图示意。 参考答案: (0.080757,0.06811,0.00988,0.5605) 2、已知随机变量u 服从N(0,1),求下列各式的αu 。 (1) P(u <-αu )+P(u ≥αu )=0.1; 0.52 (2) P(-αu ≤u <αu )=0.42; 0.95 参考答案: [1.644854, 0.63345; 0.553385, 1.959964] 3、二项分布有关概率和分位数的计算。 概率=Binomdist(x,n,p,c) c 取1时计算 0-x 的概率 c 取0时计算 x 的概率 练习: 1、已知随机变量x 服从二项分布B (100,0.1),求μ及σ。 参考答案: 见P48,μ= np, σ=(npq)0.5 2、已知随机变量x 服从二项分布B(10,0.6),求P(2≤x ≤6),P(x ≥7),P(x<3)。 参考答案: 0.6054, 0.38228, 0.012295 4、波松分布有关概率和分位数的计算。 概率=Poisson(x,λ,c) c 取1时计算 0-x 的概率 c 取0时计算 x 的概率 练习: ),(m n Permut C m n =

统计学实验指导

第二章统计学实验指导 实验一:统计整理与分组 实验目的: 运用excel进行常见数据类型的统计整理,能熟练运用菜单和各类函数进行数据筛选、排序,运用数据透视表绘制统计频数分布表。 实验要求: 独立完成课堂各类习题和练习,按要求完成实验内容。 实验形式: 教师演示、指导 实验内容: 1、品质数据分组:利用数据透视表直接绘制,但是需要注意排序数据 2、数值数据分组:对数据排序后,能分析选择数值数据的分组形式。 能利用数据透视表编制单项式分组统计次数数列; 熟练应用统计函数编制组距式分组统计次数分布数列。 一、统计数据的预处理 1、数据筛选:参见指导P37—39 (1)自动筛选: 将鼠标定位于数据文件的变量标题行; 点击菜单“数据”——筛选——自动筛选后,则在标题行出现下拉箭头; 在需要筛选的变量下点击下拉箭头,自行选择筛选功能(前10个,自定义),后确定。 自动筛选结果会自动从原数据区域中被选择出来显示,不符合条件的被屏蔽。 自动筛选一次只能执行一次筛选条件。 取消筛选:将数据“数据”——筛选——自动筛选再点击一次,去掉自动筛选前的“√”。(2)高级筛选: 选择空白区域创立筛选条件区域:筛选变量、筛选条件值 菜单“数据”——筛选——高级筛选后,进入高级筛选对话框;

筛选方式:通常是筛选结果另行放置,防止与原数据混淆。 列表区域:整个数据库区域,一般系统会自动选择。 条件区域:高级筛选可同时执行多个条件的综合筛选结果,选出符合条件的数据区域。 如果同时多个条件筛选,条件区域中将多个条件变量取值同行放置,表示“与”。 若至少满足多个条件之一,条件区域中将多个条件变量取值换行放置,表示“或”。 筛选文化程度为大学本科或岗位为管理员的员工则如此设置: 应用1:利用自动筛选选择男性员工; 利用高级筛选选择当前工资在3万元以上的工人; 利用高级筛选选择年龄在40岁以下或大学本科及以上的职工。 2、数据排序:参见指导P41 将鼠标定位于待分析数据区域的任意位置; 点击菜单“数据”——排序后,进入排序对话框; 排序对话框中: 主要关键字:排序变量。 次要关键字:各总体单位排序变量取值相同时,若指定次要关键字,则按此排序,否则按出现的先后顺序排。 我的数据区域:选择参与排序的数据区域。有标题行,则数据区域第一行不参与排序,一般数据区域首行为变量名时如此选择。否则,无标题行,数据从第一行第一列开始排序。 选项:指定升降序排列形式:次序、方向、方法,用于字符型数据的排序设置。 应用2:对加工零件数按照一定大小进行排序; 对售后服务质量按照一定优劣进行排序。 二、统计分组 统计整理及分析结果的编写通常在word 文档中录入和编辑,只要能用excel 生成相 对规范的统计表和统计图,然后可以复制到word 中进行美化排版即可。 管理员

统计学专业及其应用领域的介绍

一、统计学专业介绍 统计学专业主要培养具有良好的数学、计算机与经济学素养,掌握统计学的基本理论和方法,能熟练地运用计算机分析数据,能在企业、事业单位和经济、管理部门从事统计调查、统计信息管理、数量分析等开发、应用和管理工作。 在偶然中寻求必然是应用统计技术的核心。统计方法作为一种为决策提供依据的工具,可以帮助企业进行数据分析,了解产品质量状态的分布情况,找出问题、缺陷及原因,有针对性地采取措施,提高产品和服务的质量。有不少著名企业在市场分析、产品开发与设计、工艺设计、生产控制与营销策略方面应用统计技术,结果使得其产品成本下降,产品质量和市场占有率提高,公司经济效益显著提高。 二、统计学的应用 1、企业发展战略 发展策略是一个企业长远的发展方向。控制发展战略一方面需要及时的了解和把握整个宏观经济的状况及发展变化趋势,另一方面还要对企业进行合理的市场定位,把握企业自身的优势和劣势。所有这些都需要统计提供可靠的数据,利用统计方法进行科学的数据分析和预测。 2、产品质量管理 质量是企业的生命,是企业持续发展的基础。质量管理中离不开统计的应用。在一些知名的跨国公司, 6准则已经成为一种重要的管理理念。质量控制应经成为统计学在生产领域中的一项重要应用。各种统计质量控制图被广泛应用于监测生产过程。 3、市场研究 企业要在激烈的市场竞争中取得优势,首先必须了解市场,要了解市场就需要进行广泛的市场统计调查,取得所需信息,并对这些信息进行统计分析,以便作为生产和营销的依据。 4、财务分析 上市公司的财务数据是股民投资的重要参考依据。一些投资咨询公司主要是

根据上市公司提供的财务和统计数据进行分析,为股民提供参考。企业自身的投资也离不开对财务数据的分析,其中要用到大量的统计方法。 5、经济预测 企业要对未来市场状况进行预测。比如:对产品的市场潜力进行预测,及时调整生产计划。这就需要利用统计方法进行收集、整理和分析数据。 6、人力资源管理 利用统计方法对企业员工的年龄、性别、受教育程度、工资等进行分析,并作为企业制度工资计划、奖惩程度的依据。

生物统计学 (2)

生物统计学 名词解释: 1.生物统计学:是数理统计在生物学研究中的应用,它是应用数理统计的原理,运用 统计方法来认识、分析、推断和解释生命过程中的各种现象和试验调查资料的科学。 2.总体:具有相同性质或属性的个体所组成的集合称为总体,它是指研究对象的全 体; 3.个体:组成总体的基本单元称为个体; 4.样本:从总体中抽出若干个体所构成的集合称为样本; 5.样本容量:样本中所包含的个体数目称为样本容量。 6.集中性:资料中的观测值从某一数值为中心而分布的性质。 7.离散性:是变量有差离中心分散变异的性质。 8.变量(变数):指相同性质的事物间表现差异性或差异特征的数据。 9.常数:表示能代表事物特征和性质的数值,通常由变量计算而来,在一定过程中是 不变的。 10.参数:描述总体特征的数量称为参数,也称参量。常用希腊字母表示参数,例如用 μ表示总体平均数,用σ表示总体标准差; 11.统计数:描述样本特征的数量称为统计数,也称统计量。常用拉丁字母表示统计数, 例如用x表示样本平均数,用S表示样本标准差。 12.效应:通过施加试验处理,引起试验差异的作用称为效应。效应是一个相对量,而 非绝对量,表现为施加处理前后的差异。效应有正效应与负效应之分。 13.互作(连应):是指两个或两个以上处理因素间相互作用产生的效应。互作也有正效 应(协同作用)与负效应(拮抗作用)之分。 14.准确性:也叫准确度,指在调查或试验中某一试验指标或性状的观测值与其真值接 近的程度。 15.精确性:也叫精确度,指调查或试验中同一试验指标或性状的重复观测值彼此接近 的程度。 16.随机误差(抽样误差):这是由于试验中无法控制的内在和外在的偶然因素所造成。 随机误差越小,试验精确性越高。 17.系统误差(片面误差):这是由于试验条件控制不一致、测量仪器不准、试剂配制 不当、试验人员粗心大意使称量、观测、记载、抄录、计算中出现错误等人为因素而引起的。系统误差影响试验的准确性。只要以认真负责的态度和细心的工作作风是完全可以避免的。 18.试验误差:在试验过程中,由于试验条件及人为的一些因素而造成的试验结果与真 实值之间的偏差,来源于试验材料固有的差异和外界因素(管理措施、试验条件等)。 19.数量性状:是指能够以计数和测量或度量的方式表示其特征的性状。 20.质量性状:是指能观察到而不能直接测量的性状 21.次数资料:由质量性状量化得来的资料叫做次数资料。 22.试验:是对已有的或没有的事物加以处理的方法。 23.大数定律:是概率论中用来阐述大量随机现象平均结果稳定性的一系列定律的总称。 主要内容:样本容量越大,样本统计数与总体参数之差越小。 24.泊松分布:是一种可以用来描述和分析随机地发生在单位空间或时间里的稀有事件 的概率分布,也是一种离散型随机变量的分布。 25.假设检验:又称显著性检验,就是根据总体的理论分布和小概率原理,对未知或不完 全知道的总体提出两种彼此对立的假设,然后由样本的实际原理,经过一定的计算,

应用统计专业

应用统计专业 学制:四年 : 学位:理学学士 : 制订时间:年月 : 一、培养目标(培养目标是对该专业毕业生在毕业后年左右能够达到的职业和专 业成就的总体描述) 本专业是培养具有良好的数学素养,掌握统计学的基本理论和方法,能熟练地运用常用的统计软件分析数据,能在企业、事业单位和经济管理部门从事统计调查、统计信息管理、数量分析等开发、应用和管理工作,或在科研、教育部门从事研究和教案工作的专门人才。Ⅰ. ,,,. ,,,; . 二、毕业要求(毕业要求是对学生毕业时应该掌握的知识和能力的具体描述, 包括学生通过本专业学习所掌握的知识、技能和素养) 本专业学生在培养过程中,强调对学生统计基础理论的培养,在夯实统计基础理论的基础上,重视学生用统计理论分析和解决现实问题的能力,在实践教案中,促使学生养成独立工作和团队合作的能力,养成终身学习的习惯。 经过四年的系统学习,本专业学生在毕业时应达成以下毕业要求 . 理论基础:有扎实的数学基础理论和应用统计专业基础理论知识,其中包括重要的概念、定理、命题、推论、模型、估计方法和推断方法等。掌握基本的专业英语知识。 . 问题分析:能熟练应用数学和统计基础理论,探索分析实际问题,对该问题进行恰当的建模,并在此基础上,对相关数据进行统计分析,并能合理解释分析结果。 . 统计语言:在掌握数学和统计基础理论的基础上,能熟练掌握一门或多门相关的统计语言,例如或者,熟悉基本的语句,能进行简单的编程设计。 . 科学研究:能够用数学和统计基础理论来研究一些较复杂的科研问题,特别是来自行业且有深刻行业背景的科研问题。 . 大数据:在掌握数学基础理论、统计基础理论和一门或多门统计语言的基础上,能够选择与使用恰当的资源和现代信息技术工具,做一些大数据处理技术内核开发的工作。 . 个人和团队:能够在多学科背景下的团队中承担个体、团队成员以及负责人的角色。 . 终身学习:具有自主学习和终身学习的意识,有不断学习和适应发展的能力。 Ⅱ. , ' , , , , .

统计学实验实习指导书(新版)

10 Excel在统计学中的应用 10.1 用Excel搜集与整理数据 10.1.1 用Excel搜集数据 统计数据的收集是统计工作过程的基础性环节,方法有多种多样,其中以抽样调查最有代表性。在抽样调查中,为保证抽样的随机性,需要取得随机数字,所以我们在这里介绍一下如何用Excel生成随机数字并进行抽样的方法。需要提醒的是,在使用Excel进行实习前,电脑中的Excel需要完全安装,所以部分同学电脑中的office软件需要重新安装,否则实习无法正常进行。本书中例题全部用Excel2007完成。 使用Excel进行抽样,首先要对各个总体单位进行编号,编号可以按随机原则,也可以按有关标志或无关标志,具体可参见本书有关抽样的章节,编号后,将编号输入工作表。 【例10-1】我们假定统计总体有200个总体单位,总体单位的编号从1到200,输入工作表后如图10-1所示: 图10-1 总体各单位编号表 各总体单位的编号输入完成后,可按以下步骤进行操作: 第一步:选择数据分析选项(如果你使用的是Excel2003,单击工具菜单,若无数据分析选项,可在工具菜单下选择加载宏,在弹出的对话框中选择分析工具库,便可出现数据分

析选项;如果你使用的是Excel2007,点击左上角Office标志图标,Excel选项,加载项,在下面的管理下拉列表中选择“Excel加载项”,转到,勾选“分析工具库”,确定。),打开数据分析对话框,从中选择抽样。如图10-2所示。 图10-2数据分析对话框 第二步:单击抽样选项,确定后弹出抽样对话框。如图10-3: 图10-3 抽样对话框 第三步:在输入区域框中输入总体单位编号所在的单元格区域,在本例是$A$1:$J$20,系统将从A列开始抽取样本,然后按顺序抽取B列至J列。如果输入区域的第一行或第一列为标志项(横行标题或纵列标题),可单击标志复选框。 第四步:选择“随机模式”,样本数为10。 在抽样方法项下,有周期和随机两种抽样模式。 “周期”模式即所谓的等距抽样(或机械抽样),采用这种抽样方法,需将总体单位数除以要抽取的样本单位数,求得取样的周期间隔。如我们要在200个总体单位中抽取10个,则在“间隔”框中输入20;如果在200个总体单位中抽取24个,则在“间隔”框中输入8

统计学专业

统计学专业 专业简介 学科:理学 门类:统计学类 专业名称:统计学专业 本专业培养具有良好的教学或数学与经济学素养,掌握统计学的基本理论和方法,具有较好的科学素养,能熟练地运用计算机分析数据,能在企事业单位和经济、金融和管理部门从事统计调查、统计信息管理、数量分析、市场研究、质量控制以及高新技术产品开发、研究、应用和管理工作,或在科研教育部门从事研究和教学工作的高级专门人才。

专业信息 培养目标:本专业主要包括一般统计和经济统计两类专业方向,培养具有良好的数学或数学与经济学素养,掌握统计学的基本理论和方法,能熟练地运用计算机分析数据,能在企业、事业单位和经济、管理部门从事统计调查、统计信息管理、数量分析等开发、应用和管理工作,或在科研、教育部门从事研究和教学工作的高级专门人才。 培养要求:本专业学生主要学习统计学的基本理论和方法,打好数学基础,具有较好的科学素养,受到理论研究、应用技能和使用计算机的基本训练,具有数据处理和统计分析的基本能力,毕业生应获得以下几方面的知识和能力: ◆具有扎实的数学基础,受到比较严格的科学思维训练; ◆掌握统计学的基本理论、基本知识、基本方法和计算机操作技能;具有采集数据、设计调查问卷和处理调查数据的基本能力; ◆了解与社会经济统计、医药卫生统计、生物统计或工业统计等有关的自然科学、社会科学、工程技术某一领域的基本知识,具有应用统计学理论分析、解决该领域实际问题的初步能力; ◆了解统计学理论与方法的发展动态及其应用前景; ◆对于理学学士,应能熟练使用各种统计软件包,有较强的统计计算能力;对于经济学学士,应具有扎实的经济学基础,熟悉国家经济发展的方针、政策和统计法律、法规,具有利用信息资料进行综合分析和管理的能力; ◆掌握资料查询、文献检索及运用现代信息技术获取相关信息的基本方法;具有一定的科学研究和实际工作能力。 主干学科:数学、统计学、经济学、管理学。 主要课程:数学基础课(分析、代数、几何)、概率论、数理统计、运筹学、计算机基础、应用随机过程、实用回归分析、时间序列分析、多元统计分析、抽样调查、非参数统计、统计预测与决策、风险管理等,以及根据应用方向选择的基本课程(如经济统计方向可选择社会调查方法、经济与社会统计等)。 实践教学:包括学年论文、社会调查、生产实习和毕业论文等,一般安排10—20周。 修业年限:4年。 授予学位:理学或经济学学士学位。 相近专业:数学与应用数学、信息与计算科学。 原专业名:统计学、统计与概率(部分)。 就业数据

生物统计学简答题

1. 什么是生物统计学生物统计学的主要内容和作用是什么 生物统计学是用数理统计的原理和方法来分析和解释生物界各种现象和试验调查资料,是研究生命过程中以样本来推断总体的一门学科。 生物统计学主要包括试验设计和统计分析两大部分的内容。其基本作用表现在以下4个方面:1.提供整理和描述数据资料的科学方法,确定某些性状和特性的数量特征。2.判断试验结果的可靠性。3.提供由样本推断总体的方法。4.提供试验设计的一些重要原则。 2. 随即误差与系统误差有何区别随机误差也称为抽样误差或偶然误差,它是由于试验中许多无法控制的偶然因素所造成的试验结果与真实结果之间的误差,是不可避免的,随机误差可以通过试验设计和精心管理设法减小,而不能完全消除。 系统误差也称为片面误差,是由于试验处理以外的其他条件明显不一致所产生的带有倾向性或定向性的偏差。系统误差主要由一些相对固定的因素引起,在某种程度上是可控制的。 3. 准确性与精确性有何区别 准确性指在调查和实验中某一实验指标或性状的观测值和真实值接近程度。精确性指调查和实验中同一实验指标或性状的重复观察值彼此接近的程度。准确性是说明测定值和真实值之间符合程度的大小;精确性是反映多次测定值的变异程度。 4. 平均数与标准差在统计分析中有何用处他们各有哪些特性平均数的用处:

①平均数指出了一组数据的中心位置,标志着资料所代表性状的数量水平和质量水平;②作为样本或资料的代表数据与其他资料进行比较。平均数的特征:①离均差之和为零;②离均差平方和为最小。 标准差的用处:①标准差的大小,受实验后调查资料中的多个观测值的影响,如果观测值之间的差异大,离均差就越大;②在计算标准差是如果对观察值加上一个或减去一个a,标准差不变;如果给各观测值乘以或除以一个常数a,所得的标准差就扩大或缩小a倍;③在正态分布中,X+-S内的观测值个数占总个数的%,X-+2s内的观测值个数占总个数的%,x-+3s 内的观测值个数占总个数的%。标准差的特征:①表示变量分布的离散程度;②标准差的大小可以估计出变量的次数分布及各类观测值在总体中所占的比例;③估计平均数的标准差;④进行平均数区间估计和变异数的计算。 5. 什么是正态分布什么是标准正太分布正态分布曲线有什么特点μ和σ对正态分布曲线有何影响 正态分布是一种连续型随机变量的概率分布,它的分布特征是大多数变量围绕在平均数左右,由平均数到分布的两侧,变量数减小,即中间多,两头少,两侧对称。 U=0,σ2=1的正态分布为标准正态分布。 正态分布具有以下特点:标准正态分布具有以下特点:①、正态分布曲线是以平均数μ为峰值的曲线,当x=μ时,f(x)取最大值;②、正态分布是以μ

生物统计学考试题及答案

生物统计学考试题及答案

重庆西南大学 2012 至 2013 学年度第 2 期 生物统计学 试题(A ) 试题使用对象: 2011 级 专 业(本科) 命题人: 考试用时 120 分钟 答题方式采用: 一:判断题;(每小题1分,共10分 ) 1、正确无效假设的错误为统计假设测验的第一类错误。( ) 2、标准差为5,B 群体的标准差为12,B 群体的变异一定大于A 群体。( ) 3、一差异”是指仅允许处理不同,其它非处理因素都应保持不变。( ) 4、30位学生中有男生16位、女生14位,可推断该班男女生比例符合1∶1(已 知84.321,05.0=χ)。 ( ) 5、固定模型中所得的结论仅在于推断关于特定的处理,而随机模型中试验结论则将用于推断处理的总体。( ) 6、率百分数资料进行方差分析前,应该对资料数据作反正弦转换。( ) 7、比较前,应该先作F 测验。 ( ) 8、验中,测验统计假设H 00:μμ≥ ,对H A :μμ<0 时,显著水平为5%,则测验的αu 值为1.96( ) 9、行回归系数假设测验后,若接受H o :β=0,则表明X 、Y 两变数无相关关系。( ) 10、株高的平均数和标准差为30150±=±s y (厘米),果穗长的平均数和标准差为s y ±1030±=(厘米),可认为该玉米的株高性状比果穗性状变异大。 ( ) 二:选择题;(每小题2分,共10分 ) 1分别从总体方差为4和12的总体中抽取容量为4的样本,样本平均数分别为3和2,在95%置信度下总体平均数差数的置信区间为( )。

A 、[-9.32,11.32] B 、[-4.16,6.16] C 、[-1.58,3.58] D 、都不是 2、态分布不具有下列哪种特征( )。 A 、左右对称 B 、单峰分布 C 、中间高、两头低 D 、概率处处相等 3、一个单因素6个水平、3次重复的完全随机设计进行方差分析,若按最小显著差数法进行多重比较,比较所用的标准误及计算最小显著差数时查表的自由度分别为( )。 A 、 2MSe/6 , 3 B 、 MSe/6 , 3 C 、 2MSe/3 , 12 D 、 MSe/3 , 12 4、已知),N(~x 2σμ,则x 在区间]96.1,[σμ+-∞的概率为( )。 A 、0.025 B 、0.975 C 、0.95 D 、0.05 5、 方差分析时,进行数据转换的目的是( )。 A. 误差方差同质 B. 处理效应与环境效应线性可加 C. 误差方差具有正态性 D. A 、B 、C 都对 三、简答题;(每小题6分,共30分 ) 1、方差分析有哪些步骤? 2、统计假设是?统计假设分类及含义? 3、卡方检验主要用于哪些方面? 4、显著性检验的基本步骤? 5、平均数有哪些?各用于什么情况? 四、计算题;(共4题、50分) 1、进行大豆等位酶Aph 的电泳分析,193份野生大豆、223份栽培大豆等位基因型的次数列于下表。试分析大豆Aph 等位酶的等位基因型频率是否因物种而不同。( 99 .52 05.0,2=χ, 81 .7205.0,3=χ)(10分) 野生大豆和栽培大豆Aph 等位酶的等位基因型次数分布 物 种 等位基因型 1 2 3 野生大豆 29 68 96

Excel在统计学中的应用(doc 16页

Excel在统计学中的应用(doc 16页

《统计学》 实验指导书

学任务,由实验教师指导学生进行数据整理和数据分析。 ⒉适用专业 统计学实验适用的专业是经济和管理类各专业。 ⒊先修课程 概率与数理统计、统计学 ⒋实验课时分配 实验项目学时 实验一中文Excel的概述和基本操作1 实验二Excel在描述统 计学中的应用 2 实验三Excel在推断统 计学中的应用 2 实验四社会调查的数 据处理及调查报告的撰写 3 ⒌实验环境(对实验室、机房、服务器、打印机、投影机、网络设备等配置及数量要求) 本实验按自然班分组,每次实验指导教师指导一个实验小组,为此统计上机实验需设35个座位,实验台上配备Excel统计数据的实际案例,如教科书,教师搜集到的最新的经济管理类相关的统计数据、统计图、统计表并复印给每位学生,

教授学生Excel统计功能的幻灯片及实际操作的随堂作业;××统计调查报告的范本等等。 主要统计调查报告的制作流程图要悬挂在实验室墙壁上,便于学生参阅及按步骤有的放矢的完成调查报告,同时营造良好的实验环境。 ⒍实验总体要求 (1)通过统计学上机实验,进一步巩固课堂所学的理论知识。在实验中,要将理论课所讲的内容与实际操作进行对照,弄清模拟实验资料中全部经济数据的统计处理。 (2)进行操作,提高实际工作能力。在实验中,为学生配备了相关的经济管理类数据分析内容,比如:近几年的居民消费价格指数和分析预测内容,学生要按要求进行图表绘制并根据结果进行适当的定性分析,提高实际分析能力。 (3)通过实验,掌握统计学的基本常识,为进一步处理复杂经济现象形成的数据分析打下良好的基础。 进行统计实验时,一般应遵循下列要求:①动手操作之前,要弄清每个实验的目的和要求,并对教材的有关内容进行认真的复习,以便顺利完成各项实验。

生物统计学实验

渤海大学学生实验报告 课程名称:生物统计学实验任课教师:何余堂 实验室名称:计算机室房间号:理工Ⅱ--205 实验时间:2012-6-14 学院化学化工与食品安全学院专业食品质量与安 全 班级10-10 姓名宋帅婷学号10150142同组人其余19人 实验项目统计数据的整理及次数分布 表/图的制作 组 别第二组 实验成绩 一、实验目的 1、掌握Excel数据输入、输出与编辑方法; 2、掌握Excel用于描述性统计的基本菜单操作及命令; 3、掌握数据整理的基本方法; 4、熟练制作次数分布表/图。 二、实验原理 当观测值较多(n>30)时,宜将观测值分成若干组,以便统计分析。将观测值分组后,制成次数分布表,即可看到资料的集中和变异情况。 连续性资料的整理,需要先确定全距、组数、组距、组中值及组限,然后将全部观测值计数归组。分组结束后,将资料中的每一观测值逐一归组,统计每组内所包含的观测值个数,制作次数分布表。利用Excel的数据统计工具可以辅助完成上述工作。 三、实验步骤 1、加载分析工具库 单击Excel程序“工具”菜单中的“数据分析”命令可以浏览已有的分析工具。如果在“工具”菜单上没有“数据分析”命令,应在“工具”菜单上运行“加载宏”命令,在“加载宏”对话框中选择“分析工具库”。 2、练习 某地80例30~40岁健康男子血清总胆固醇(mol/L)测定结果如下: 4.77 4.56 5.18 4.38 4.03 5.16 4.88 4.52 4.47 5.38 3.37 4.37 5.77 4.89 5.85 5.10 5.55 4.38 3.40 3.89 6.14 5.39 4.79 4.09 5.85 3.04 4.31 3.91 4.60 3.95 6.30 5.12 5.32 3.35 4.79 4.55 4.58 2.70 4.47 3.56 4.77 4.56 5.18 4.38 4.03 5.16 4.88 4.52 4.47 5.38 3.37 4.37 5.77 4.89 5.85 5.10 5.55 4.38 3.40 3.89 6.14 5.39 4.79 4.09 5.85 3.04 4.31 3.91 4.60 3.95 6.30 5.12 5.32 3.35 4.79 4.55 4.58 2.70 4.47 3.56 5.21

专业硕士之应用统计硕士

【应用统计硕士】 来源:万学海文考研 专业硕士设置方案 一、为适应我国现代统计事业发展对应用统计专门人才的迫切需要,完善应用 统计人才培养体系,创新应用统计人才培养模式,提高应用统计人才培养质量,特设置应用统计硕士专业学位。 二、应用统计硕士专业学位的英文名称为“Master of Applied Statistics”,英文缩 写M.A.S.。 三、应用统计硕士专业学位的培养目标是:培养具备良好的政治思想素质和职业道 德素养,具有良好的统计学背景,系统掌握数据采集、处理、分析和开发的知识与技能,具备熟练应用计算机处理和分析数据的能力,能够在国家机关、党群团体、企事业单位、社会组织及科研教学部门从事统计调查咨询、数据分析、决策支持和信息管理的高层次、应用型应用统计专门人才。 四、应用统计硕士课程设置要充分反映应用统计实践领域对专门人才的知识与素质 要求,突出统计实际操作能力的训练,注重分析能力和创造性解决实际问题能力的培养。教学方法要重视运用团队学习、案例分析、现场研究、专业实习等方法。 五、应用统计硕士培养过程须突出应用统计实践导向,加强实践教学,实践教学时 间不少于半年。 六、应用统计硕士专任教师须具有较强的专业实践能力和教育教学水平。重视吸收 来自应用统计实践领域的专业人员承担专业课程教学,构建“双师型”的师资结构。 七、学位论文须与应用统计实际问题、实际数据和实际案例紧密结合,体现学生运

全国硕士研究生入学统一考试应用统计硕士专业学位《统计学》考试是为高等院校和科研院所招收应用统计硕士生儿设置的具有选拔性质的考试科目。其目的是科学、公平、有效地测试考生是否具备攻读应用统计专业硕士所必须的基本素质、一般能力和培养潜能,以利用选拔具有发展潜力的优秀人才入学,为国家的经济建设培养具有良好职业道德、法制观念和国际视野、具有较强分析与解决实际问题能力的高层次、应用型、复合型的统计专业人才。考试要求是测试考生掌握数据处收集、处理和分析的一些基本统计方法。 具体来说。要求考生: 1.掌握数据收集和处理的基本分方法。 2.掌握数据分析的金发原理和方法。 3.掌握了基本的概率论知识。 4.具有运用统计方法分析数据和解释数据的基本能力。 II 考试形式和试卷结构 一、试卷满分及考试时间 试卷满分为100分,考试时间150分钟。 二、答题方式 答题方式为闭卷、笔试。允许使用计算器(仅仅具备四则运算和开方运算功能的计算器),但不得使用带有公式和文本存储功能的计算器。 三、试卷内容与题型结构 统计学80分,有以下三种题型: 单项选择题25题,每小题1分,共25分 简答题3题,每小题5分,共15分

统计与统计分析实验指导书

统计与统计分析A2实验指导书 【试验目的】 通过实验教学,使学生验证并加深理解和巩固课堂教学内容,掌握常用统计分析方法在Excel和SPSS中的实现,更好的理解和掌握统计分析方法的应用原理、基本条件、实现步骤、结果的内涵等问题。通过实验,使学生能够结合具体任务和条件对社会经济问题进行初步的调查研究,结合自己的专业,在定性分析基础上做好定量分析,提高学生的科研能力和解决实际问题的能力,以适应社会主义市场经济中各类问题的实证研究、科学决策和经济管理的需要。 【试验内容】 Excel和SPSS中的统计分析功能,包括: 1、数据的整理与显示,包括数据的排序与筛选、数据透视表与分类汇总、制作频数分布表和绘制各种统计图。计算描述统计量,选择适合的描述统计量反映统计数据的集中和离中趋势。 2、SPSS的参数检验,包括单样本的T检验,两独立样本的T检验及配对样本的T检验。 3、SPSS的方差分析。 4、相关与回归分析,包括Excel及SPSS中相关系数的计算、一元线性回归的基本方法、同时了解各种检验指标的给出、残差图、线性拟合图的制作等问题。【实验要求】 1、按学校要求的试验报告格式打印。 2、用WORD文档输出,宋体,5号。 实验一SPSS统计数据整理与分析 一、实验目的:根据统计调查目的,应用SPSS11.0软件或12.0,生成SPSS文件,并学会运用SPSS11。0软件,对数据进行整理及分析。 二、操作平台:SPSS11.0或12.0 三、统计分析内容: 1、搜集信管091-092班一门课的成绩(每位同学收集的课程尽量不一样),但需包括所有同学,分析两个班成绩的差异,并给出有建设性的意见。(可用excel也可以用spss进行分析) 2、振兴大学是一所综合性大学,有三个附属学院,分别是商贸学院、生物学院和医学院。近期高校管理层为了了解社会对本校学生的满意程度,以此促进本校教学改革,其中进行了一项对本校的毕业生调查,随机抽取了48名毕业生组成样本,要求他们所在的工作单位对其工作表现、专业水平和外语水平三个方面的表现进行评分,评分由0到10,分值越大表明

2018北大应用统计专业课145高分经验最全必看

2018北大应用统计专业课145高分经验最全必看 还是先介绍一下自己的情况:初试379,嗯…差一分,专业课145分也救不了我政治50…最后调剂到某985大学的应统专业,我本科是某985数院统计专业(嗯嗯…要比我调剂的学校好)接下来讲一些我专业课复习的经验,勿喷啊,只是自己复习的方法自己的一些想法,哈哈哈 之前看的一些经验帖好多都是推荐的茆诗松的概率论和统计,我是那种跟风的人…没错我也买了,第二版第三版都有,然而我只是翻了一元回归部分就放在那里了,这本书推荐给那些基础不太好的同学吧,我是觉得我想要的一些内容这本书没有,而且习题很多…就放置一边了。我是7月初开始复习的,先扫了一遍官网推荐的汪仁官的概率论,这本书很老了,网上卖的也很贵,我是在图书管借来复印的。这本书我没有做习题,之前就听过这本和李贤平的概率论基础差不多,所以我快速看一遍之后就开始看李贤平这本了。李贤平这本分布函数讲的是左连续,所以关于分布函数我是看的汪的那本。本科老师太坑极限定理这章没怎么讲,自己也没好好学,结果今年考了一道中心极限定理的题,自己做的不是很好…我调剂复试笔试考的试卷是和学硕一张卷子的,当时复习的时候才觉得这个很重要,推荐看一下汪的次序统计量和李的关于中心极限定理的习题,是靠后的几题,不要像我这一章只做了前几题…概率论的题我是只做了李这一本,这一本的题已经足够了,大概每章40-60题吧,挺经典的,至少要做两遍吧,我是觉得一遍我是记不住,后期可以把一些难题记在笔记上,简单的题就可以划去不看了。 统计我先看了陈家鼎的,这本书写的是挺难的…怎么说呢,觉得…没有先介绍一些基础知识吧。这本书我看了不低于两遍,课后习题也做了几遍,对于一些难的题真的没必要一定做出来,我开始就是…嗯我一定要做出来!后来问了北大清华统计直博的大神,他们也做不出来,所以考这种题的几率是很小的(不是说难题不能做,那种根本没思路,没可能考的题就不需要浪费时间了)我之后统计侧重于王兆军、邹长亮的数理统计教程,这本开始会讲一些基础内容,有一些铺垫。我是觉得UMVUE、N-P引理、UMPT、UMPUT很重要的,我记得我男票给我说北大本科好像没讲UMVUE,但是不管考不考我就是想看啊!万一考了我不就赚了!其实看这两本书有一个麻烦的事就是假设检验部分两本讲得是不太一样的,王的那本是分了显著性检验和最大功效检验,当时我男票在学高统,他建议我看王的那本。对于习题我是陈那本会做的都做了,然后王的那本是挑一些题做的,王的题很难,不要想着都做。我觉得统计是要好好做笔记的,在你复习一遍两遍之后,脑子里有了大概的框架了,结合看的几本书,分知识点整理笔记,一些好的例题难题都可以附在知识点后面。 我回归看了王松桂的线性统计模型-线性回归与方差分析,这本书讲得是多元的,很多内容不会考的,我是看了最小二乘、约束最小二乘、假设检验与预测、单因素两因素方差分析,逐步回归主要是了解一下思想,一元的我是看了茆诗松还有陈家鼎的,做了相应的课后题。 我是一个觉得笔记很重要的人,对于专业课我觉得是一定要做笔记,而且是自己做笔记不是看别人的笔记,可以参考别人的笔记但知识最后一定要是自己的! 啰啰嗦嗦说那么多感觉自己也没讲很多有用的,最后一点,书要读透!专

《统计学》实验指导书(3学分)

《统计学》实验指导书(3学分) 实验项目一:问卷数据的预处理 实验目的: 1. 掌握问卷在Excel中的录入方式; 2. 熟悉问卷数据的预处理。 实验要求和步骤: 一、学习问卷单选题、多选题以及开放题在Excel中的录入方法 1、单选题: 直接输入选择项A、B、C、D…等,或直接用1、2、3、4…数字表示选项,选中哪一项即在相应空格填上相应的字母或数字。 例:您的性别是(): 1 男 2 女 其中:Q1、Q2…表示问卷的问题编号,第一列的1、2、3…表示不同的问卷。 2、多选题: 每个选项占一列,被选中记为1,未被选中记为0,若存在需要填写的文字则在相 应位置填写相应文字。 例:3、您光临本地的目的是() A商务会议单独一列,选中填1,没有选中填0 B学术研讨同上 C团体旅游同上 D婚礼宴席同上 E亲朋好友相聚同上 F其他_______ 单独一列,没有选中填0,选中直接将填写内容录入相应表格 若某人选择了DE,则录入情况如下: Q3A Q3B Q3C Q3D Q3E Q3F 0 0 0 1 1 0 若某人选择了F,并填写内容为“工作调动”,则录入情况如下: Q3A Q3B Q3C Q3D Q3E Q3F 0 0 0 0 0 工作调动

其中:Q3表示问卷的问题编号,A、B…等表示该题的选项,如Q3C则表示“团体旅游” 3、开放题: 例:10、请谈一下您对本地的印象__________ 答案录入:在Q10 下方填写相应答案文字即可。 如:Q10 民风淳朴 二、学习对问卷数据进行检查 1、形式层面:录入的过程中及时进行数据有效性检查以防止问卷回答的非法值的出现例:您的性别是(): 1 男 2 女(Excel性别一列录入的答案只可能为1或2)选中B2单元格,点击数据→数据的有效性,如下图: 在数据有效性的对话框中的“允许”菜单中选择“序列”,“来源”中输入“1,2”(以逗号隔开。 ※“输入信息”选项中可以输入相关信息 ※“出错警告”中可以根据需要选择相应选项,“警告”中还可以输入文字提示

相关文档
最新文档