2014统计学复习参考资料
【统计学复习提纲】.

2013-2014学年度第二学期《统计学》复习提纲第一章:绪论1、统计的含义和特点一、统计的含义:统计最基本的含义是人们对客观事物的数量表现、数量关系和数量变化进行描述和分析的一种计量活动。
在不同的场合,统计一词有统计工作、统计资料、统计科学三种含义。
二、统计的研究对象:统计的研究对象是统计工作的规律,即搜集、整理和分析统计数据的方法,是一门方法论科学。
(P11)三、统计的特点(P4):(1)数量性(最基本特点)(2)具体性(3)综合性(或总体性)。
2、统计学的基本概念:总体、总体单位、总体的特征,总体的分类。
标志、变异与变量,连续型变量与离散型变量联系和区别,指标与标志一、总体:总体是在某种共性的基础上由许多个别事物结合起来的整体。
总体单位:构成总体的个别事物。
(P13)他们不是一成不变的,在一定的条件下可以相互转化。
确定总体是为了确定调查研究的对象和范围,确定总体单位是为确定调查登记项目的承担者。
二、总体的特征(P13):(1)同质性;(2)大量性;(3)差异性。
三、总体的分类(P13):(1)有限总体;(2)无限总体。
四、标志:指说明总体单位特征的名称,由标志名称+标志值构成。
标志的分类(P15):(1)品质标志、数量标志;(2)不变标志、可变标志(包括变异和变量)。
五、变量:变量就是可变的数量标志。
(P15)变异:总体单位之间的这些品质和数量上的差异,即可变标志在总体各单位之间变现出来的差异。
变量和统计数据分类有对应关系。
六、连续型变量与离散型变量数值变量可分为离散变量与连续变量。
凡是变量值只能以整数出现的变量就叫离散变量,变量值可以无限分割的变量就是连续变量。
七、指标:是说明总体数量特征的概念。
由指标名称+指标值组成。
标志和指标的区别和联系(1)区别:①指标说明总体的特征;而标志说明总体单位的特征②指标只反映总体的数量特征;标志既可以反映总体单位的数量特征,也可以反映总体单位的品质特征(2)联系:指标的数值是由总体各单位的数量标志的标志值汇总而得到的八、指标体系以共同的研究目的为纽带而相互联系的一系列统计指标成为指标体系。
统计学综合复习资料

《统计学》综合复习资料一、单项选择题1. 在调查居民对某企业产品的看法时,居民年龄、性别( C )。
A. 都是数量标志 B. 都是品质标志C. 前者是数量标志,后者是品质标志D. 前者是品质标志,后者是数量标志2. 将调查对象划分为若干类,然后从每一类中随机抽取若干单位进行观察,这称为( C )。
A. 等距抽样 B. 整群抽样 C. 分层抽样 D. 简单随机抽样 3.一个统计总体( D )A .只能有一个标志B .只能有一个指标C .可以有多个标志D .可以有多个指标 4.统计调查按其组织形式分类,可分为( C )A .普查和典型调查B .重点调查和抽样调查C .统计报表和专门调查D .经常性调查和一次性调查 5.属于时期指标的有( B )。
A .商品库存量B .出生人数C .月末职工人数D .土地面积6.凡是变量的连乘积等于总比率或总速度的现象,计算其平均比率或平均速度应采用( C ) A .算术平均法 B .调和平均法 C .几何平均法 D .中位数法7.若两变量之间线性相关程度是低的,则计算的相关系数应接近于( B )。
A.1B.0C.0.5D.-18. 单项式变量数列与组距式变量数列都不可缺少的基本要素是( C )。
A. 组数和组距B. 组限和组中值C. 变量和次数D. 变量和组限 9. 组距数列中上限与下限之差称为( B )。
A. 全距B. 组距C. 组数D. 极限10. 两个性质不同的指标相对比而形成的相对指标是( D )。
A. 比较相对指标B. 结构相对指标C. 比例相对指标D. 强度相对指标11. 按最小平方法估计的回归方程Yˆ= X b a ˆˆ+,b a ˆ,ˆ的实际意义是使( D )。
A.)ˆ(1i i ni Y Y -∑==0 B.)ˆ(1iini X X-∑==0C.21)ˆ(ii ni X X -∑=最小 D.21)ˆ(iini Y Y-∑=最小12.动态数列中的发展水平是以时间单位为年的指标值,则该数列不体现( B )。
2014统计整理 基础知识

基础知识心理与教育统计的含义:在心理与教育研究中,通过调查、实验、测量等手段有意获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。
(统计学分为:描述统计、推断统计、实验设计)。
变量与常量:变量是实验、观察、调查中想要获得的数据,即为一个可以取不同数值的物体的属性或事件,其数值具有不确定性,因而称为变量。
在心理学研究中,像社会支持度、个人自控力等都能成为研究的变量。
一旦确定某个值,就称这个值为某一变量的观测值,也就是具体数据。
常量是不变的数据。
测量量尺(数据类型):对变量的测量方式1.称名量尺:只说明某一事物与其他事物属性上的不同或类别上的差异。
例如在电脑上录入数据时,:在性别上将男性名为1,女性名为2;在颜色分类上用1代表黄,2代表蓝,3代表绿等。
这些数码代表什么,这都是我们随意命名的,对这些数字做运算是没有意义的。
他们只是一些事物的代号,方便电脑记录、识别而已。
2.顺序∕等级量尺:按事物某种属性的多少或大小,按次序将各个事物加以排列后获得的数据资料。
例如教练根据能力不同,对体操队中运动员进行排名。
这些数字不是随意赋予的,排名第2的运动员就比第4的能力强,而第3的运动员就处于这二者之间,但不能说排名第3 的运动员的能力正好在第2和第4之间平均的中点。
再如评估焦虑水平,在每个症状上用1表示“从不”,2表示“有时”,3 表示“经常”。
这类数据只能排出一个顺序,不能指出互相间的差别的具体大小,这类数据不能进行加减乘除。
3.等距量尺:有相等单位,但无绝对零点的数据,如温度、各种能力分数、智商等。
例如一次能力测验中,学生A得了80分,B得了75分,C得70分。
比较这三个学生的能力时,可以说A分数高于B,B高于C,而且可以说学生A与B的分数差等于学生B与C的分数差。
但由于这类数据不是从绝对零点算起的,所以不能认为在该能力测验中得分为零的学生,他的这方面能力就是零。
2014年统计基础知识与统计实务

2014-8-22
12
三、指标与标志
(一)指标,是说明总体数量特征的概念,还可以 是反映总体现象数量特征的概念及其具体数值。
例如:进行全国人口普查活动,全国人口 总数是一个指标。或者,全国人口总数为 13.7054亿人也是一指标 注意:指标都是能用数值来表示的
2014-8-22 13
(二)标志
标志,是说明个体特征的名称。 2、标志表现 ——每个个体在标志名称之后所表明 的属性或数值--标志值。
一、总体与个体 二、样本与样本单位 三、指标与标志 四、变异与变量
2014-8-22
7
一、总体与个体
(一)总体,也称统计总体,是指 客观存在的,在某种共性基础上由许多 个别事物结合起来的整体。 各个事物在某一方面的共同性(又 称“同质性”),是形成统计总体的一 个必要条件,也是统计总体的一个重要 特征。
个体构成的,但总体和个体的概念不是固 定不变的, 随着研究目的不同,总体和个 体也会有所不同。
2014-8-22
10
例如:
1、研究目的:调查所有国有企业国有资产 的使用情况
总体:所有国有企业 个体:每一个国有企业
2、研究目的:调查某国有企业内部各部门 国有资产的使用情况
总体:某国有企业 个体:某国有企业内部的每个部门
18
2014-8-22
(二)变量(variable)
1. 定义: ——可变的数量标志。或者数量变异标志。 2.变量值 ——变量的具体表现或取值,即数量变异标志表 现的具体数值。 3.变量的分类: 连续变量:身高、体重、产值等。需要测算或计算。 离散变量:企业数目、职工人数等。需要计数。 注意:“年龄”作为特殊的连续变量,通常只取整数。
2014初级统计师 部分复习资料

统计专业知识与实务第一章综述一、统计的基本任务和方法统计:各级政府部门取得国民经济和社会发展状况的信息资料的主要手段统计的基本任务:统计调查、统计分析,提供统计资料和统计咨询意见,实行统计监督统计资料具体表现形式:1.统计表2.统计报告3.电讯、磁介质4.出版物三大职能:信息、咨询、监督统计基本方法:1、普查:经济(5年一次,尾数3和8的年份,12月31日)农业(10年一次,尾数6,12月31日24时)人口(10年一次,尾数0,11月1日0时)2、抽样调查:农业方面,城市住户与价格统计,工业,贸易(批发零售、餐饮)3、其他非全面调查重点调查:不定期的一次性调查,有时用于经常性的连续性调查典型调查二、统计调查制度及其管理统计调查项目分类:国家、部门、地方统计调查表:表号、制定机关、批准或备案文号、有效期限第二章统计调查设计一、设计应注意问题和原则确定需求→→确定内容→→确定方法→→定期对调查项目审查二、统计分类标准统计单位划分:法人单位、产业活动单位、个体经营户全国组织机构代码编制单位代码:八位无属性数字和一位校验码区划代码:国家质量监督检验检疫总局发布《中华人民共和国行政区划代码》6+3+3位,县及县以上+街道、镇乡+居民委员会和村民委员会《国民经济行业分类》:法人单位作为划分行业的基本单位20门类、96大类、432中类、1094小类工业:①采矿业②制造业③电力、热力、燃气及水生产和供应业三次产业划分:1.农林牧渔业(不包含其服务业)2.采矿业(不含开采辅助活动),制造业(不含金属制品、机械和设备修理业),电力、热力、燃气及水生产和供应业,建筑业3.除第一、二产业以外的其他行业全部企业划分:3大类,18中类大中小微型企业划分:从业人员、营业收入、资产总额等大型工业企业(营业收入40000万以上,从业人员1000以上)调查表:综合表和基层表第三章国民经济行统计一、农业1.农业:农作物种植业2.林业:造林、育林、护林、森林采伐和更新、木材和其他林产品采集加工3.畜牧业4.渔业:水产品捕捞业、水产品养殖业5.农林牧渔服务业(三次产业)农户:一年以上居住在乡镇(不含城关镇)行政管理区域类住户,还包含长期居住在城关镇所辖行政村范围类的住户。
统计学(李荣平)2014-5

P{t>tα(n)}= h(t;n)dt
t (n)
的数tα(n)为t(n)分布的上α分为点。 例:查表求:t0.05(8), t0.95(8)
o
t (n)
第一节 抽样分布
(三)F 分布
设 U ~ 2(n1 ),V ~ 2(n2 ), 且设 U,V 独立,则称随机变量
F U / n1 V / n2
保证质量,规定σ≤0.6mm时,认为生产过程处于良好控制
状态。为此,每隔一定时间抽取20个零件作为一个样本,并
计算样本方差S2。若P{S2≥c } ≤0.01(此时σ=0.6mm),
则认为生产过程失去控制,必须停产检查,问:
(1)C为何值时,S2≥c的概率才小于或等于0.01? (2)若取得的一个样本的标准差S=0.84,生产过程是
第五章 抽样分布与参数估计
主
第一节 抽样分布
要 内
第二节 参数点估计
容
第三节 区间估计
第一节 抽样分布
一、随机样本
总体与个体:试验全部可能的观测值叫总体;试验的 每一个观测值叫个体。
样本容量与样本个数:样本中包含的单位数叫样本容 量;从一个总体中可能抽取多少个样本叫样本个数。
总体容量:总体中所包含的个体数。 有限总体和无限总体:总体容量可数的称有限总体, 不可数的称无限总体。 重置抽样(重复抽样)和无重置抽样(不重复抽样)
X
1 n
n i 1
Xi
为样本均值;称统计量
S 2
1 n1
n i1
(Xi
X )2
为 样本方差 ,称统计量 S
S2
1n
( X X ) 2 为样本标准差 ;统计量
n 1 i1 i
2014秋统计学习题及答案(1)解析

第一章绪论习题及参考答案一、简答题:1、“统计”一词的含义有哪几种?各种含义之间有何关系?2、统计工作过程有哪些?二、单项选择题1、某公司要调查了解本地区居民家庭的消费支出情况,这项研究的总体是()。
A.本地区居民家庭消费支出情况B.本地区所有居民家庭C.某一居民家庭的消费支出情况D.本地某一居民家庭2、在研究我国工业企业的经济效益情况时,总体单位是()。
A.我国每一家工业企业B.我国所有工业企业C.我国工业企业总数D.我国工业企业的利润总额3、某研究部门准备在全市80万个家庭中抽取100个家庭,据此推断该城市所有职工家庭的年人均收入,这项研究的统计量是()。
A.100个家庭B.80万个家庭C.100个家庭的人均收入D.80万个家庭的人均收入4、统计研究的基本特点是()。
A.从数量上认识个体的特征和规律B.从数量上认识总体的特征和规律C.从性质上认识个体的特征和规律D.从性质上认识总体的特征和规律5、一项调查表明,在所抽取的1 000个消费者中,他们每月在网上购物的平均消费是200元,他们选择在网上购物的主要原因是“价格便宜”。
这里的参数是()。
A.1 000个消费者B.所有在网上购物的消费者C.所有在网上购物的消费者的平均消费额D.1000个消费者的平均消费额6、统计认识过程是()。
A.从质到量B.从量到质C.从质到量,再到质和量的结合D.从总体到个体7、构成统计总体的基础和前提是()。
A.综合性B.同质性C.大量性D.变异性8、一个统计总体()。
A.只能有一个标志B.只能有一个指标C.可以有多个标志D.可以有多个指标9、变量是变异的()。
A.品质标志B.数量标志C.标志和指标D.质量指标10、最近互联网上的一份报告称,“由200辆新车组成的一个样本表明,外国新车的价格明显高于本国生产的新车”。
这一结论属于()。
A.对样本的描述B.对样本的推断C.对总体的描述D.对总体的推断三、多项选择题:1、在第六次全国人中普查中,()A.全国人口数是统计总体B.总体单位是每一个人C.全部男性人口数是统计指标D.人口的性别比是品质标志E.人的年龄是变量2、总体、总体单位、标志、指标之间的相互关系表现为()A.没有总体单位也就没有总体,总体单位不能离开总体而存在B.总体单位是标志的承担者C.统计指标的数值来源于标志D.指标是说明总体特征的,标志是说明总体单位特征的E.指标和标志都能用数值表示3、某家庭的三位成员的某月工资额分别为1500元,1800元和3000元,这里()A.有三个变量B.只有一个变量C.有三个变量值D.有一个变量值E.既有变量、也有变量值四、案例分析题:1、某地区统计部门提供一份统计报告显示:“该地区某年末有商业零售企业5000个,就业人数60万人,该年实现销售利润300亿元,人均实现销售额5万元。
2014年应用统计学期考复习资料-答案

一、填空题1、为了估计全国高中学生的平均身高,从20个城市选取了100所中学进行调查。
在该项研究中,样本是(100所中学的高中学生)。
2、某连续变量数列,其首组为开口组,上限为80,又知其邻组的组中值为95,则首组的组中值为( 65 )。
3、某班7位学生英语成绩分别为88,85,85,91,88,93,88分,则英语成绩的众数、中位数分别为( 88,88)。
4、对连续大量生产的某种小件产品进行质量检验,最恰当的调查方式是(抽样调查)。
5、按连续变量分为4组,各组为55-65,65-75,75-85,85以上,则数据65、85分别在( 2,4 )组。
6、评价估计量优劣的标准有无偏性、(一致性或相合性、有效性)。
7、根据季节时间数列资料计算的各季节比率之和应等于(4)。
8、已知一个总体均值95%的置信区间为(122,130),如果样本均值和标准差分别为126和16.07,则研究时应抽取的样本容量为( 64)。
9、有两个变量数列,甲数列均值为100,标准差为12.8,乙数列均值为14.5, 标准差为3.7,比较两数列均值的代表性,结果是(甲好于乙)。
10、已知总体标志值的平均数为13,各标志值平方和的平均数为174,则标准差系数为( 17.2 )。
11、用水平法求平均发展速度本质上是求(序时)平均数。
12、某企业某年各月月末库存额资料如下(单位:万元):48,44,36,32,30,40,36,34,42,46,50,56;又知上年年末库存额为52。
则全年平均库存额为( 41 )。
14、构成时间数列的两个基本要素是(所属时间、指标数值)。
15、在假设检验中,如果检验统计量的P值大于给定的显著性水平α,则在做决策时,需要在显著性水平α的情况下,(不能拒绝)原假设。
16、一组数据的最大值是85,最小值是33,中位数是55,众数是42,则该组数据的极差是( 52 )。
17、样本统计量的概率分布称为(抽样分布)。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2014统计学复习参考题复习要求:1、全面复习,认真阅读和熟悉教材内容;2、把握基本理论和方法,定性与定量结合。
3、结合作业复习。
特别提醒:考试请带计算器。
第一章导论1、统计学的含义?数据分析方法的分类?2、统计数据的分类及其各自的特点?3、统计中的基本概念?第二章统计数据的收集1、概率抽样与非概率抽样的含义、区别与特点?2、2、概率抽样与非概率抽样的类型?3、简述典型调查与抽样调查的比较?4、抽样误差的含义及其影响因素?5、非抽样误差的类型?6、误差的控制?第三章统计数据的整理与显示1、数据预处理的内容?2、品质型数据的整理与图示各有哪些?3、数值型数据的整理与图示各有哪些?4、展示数据的两种主要方式?5、数据分组、频数分布表与直方图的制作?第四章数据的概括性度量1、数据分布特征的测度?2、简述众数、中位数和平均数的特点与应用场合?3、简述异众比率、四分位差、方差和标准差的应用场合?4、众数、中位数、平均数和方差、标准差、离散系数的计算?第五章统计指数(教材第14章)1、指数及其分类?2、总指数的分类与编制方法?加权综合指数与加权平均指数的区别、联系与计算?3、什么是同度量因素?它有什么作用?4、指数体系与两因素分析?总量指数体系分析与平均数变动因素分解?第六章统计量及其抽样分布(并参考教材第五章)1、参数与统计量?抽样分布与长用的几个重要分布?2、总体分布与抽样分布的关系3、一般正态分布与标准总体分布的转换与总体分布表的使用?4、样本均值与样本比例的抽样分布特征及相关计算?5、两个样本平均值之差的分布特征与相关计算?第七章参数估计?1、参数估计及方法?点估计和区间估计的区别?2、简述样本量与置信水平、总体方差、估计误差的关系?3、评价一个估计量好坏的标准有哪些?4、一个总体的参数的区间估计及所使用的分布?区间估计的计算?5、估计总体平均值与总体比例时的样本量的计算?6、影响抽样误差大小的因素?第八章假设检验1、参数估计与假设检验的的比较?2、假设的表达式、流程与两类错误?3、检验统计量的确定?4、总体平均值的检验与计算?5、总体比例的检验与计算?6、总体方差的检验与计算?7、检验结果的解释与单侧检验中假设的建立?第九章一元线性回归(教材第11章)1、什么是相关分析与回归分析?相关分析与回归分析的联系与区别?2、相关系数的含义与计算?2、一元线性回归模型与参数估计?判定系数与估计标准误差的计算?方程的显著性检验?3、利用回归方程进行预测的步骤与计算?第十章时间序列分析与预测(教材:第13章)1、时间序列及其构成?2、增长率分析与计算?3、时间序列预测的程序?4、线性趋势预测?5、季节指数预测方法与计算?第十一章方差分析(教材:第10章)1、方差分析及有关术语?2、方差分析的基本思想和原理?3、方差分析的基本步骤?4、单因素方差分析?简答题供参考:1、统计数据分为哪几种类型?各有什么特点?答:1、分类数据。
将数字作为现象总体中不同类别或不同组别的代码,这是最低层次的尺度。
在这种情况下,不同的数字仅表示不同类(组)别的品质差别,而不表示它们之间量的顺序或量的大小。
2、顺序尺度不但可以用数表示量的不同类(组)别,而且也反映量的大小顺序关系,从而可以列出各单位、各类(组)的次序。
以上两类数据说明的是事物的品质特征,不能用数据表示,其结果均表现为类别,也称为定性数据或品质数据(Oualitative data );3、数值型数据。
说明的是现象的数量特征,能够用数值来表现,因此也称为定量数据(Quantitative data )。
可进行加、减、乘、除运算。
适用于低层次测量数据的统计方法,也适用于较高层次的测量数据,因为后者具有前者的数学特性。
适用于高层次测量数据的统计方法,则不能用于较低层次的测量数据2、概率抽样与非概率抽样的含义与特点?答:非概率抽样就是调查者根据自己的方便或主观判断抽取样本的方法。
由于非概率抽样不是依据随机原则抽选样本,样本统计量的分布是不确切的,因而无法使用样本的结果对总体相应的参数进行推断。
如果调查的目标是用样本的调查结果对总体的相应参数进行评估,并计算估计的误差,得到的总体参数的置信区间,这时就不适合采用非概率抽样。
非概率抽样的特点是操作简单、时效快、成本低,而且对于抽样中的统计专业技术要求不高。
非概率抽样适合探索性的研究,调查的结果用于发现问题,为更深入的数据分析提供准备。
概率抽样是依据随机原则抽选样本,这时样本统计量的理论分布是存在的,因此可以根据调查的结果对总体的有关参数进行估计,计算估计误差,得到总体参数的置信区间,并且在进行抽样设计时,对估计的精度提出要求,计算为满足特定精度要求所需要的样本量。
所以,如果调查的目的在于掌握研究对象总体的数量特征,得到总体参数的置信区间,就应当使用使用概率抽样的方法。
当然,概率抽样的技术含量更高,无论是抽样样本还是对调查数据进行的分析,都要求有较高的统计学专业知识,调查的成本也比非概率抽样的调查成本高。
概率抽样这一方法是根据一个已知的概率选取被调查者,无须调查人员在选样中判断或抽选。
从理论上讲,概率抽样是最理想、最科学的抽样方法,它能保证样本数据对总体参数的代表性,而且它能够将调查误差中的抽样误差限制在一定范围之内。
但相对于非概率抽样来说,概率抽样也是花费较大的抽样方法。
概率抽样有以下几种形式。
1.简单随机抽样分层抽样整群抽样等距抽样非概率抽样不是完全按随机原则选取样本。
非概率抽样有三种形式。
1.主要是由调查人员自由选择被调查者的非随机选样2.通过某些条件过滤选择某些被调查者参与调查的判断抽样法。
只要不是属于要进行总体推论的大多数项目都可使用非概率抽样法。
3、简述众数、中位数和平均数的特点与应用场合?答:算术平均数与众数、中位数的关系取决于频数分布的状况。
它们的关系如下:1. 当数据具有单一众数且频数分布对称时,算术平均数与众数、中位数三者完全相等,即0e X M M ==,这一关系如图3.1所示。
2.当频数分布呈现右偏态时,说明数据存在最大值,必然拉动算术平均数向极大值一方靠,则三者之间的关系为X >e M >0M ,这一关系如图3.2。
3. 当频数分布呈现左偏态时,说明数据存在最小值,必然拉动算术平均数向极小值一方靠,而众数和中位数由于是位置平均数,不受极值的影响,因此,三者之间的关系为X <e M <0M ,这一关系如图3.3。
从上面的分析我们可以看出,当频数分布出现偏态时,极端值对算术平均数产生很大的影响,而对众数、中位数没有影响,此时,用众数、中位数作为一组数据的中心值比算术平均数有较高的代表性。
算术平均数与众数、中位数如果从数值上的关系看,当频数分布的偏斜程度不是很大时,无论是左偏还是右偏,众数与中位数的距离约为算术平均数与中位数的距离的两倍,即︱e o M M -︳=2︱e X M -︳ (3.18)根据上述关系,可以得出: 3()32o e e M X X M M X =--=- (3.19)对于一组数据,在已知两个代表值的情况下,可根据上式推算出另一代表值。
4、参数估计与假设检验的异同?答:它们都是利用样本对总体进行推断,但是推断的角度不同。
参数估计问题专门研究由样本估计总体的未知分布或分布中的未知参数,当总体分布类型已知,仅需对分布的未知参数进行估计的问题称为参数估计。
假设检验,则是对检验的参数提出一个假设,然后利用样本信息去检验这个假设是否成立。
5、方差分析的基本思想?答:方差分析是分析试验数据的一种重要统计方法。
方差分析法就是利用方差的可分解性,从总变异中分解出组间(条件)变异和组内(误差)变异,并把组间变异与组内变异进行对比,从中找出影响试验结果的主要因素。
具体地说就是首先假设所有数据都来自同一正态总体;然后检验这种假设是否正确。
6、相关分析与回归分析的联系与区别?答:联系:(1)先进行相关分析再进行回归分析,只有在确定两变量存在着相关分析后,才能分析两变量的回归分析。
两变量间的相关程度越大,研究回归才更有意义。
通过相关分析,可以大致判断现象与现象之间配合什么数学模型建立回归方程。
区别:分析的目的不同,相关分析主要分析变量之间有无关系,使什么样的关系,有多大程度的关系;回归分析用于构建有联系的变量间的回归模型,用于推理变量之间的因果关系。
相关分析的两个或两个以上的变量是随机变量。
回归分析中的自变量是确定性的变量。
7、简述影响抽样误差大小的因素答:(1)总体各单位标志值的差异程度。
在其他条件不变的情况下,总体各单位标志值的差异程度越大,抽样误差越大,反之,越小。
(2)样本单位数的多少。
在其他的情况不变时,样本单位越多,抽样误差越小,反之,越大。
(3)抽样方法。
抽样方法不同,抽样误差不同。
重复抽样比不重复抽样误差大。
(4)抽样的组织形式,抽样的组织形式不同,抽样的误差不同。
1、品质数据与数值型数据的整理与图示各有哪些?答:对品质数据主要是做分类整理,对数值型数据则主要是做分组整理。
定类数据本身就是对事物的一种分类,因此,在整理时除了要列出所分的类别外,还要计算出每一类别的频数、频率或比例、比率,同时选择适当的图形进行显示,以便对数据及其特征有一个初步的了解。
用频数分布表示反映分类数据的频数分布。
如果用图形来显示频数分布,就会更加形象和直观。
其中包括条形图和圆形图。
还可以绘制环形图。
对于定序数据,除了可使用上面的整理与显示技术外,还可以计算累积频数和累积频率(百分比)。
定序数据的图示根据累积频数或累积频率,可以绘制累积频数或频率分布图环形图。
定类数据和定序数据的整理与图示方法,也都适用于对数值型数据的整理与显示。
但数值型数据还有一些特定的整理和图示方法,并不适用于品质数据。
在整理时通常要进行数据分组分组后再计算出各组中出现的次数或频数,就形成了一张频数分布表。
分组的方法有单变量值分组和组距分组两种。
介绍的条形图、圆形图、环形图及累积分布图等都适用于显示定距数据和定比数据。
此外,对定距数据和定比数据还有以下一些图示方法,这些方法并不适用于定类数据和定序数据。
分组数据——直方图和折线图未分组数据——茎叶图)时间序列数据——线图统计表既是调查整理的工具,又是分析研究的工具,2、简述异众比率、四分位差、方差和标准差的应用场合?答:异众比率的作用是衡量众数对一组数据的代表性程度的指标。
异众比率越大,说明非众数组的频数占总频数的比重就越大,众数的代表性就越差;反之,异众比率越小,众数的代表性就越好。
异众比率主要用于测度分类数据的离散程度,当然,对于顺序数据也可以计算异众比率。
四分位差反映了中间50%数据的离散程度,其数值越小,说明中间的数据越集中;数值越大,说明中间的数据越分散。