统计学复习提纲

统计学复习提纲
统计学复习提纲

第一章导论

1.什么是统计学?统计方法可以分为哪两大类?

统计学是收集、分析、表述和解释数据的科学。统计方法可分为:1.描述统计是研究数据收集、整理和描述的统计学分支,是用图、表、统计量等方式对已有数据的特征进行描述。内容包括:搜集数据、整理数据、展示数据、描述性分析。目的:描述数据特征、找出数据的基本规律。2.推断统计是研究如何利用样本数据推断总体特征统计学分支,是指利用这种概率关系,由样本统计量推估总体参数。内容包括:参数估计、假设检验。目的:对总体特征作出推断。

2.统计数据可分为哪几种类型?不同数据的类型各有什么特点?

按计量尺度分:1.分类数据:对事物进行分类的结果,数据表现为类别,用文字来表述。2.顺序数据:对事物类别顺序的测度,数据表现为类别,用文字来表述。3.数值型数据:对事物的精确测度,结果表现为具体的数值。按收集方法分:1.观测的数据:通过调查或观测而收集到的数据。2.试验的数据:在试验中控制试验对象而收集到的数据,在没有对事物人为控制的条件下而得到的。按时间状况分:1.截面数据:在相同或近似相同的时间点上收集的数据,描述现象在某一时刻的变化情况。2.时间序列数据:在不同时间上收集到的数据,描述现象随时间变化的情况。

3.总体、样本、参数、统计量、变量的概念。

总体:所研究的全部元素的集合。样本:从总体中抽取的一部分元素的集合。构成样本的元素的数目称为样本容量。参数:用来描述总体特征的概括性数字度量。统计量:用来描述样本特征的概括性数字度量。变量:说明现象某种特征的概念。

4.变量的类型、特点及应用。

类型和特点:1.分类变量的取值只有类别属性之分,无大小。2.顺序变量的取值除类别属性之外,还有等级、次序的差别。3.数值变量的取值:数值。应用:分类数据和数值数据都可以计算众数,但数值数据还能计算平均数,前者却不能。

第二章数据的收集

1.简述普查和抽样调查的特点。

普查:1.为特定目的专门组织的非经常性全面调查。2.通常是一次性或周期性的。3.一般需要规定统一的标准调查时间。4.数据的规范化程度较高。5.应用范围比较狭窄。抽样调查:1.从总体中随机抽取一部分单位(样本)进行调查。2.目的是推断总体的未知数字特征。3.最常用的调查方式。4.具有经济性、时效性强、适应面广、准确性高等特点。

2.统计数据的具体收集方法有哪些?

数据的搜集方法:1.询问调查:访问调查、邮寄调查、电话调查、电脑辅助调查、座谈会、个别深度访问。2.观察实验:观察法、实验法。

3.调查方案包括那几个方面的内容?

调查方案的内容包括:调查目的、调查对象和调查单位、调查项目和调查表等。调查目的应说明调查所要达到的具体目标是什么;调查对象和调查单位是确定要向谁调查;调查项目和调查表说明的是调查的具体内容。

4.什么是问卷?它由哪几部分组成?设计问卷的提问项目应注意哪些问题?封闭型问题答案的设计主要有哪些方法?问卷中问题顺序的设计应注意哪些问题?

问卷是用来搜集调查数据的一种工具。一般由开头部分、甄别部分、主体部分和背景部分组成。设计问卷的提问项目应注意:提问的内容尽可能短、用词要确切通俗、一项提问只包含一项内容、避免诱导性提问和否定形式的提问、避免敏感性问题等。封闭型问题答案的设计方法有:两项选择法、多项选择法、顺序选择法、评定尺度法、双向列联法五种。问卷中问题顺序的设计应注意:问题的安排应具有逻辑性、问题的顺序应先易后难、能引起被调查者兴趣的问题放在前面、开放性问题放在后面、版面格式的设计等。

5. 统计数据的误差种类。

1.抽样误差:所有样本可能的结果与总体真值之间的平均性差异。在利用样本数据推断时所产生的随机误差。

2.非抽样误差:除抽样误差之外的,由于其他原因造成的样本观察结果与总体真值之间的差异。

6.统计数据的质量要求是什么?

1.精度:最低的抽样误差或随机误差。

2.准确性:最小的非抽样误差或偏差。

3.关联性:满足用户决策、管理和研究的需要。

4.及时性:在最短的时间里取得并公布数据。

5.一致性:保持时间序列的可比性。

6.最低成本:以最经济的方式取得数据。

第三章数据整理与展示

1.数据的预处理包括哪些内容?

数据的预处理:1.数据的审核:检查数据中的错误。2.数据的筛选:找出符合条件的数据。

3.数据排序:升序和降序,寻找数据的基本特征。

2.分类数据和顺序数据的整理和图示方法各有哪些?

分类数据和顺序数据的结果均表现为类别,这类数据本身就是分了类的,因此整理时主要是在分类的基础上计算各类别的频数、比例、比率以及百分比等,同时给出频数分布。常用的图示方法有条形图和圆形图等。

3.数值型数据的分组方法有哪些?简述组距分组的步骤。

数据分组的方法有单变量值分组和组距分组两种。组距分组的步骤:1.确定组数:组数的确定应以能够显示数据的分布特征和规律为目的。在实际分组时,可以按Sturges提出的经验公式来确定组数K,即:组数=1+[lg(n)/lg(2)]。2.确定组距:组距是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即:组距=(最大值-最小值)/组数。3.统计出各组的频数并整理成频数分布表。

4.直方图与条形图有何区别?

直方图与条形图的区别:1.条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的;直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,其高度与宽度均有意义。2.直方图的各矩形通常是连续排列;条形图则是分开排列。3.条形图主要用于展示分类数据;直方图则主要用于展示数值型数据。

第四章数据分布特征的测度

1.一组数据的分布特征可以从哪几个方面进行测度?

数据特征的测度:1.集中趋势:众数、中位数、均值。2.离散程度:异众比率、四分位差、方差和标准差、离散系数。3.分布的形状:偏态、峰态。

2.怎样理解均值在统计学中的地位?

均值在统计学中具有重要的地位,是集中趋势的最主要测度值,其缺点是易受极端值的影响。它主要适用于数值型数据,而不适用于分类数据和顺序数据。

3.简述众数、中位数和均值的特点和应用场合。

1.众数:不受极端值影响,具有不惟一性,数据分布偏斜程度较大时应用。

2.中位数:不受极端值影响,数据分布偏斜程度较大时应用。

3.平均数:易受极端值影响,数学性质优良,数据对称分布或接近对称分布时应用。

4.简述异众比率、四分位差、方差或标准差的适用场合。

1.异众比率:用于测度分类数据的离散程度,衡量众数对一组数据的代表程度。

2.四分位差:用于测度顺序数据的离散程度,衡量中位数对一组数据的代表程度。

3.方差或标准差:用于测度数据离散程度的最常用测度值,衡量均值对一组数据的代表程度。

第五章抽样与参数估计

1.什么是抽样分布?

在重复选取容量为n的样本时,由每一个样本算出的该统计量数值的相对频数分布或概率分布,称为样本统计量的抽样分布。

2.抽样均值抽样分布的两个主要特征值是什么?他们与总体参数有什么关系?

特征值是:数学期望和方差。这两个特征一方面与总体分布的均值和方差有关,另一方面也与抽样方法是重复抽样,还是不重复抽样有关,无论是重复抽样,还是不重复抽样,样本均值的数学期望始终等于总体均值,而样本均值的方差则与抽样方法有关,在重复抽样下,样本均值的方差为总体方差的1/n,在不重复抽样的条件下,样本均值的方差则需要用修正系数(N-n)/(N-1)去修正重复抽样时样本均值的方差。

3.样本统计量的分布与总体分布的关系是什么?

如果原有总体是正态分布,无论样本容量大小,样本统计量也服从正态分布。如果原有总体是非正态分布,当n为大样本时(n>=30),由中心极限定理可知,当样本容量n增大时,不管原来的总体是否服从正态分布,样本统计量的抽样分布都将服从于正态分布。当n为小样本时,其分布则不是正态分布,这时就不能按正态分布进行推断。

4.什么是置信度?

将构造置区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例(概率)称为置信度。如抽取了100个样本,根据每一个样本均构造了一个置信区间,这样,由100个样本构造的总体参数的100个置信区间中,有95%的区间包含了总体参数的真值,而5%的置信区间则没有包含。这里,95%这个值被称为置信水平(或置信度)。

5. 什么是参数区间估计?

参数区间估计的含义:估计总体参数的区间范围,并给出区间估计成立的概率值。P(θ1≤θ≤θ2) =1-α。其中:1-α(0<α<1)称为置信度;α是总体参数未在区间内的比例,其取值大小由实际问题确定,经常取1%、5%和10%。置信区间是[θ1, θ2],样本容量一定时置信度越大(估计的可靠性越大)相应置信区间也越宽(总体参数的取值范围越大,估计越不精确)。

第六章假设检验

1.什么是检验统计量?什么是标准化检验统计量?

根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量,称为检验统计量。标准化检验统计量=(点估计量-假设值)/点估计量的抽样标准差。

2.什么是显著性水平?它对于假设检验决策的意义是什么?

在原假设为真的条件下,检验统计量的观察值大于或等于其计算值的概率,称为P值,也称为观察到的显著性水平。一般是在原假设成立条件下,所规定的小概率的数量界限。对应拒绝域的面积大小。该面积对应的底边代表z的取值区间。也就是统计量处于该区间,则否定H0。

3. 统计学中是如何表述假设检验的?

统计学中表述假设检验思想为:对某总体抽样,如果根据样本计算的某个统计量表明在原假设H0成立的条件下是几乎不可能发生的,就否定H0,并接受其对立面H1。反之,如果在H0成立的条件下,根据样本所计算的某个统计量发生的可能性并非很小,则接受原假设。

4.简述假设检验的一般步骤。

1.陈述原假设H0和备择假设H1。

2.从所研究的总体中抽出一个随机样本。

3.确定一个适当的检验统计量,并利用样本数据算出其具体数值。

4.确定一个适当的显著性水平α,并计算出其临界值,指定拒绝域。

5.将统计量的值与临界值进行比较,作出决策:若统计量的值落在拒绝域内,拒绝原假设H0,否则不拒绝原假设H0。双侧检验:|统计量|>临界值,拒绝H0;左侧检验:统计量<-临界值,拒绝H0;右侧检验:统计量>临界值,拒绝H0。

第七章相关与回归分析

1.解释相关关系的含义,说明相关关系的特点。

相关关系是指变量之间存在的不确定的数量关系。其特点是:1.变量间关系不能用函数关系精确表达。2.一个变量的取值不能由另一个变量唯一确定,当变量x取某个值时,变量y 的取值可能有几个,各观测点分布在直线周围。3.可以用散点图粗略判断相关,用相关系数定量判断相关程度。

2.简述相关系数的取值及其意义。

取值及其意义:相关系数r:对变量之间线性关系强度的度量 1.r的取值范围是[-1,1]。

2.|r|=1,为完全相关(r=1,为完全正相关,r=-1,为完全负相关)。

3.r=0,不存在线性相关关系相关。

4.-1≤r<0,为负相关。

5.0

6.|r|越趋于1表示关系越密切;|r|越趋于0表示关系越不密切。

3.解释回归模型、回归方程、估计的回归方程的含义及回归方程的作用。

1.描述因变量y如何依赖于自变量x和误差项的方程称为回归模型。

2.描述因变量y的平均值或期望值如何依赖于自变量x的方程称为回归方程。

3.利用最小二乘法,根据样本数据球出的回归方程的估计称为估计的回归方程。回归方程的作用:对未知情况进行估计和预测。如果已经根据样本数据建立了回归方程,并且该方程通过了各种检验,可以用它预测从现有样本数据中找不到的值。

4. 什么是回归分析?回归分析与相关分析区别。

回归分析:1.根据样本数据,确定变量之间的数学关系式。2.对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多因素中找出哪些因素的影响显著,哪些不显著。

3.利用所求的关系式,根据一个或几个变量的取值来预测或控制另一个特定变量的取值,并

给出这种预测或控制的精确程度。回归分析与相关分析区别:1.相关分析中,变量x变量y 处于平等的地位;回归分析中,变量y称为因变量,处在被解释的地位,x称为自变量,用于预测因变量的变化。2.相关分析中所涉及的变量x和y都是随机变量;回归分析中,因变量y是随机变量,自变量x可以是随机变量,也可以是非随机的确定变量。3.相关分析主要是描述两个变量之间线性关系的密切程度;回归分析不仅可以揭示变量x 对变量y 的影响大小,还可以由回归方程进行预测和控制。

医学统计学简答题35506

医学统计学简答题 1.简述标准差、标准误的区别与联系? 区别:(1)含义不同:标准差S表示观察值的变异程度,描述个体变量值(x)之间的变异度大小,S越大,变量值(x)越分散;反之变量值越集中,均数的代表性越强。标准误..估计均数的抽样误差的大小,是描述样本均数之间的变异度大小,标准误越大,样本均数与总体均数间差异越大,抽样误差越大;反之,样本均数越接近总体均数,抽样误差越小。 (2)与n的关系不同: n增大时,S趋于σ(恒定),标准误减少并趋于0(不存在抽样误差)。 (3)用途不同:标准差表示x的变异度大小、计算变异系数、确定医学参考值范围、计算标准误等,标准误用于估计总体均数可信区间和假设检验。 联系:二者均为变异度指标,样本均数的标准差即为标准误,标准差与标准误成正比。 2.简述假设检验的基本步骤。 1.建立假设,确定检验水准。 2.选择适当的假设检验方法,计算相应的检验统计量。 3.确定P值,下结论 3.正态分布的特点和应用: 特点:1、集中性:正态曲线的高峰位于正中央,即均数所在的位置; 2、对称性:正态分布曲线位于直角坐标系上方,以x=u为中心,左右对称,曲线两端永远不与横轴相交; 3、均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均

匀下降; 4、正态分布有两个参数,即均数μ和标准差σ,可记作N(μ,σ):均数μ决定正态曲线的中心位置;标准差σ决定正态曲线的陡峭或扁平程度。σ越小,曲线越陡峭;σ越大,曲线越扁平; 5、u变换:为了便于描述和应用,常将正态变量作数据转换; 应用: 1.估计医学参考值范围 2.质量控制 3.正态分布是许多统计方法的理论基础 4.简述参考值范围与均数的可信区间的区别和联系 可信区间与参考值范围的意义、计算公式和用途均不同。 1.从意义来看95%参考值范围是指同质总体内包括95%个体值的估计范围,而总体均数95%可信区间是指95%可信度估计的总体均数的所在范围 2.从计算公式看若指标服从正态分布,95%参考值范围的公式是:±1.96s。总体均数95%可信区间的公式是:前者用标准差,后者用标准误。前者用1.96,后者用α为0.05,自由度为v的t界值。 5.频数表的用途和基本步骤。 用途:(1)揭示资料的分布特征和分布类型;(2)便于进一步计算指标和分析处理;(3)便于发现某些特大或特小可疑值。 基本步骤:(1)求出极差;(2)确定组段,一般设8~15个组段;(3)确定组距;组距=R/组段数,但一般取一方便计算的数字;(4)列出各个组段并确定每一组段频数。 6.非参数统计检验的适用条件。 (1)资料不符合参数统计法的应用条件(总体为正态分布、且方差相等)或总体分布类型未知;(2)等级资料;(3)分布呈明显偏态又无适当的变量转换方法使之满足参数统计条件;(4)在资料满足参数检验的要求时,应首选参数法,以免降低检验效能

432--《统计学》考试大纲

432--《统计学》考试大纲 一、基本要求 《统计学》考试的目的在于考查考生对统计学及其在社会经济应用中所涉及的基本概念、基本理论和基本方法的掌握情况以及分析解决实际问题的能力。基本要求是: 1.准确地理解《统计学》中的基本概念; 2.准确地把握《统计学》的基本理论; 3.正确理解统计分析的方法; 4.能够应用《统计学》的基本理论和方法解决社会经济实际问题; 5.了解统计学的发展趋势和发展动态。 《统计学》课程考试对考生的具体要求分为四个层次: 1.识记:能知道有关的名词、概念、知识的含义,并能正确认识和表述。 2.领会:在识记的基础上,能全面把握基本概念、基本原理,能掌握有关概念和原理的区别与联系。 3.简单应用:在领会的基础上,能用学过的一两个知识点分析和解决简单的问题。 4.综合应用:在简单应用的基础上,能用学过的多个知识点,综合分析和解决较复杂的问题。 二、考试范围 1.导论 识记:统计学的概念、数据类型、总体和样本概念。 领会:数据分类的标准、总体和样本的区别、参数和统计量的区别。 2.数据的来源 识记:常用的概率抽样和非概率抽样方法。 领会:不同抽样方法适用的条件。 3.数据的描述 识记:分类数据、顺序数据和数值型数据的集中趋势、离散程度的测度、几种常用图形的使用和区别。 应用:会计算分组数据和原始数据的均值、方差、标准差、离散系数。 4.参数估计 识记:点估计、区间估计概念。 综合应用:一个总体均值和比例的区间估计;两个总体参数的区间估计;样本量的计算。 5、假设检验 识记:两类错误、原假设、临界值概念。 综合应用:一个总体均值和比例的假设检验,包括单侧、双侧、大样本、小样本等情况;两个总体参数的检验。

统计学原理计算题及答案

2 ?采用简单重复抽样的方法从一批零件中抽取 200件进行检查,其中合格品 188件。要求: (1) 计算该批零件合格率的抽样平均误差; (2) 按95.45%的可靠程度(t=2,就是我们现在的Z )对该批零件的合格率作出区间估计。 解:n =200,n =188 (1)合格率 = 1?^ = 94% n 200 合格率的抽样平均误差 p(1 — p) 「0.94 x 0.06 J0.0564 . ---------- 0.000282 = 0.01679 = 1.679%(2)按95.45%的可靠程度对该批零件的 p i n , 200 \ 200 合格率作出区间估计 二Z 」p =2 1.68% =3.36% p - :p =94% -3.36% =90.64% p :P =94% 3.36% =97.36% 该批零件合格率区间为: 990.64%乞P 乞97.36% 要求: (1) 试计算各年的环比发展速度及年平均增长量。 (2) 如果从2006年起该地区的粮食生产以 10%的增长速度发展,预计到 2010年该地区的粮食产量将达到什么水平? 2006年起该地区的粮食生产以 10%的增长速度发展 x =1 10% =110% 71 预计到2010年该地区的粮食产量将达到 解: (1) 各年的环比发展速度 472 二 108.76% a 0 434 a 2 516 109.32 % 472 a g 584 a 2 516 = 113.18% 618 =105.82% a 4 年平均增长量 累计增长量 累计增长个数 …=618一434」84=46 4 4 4 (2)如果从

应用统计学概念整理

并根据样本调查结果来推断总体特征 自下而上地逐级提供基本数据的调查方 应用统计学概念整理 第一章:导论 1. 只能归类于某一类别的非数字型数据称为分类数据 2. 只能归于某一有序类别的非数字型数据称为顺序数据 3. 按数字尺度测量的观测值称为数值型数据 4. 包含所研究的全部个体的集合称为总体 5. 从总体中抽取的一部分的元素的集合称为样本 6. 用来描述总体特征的的概括性数字度量称为参数 7. 用来描述样本特征的概括性数字度量称为统计量 8. 说明事物类别的一个名称称为分类变量 9. 说明事物有序类别的一个名称称为顺序变量 10. 说明事物数字特征的一个名称称为数值型变量 11. 只能取可数值的变量称为离散型变量 12. 可以在一个或多个区间中取任何值的变量称为连续型变量 第二章:数据收集 1. 从总体中随机抽取一部分单位作为样本进行调查, 的数据收集方法,称为抽样调查。 2. 为特定目的而专门组织的全面调查称为普查 3. 按照国家有关法律规定, 自上而下地统一布置, 式 称为统计报表 第三章:数据的图表展示 1. 落在某一特定类别或组中的数据个数,称为频数 2. 把各个类别及其落在其中的相应频数全部列出, 并用表格形式表示出来, 称为频数分布 3. 一个样本或总体中各个部分的数据与全部数据之比,称为比例 4. 将比例乘以 100 得到的数值,称为百分比或百分数,用 %表示 5. 样本或总体中各不同类别数值之间的比值,称为比率 6. 分类数据的图示:条形图, pareto 图,对比条形图,饼图 7. 将各有序类别或组的频数逐级累加起来得到的频数称为累计频数 8. 将各有序类别或组的百分比逐级累加起来称为累计频率 9. 顺序数据的图示:累计频数分布图,环形图 10. 根据统计研究的需要,将原始数据按照某种标准划分成不同的组别称为数据分组 11. 分组后的数据称为分组数据 12. 把变量值作为一组称为单变量值分组 13. 将全部变量值一次划分为若干个区间, 并将这一区间的变量值作为一组, 称为组距分组 14. 在组距分组中,一个组的最小值称为下限,最大值称为上限 15. 一个组的上限与下限的差称为组距 16. 各组组距相等的组距分组称为等距分组 17. 各组组距不相等的组距分组称为不等距分组 18. 每一组的下限和上限之间的重点值称为组中值 19. 用矩形的宽度和高度即面积来表示频数分布的图形称为直方图

2019-2020第二学期统计学复习大纲

2019-2020第二学期《统计学》复习大纲 填空题、选择和判断知识点: 1. 统计学发展的三个阶段:古典统计学时期、近代统计学时期和现代统计学时期,古典统 计学有两大学派:国势学派和政治算术学派,代表人物分别是德国的康令、阿亨瓦尔和英国的威廉?配第、约翰?格朗特。近代统计学也有两大学派:数理统计学派和社会统计学派,代表人物分别是比利时的凯特莱和德国的克尼斯。现代统计学以推断统计为主流。 2. 统计的含义:统计资料、统计工作和统计学。统计资料是经过观察、调查得到的各种具有 信息价值的数字资料;统计工作是对各种统计数据资料进行搜集、整理、推断和分析的活动过程;统计学即指导统计工作的理论和方法,是关于统计数据资料的搜集、整理和推断的科学。统计工作与统计资料是统计活动与统计成果的关系,统计工作与统计学则是统计实践与统计理论的关系。统计的本质就是用数据说明问题,用数据反应真相。 3. 标志与指标的种类判断:标志是用以描述个体所共同具有的某种属性或特征的名称。标 志按其结果的表示方式不同分为品质标志和数量标志两种。品质标志表明个体属性方面的特征,数量标志说明个体数量方面的特征,标志表现是标志在各个体上的具体表现结果。标志按其在每个个体上的具体表现结果是否相同可以分为不变标志和可变标志。标志按其表现个体特征的直接程度不同可以分为直接标志和间接标志。标志的测定尺度有四种,按由低层次到高层次的顺序分别为:定类尺度、定序尺度、定距尺度和定比尺度。从狭义上看,变量是指可变的数量标志,从广义上看,也可包括可变的品质标志。 变量按其所受影响因素不同可以分为确定性变量和随机性变量;变量按其数值的变化是否连续出现可以分为离散型变量和连续型变量。 统计指标是反映实际存在的社会经济现象总体数量特征的概念及其数值。统计指标由指标名称和指标数值两部分组成,具体包括指标名称、计算方法、时间限制、地点限制、指标数值和计量单位六个要素。统计指标按其计算的范围不同,可以分为总体指标和样本指标;统计指标按其反映现象的内容不同,可以分为数量指标和质量指标;统计指标按其反映现象的时间状态不同,可以分为静态指标和动态指标;统计指标按其功能不同,可以分为描述指标、评价指标和预警指标。统计指标的设计要确定指标的名称与涵义、计算范围、计算方法、资料搜集方法、量化尺度和计量单位等内容。统计指标与标志之间既存在区别(说明的对象不同,表现结果的形式不同),又存在联系(标志是计算指标的依据,两者可以互换)

统计学原理计算题试题及答案

电大专科统计学原理计算题试题及答案 计算题 1.某单位40名职工业务考核成绩分别为: 68 89 88 84 86 87 75 73 72 68 75 82 97 58 81 54 79 76 95 76 71 60 90 65 76 72 76 85 89 92 64 57 83 81 78 77 72 61 70 81 单位规定:60分以下为不及格,60─70分为及格,70─80分为中,80─90 分为良,90─100分为优。 要求: (1)将参加考试的职工按考核成绩分为不及格、及格、中、良、优五组并 编制一张考核成绩次数分配表; (2)指出分组标志及类型及采用的分组方法; (3)分析本单位职工业务考核情况。 解:(1) (2)分组标志为"成绩",其类型为"数量标志";分组方法为:变量分组中 的开放组距式分组,组限表示方法是重叠组限; (3)本单位的职工考核成绩的分布呈两头小, 中间大的" 正态分布"的形态, 说明大多数职工对业务知识的掌握达到了该单位的要求。 2.2004年某月份甲、乙两农贸市场农产品价格和成交量、成交额资料如下

试问哪一个市场农产品的平均价格较高?并说明原因。 解: 解:先分别计算两个市场的平均价格如下: 甲市场平均价格()375.145 .5/==∑∑=x m m X (元/斤) 乙市场平均价格325.14 3 .5==∑∑= f xf X (元/斤) 说明:两个市场销售单价是相同的,销售总量也是相同的,影响到两个市场 平均价格高低不同的原因就在于各种价格的农产品在两个市场的成交量不同。 3.某车间有甲、乙两个生产组,甲组平均每个工人的日产量为36件, 标准差为9.6件;乙组工人日产量资料如下: 要求:⑴计算乙组平均每个工人的日产量和标准差; ⑵比较甲、乙两生产小组哪个组的日产量更有代表性? 解:(1)

医学统计学第七版课后答案及解析

练习题答案 第一章医学统计中的基本概念 练习题 一、单向选择题 1. 医学统计学研究的对象是 A. 医学中的小概率事件 B. 各种类型的数据 C. 动物和人的本质 D. 疾病的预防与治疗 E.有变异的医学事件 2. 用样本推论总体,具有代表性的样本指的是 A.总体中最容易获得的部分个体 B.在总体中随意抽取任意个体 C.挑选总体中的有代表性的部分个体 D.用配对方法抽取的部分个体 E.依照随机原则抽取总体中的部分个体 3. 下列观测结果属于等级资料的是 A.收缩压测量值 B.脉搏数 C.住院天数 D.病情程度 E.四种血型 4. 随机误差指的是 A. 测量不准引起的误差 B. 由操作失误引起的误差 C. 选择样本不当引起的误差 D. 选择总体不当引起的误差 E. 由偶然因素引起的误差 5. 收集资料不可避免的误差是 A. 随机误差 B. 系统误差 C. 过失误差 D. 记录误差 E.仪器故障误差 答案: E E D E A 二、简答题 1.常见的三类误差是什么?应采取什么措施和方法加以控制? [参考答案] 常见的三类误差是:

(1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校 正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。要尽量查明其原因,必须克服。 (2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正, 但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素 造成测量结果的误差。对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳 压器、恒温装置等措施,从而达到控制的目的。 (3)抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本 均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。这种差异是由抽样引 起的,故这种误差叫做抽样误差,要用统计方法进行正确分析。 2.抽样中要求每一个样本应该具有哪三性? [参考答案] 从总体中抽取样本,其样本应具有“代表性”、“随机性”和“可靠性”。 (1)代表性: 就是要求样本中的每一个个体必须符合总体的规定。 (2)随机性: 就是要保证总体中的每个个体均有相同的几率被抽作样本。 (3)可靠性: 即实验的结果要具有可重复性,即由科研课题的样本得出的结果所推测 总体的结论有较大的可信度。由于个体之间存在差异, 只有观察一定数量的个体方能体现出 其客观规律性。每个样本的含量越多,可靠性会越大,但是例数增加,人力、物力都会发生 困难,所以应以“足够”为准。需要作“样本例数估计”。 3.什么是两个样本之间的可比性? [参考答案] 可比性是指处理组(临床设计中称为治疗组)与对照组之间,除处理因素不同外,其他可能影响实验结果的因素要求基本齐同,也称为齐同对比原则。 (马斌荣) 第二章集中趋势的统计描述 练习题 一、单项选择题 1. 某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是

应用统计学

应用统计学 课程编码:202136 课程英文译名:Practical Statistics 课程类别:学科基础选修课 开课对象:工业工程专业 开课学期:5 学分: 2学分; 总学时: 32学时; 理论课学时: 32 学时; 实验学时: 0学时; 上机学时: 0 学时 先修课程:概率论 教材:应用统计,朱洪文,高等教育出版社,2001.2 参考书:【1】应用统计学,倪加勋,中国人民大学出版社,1994 一、课程的性质、目的和任务 应用统计学是一门认识方法论的科学,通过对社会经济现象的数量方面资料的搜索、整理、分析和推断,阐明社会经济现象本质及其内在的规律性,以达到对社会经济现象整体的具体的认识。该课程作为经济、管理类专业的专业基础课开设。 通过本课程的教育需达到以下目的:1、为经济管理提供统计调查,资料整理汇总和统计分析的一般原则和方法;2、为进一步学习有关专业知识,奠定理论和方法基础;3、为学习其他经济管理课程和从事经济研究工作提供数量分析的方法。学习中要正确理解课程中的各个基本概念,了解统计工作的各个阶段,掌握统计的基础理论和基本方法,并能综合运用所学的理论知识分析应用经济统计信息,以满足工作的需要。 二、课程的基本要求 1.明确统计的对象及其特点,了解统计的性质与作用以及统计工作的基本环节。透彻理解统计学中的基本范畴,初步建立统计思想。 2.理解统计调查的概念,了解统计调查方法的种类,掌握统计报表制度和各种专门调查的概念、特点以及各种调查方法的结合运用。 3.了解统计调查方案的基本内容,理解统计整理的概念,统计分组的概念和作用,了解次数分布的类型,统计表的结构,掌握制表的一

统计学复习资料分析

《统计学》 第一章 一、填空题 1、统计是、和的统一体,是统计工作的成果,是 统计工作的经验总结和理论概括。 2、统计研究的具体方法主要有、、和。 3、统计工作可划分为、、和四个阶段。 4、随着的改变,总体和是可以相互转化的。 5、标志是说明,指标是说明。 6、可变的数量标志和所有的统计指标称为,变量的具体数值称为。 7、变量按分,可分为连续变量和离散变量,职工人数、企业数属于变量; 变量按分,可分为确定性变量和随机变量。 8、社会经济统计具有、、、等特点。 9、一个完整的统计指标应包括和两个基本部分。 10、统计标志按是否可用数值表示分为和;按在各个单位上的具体表 现是否相同分为和。 11、说明特征的名称叫标志,说明特征的名称叫指标。 12、数量指标用表示,质量指标用或平均数表示。 13、在统计中,把可变的和统称为变量。 14、由于统计研究目的和任务的变更,原来的变成,那么原来的指标 就相应地变成标志,两者变动方向相同。 二、是非题 1、统计学和统计工作的研究对象是完全一致的。 2、运用大量观察法,必须对研究对象的所有单位进行观察调查。 3、统计学是对统计实践活动的经验总结和理论概括。 4、一般而言,指标总是依附在总体上,而总体单位则是标志的直接承担者。 5、数量指标是由数量标志汇总来的,质量指标是由品质标志汇总来的。 6、某同学计算机考试成绩80分,这是统计指标值。 7、统计资料就是统计调查中获得的各种数据。 8、指标都是用数值表示的,而标志则不能用数值表示。 9、质量指标是反映工作质量等内容的,所以一般不能用数值来表示。 10、总体和总体单位可能随着研究目的的变化而相互转化。 11、女性是品质标志。 12、以绝对数形式表示的指标都是数量指标,以相对数或平均数表示的指标都是质量指标。

统计学原理计算题及参考答案

"

}

| 1、某生产车间30名工人日加工零件数(件)如下: 30 26 42 41 36 44 40 37 37 25 45 29 43 31 36 36 49 34 47 33 43 38 42 32 34 38 46 43 39 35 要求:(1)根据以上资料分成如下几组:25—30,30—35,35—40,40—45,45—50,计算各组的频数和频率,编制次数分布表; (2) 根据整理表计算工人平均日产零件数。(20分) 解:(1)根据以上资料编制次数分布表如下:

则工人平均劳动生产率为: 17.3830 1145 == = ∑∑f xf x # 要求:(1)建立以产量为自变量的直线回归方程,指出产量每增加1000件时单位成本的平均变动是多少 、 (2)当产量为10000件时,预测单位成本为多少元(15分) x bx a y n x b n y a x x n y x xy n b c 5.28080 10703 125.232105.2615 1441502520250512503210128353)(2 2 2-=+==+=?+=-=-=-=--=-??-?= --= ∑∑∑∑∑∑∑因为,5.2-=b ,所以产量每增加1000件时, 即x 增加1单位时,单位成本的平均变动是:平均减少元 (2)当产量为10000件时,即10=x 时,单位成本为 — 55105.280=?-=c y 元

>课程的测试,甲班平均成绩为81分,标准差为分;乙班的成绩分组资料如下: 计算乙班学生的平均成绩,并比较甲.乙两班哪个班的平均成绩更有代表性 解:乙班学生的平均成绩∑∑=f xf x ,所需的计算数据见下表:

医学统计学简答题

医学统计学简答题 1.简述标准差、标准误得区别与联系? 区别:(1)含义不同:标准差S表示观察值得变异程度,描述个体变量值(X)之间得变异度大小,S越大,变量值(X)越分散;反之变量值越集 中,均数得代表性越强。标准误、、估计均数得抽样误差得大小,就是描述样本均数之间得变异度大小,标准误越大,样本均数与总体均数间差异越大,抽样误差越大;反之,样本均数越接近总体均数,抽样误差越小。(2)与n得关系不同:n增大时,S趋于。(恒定),标准误减少并趋于 0(不存在抽样误差)。 (3)用途不同:标准差表示X得变异度大小、计算变异系数、确定医学参考值范围、计算标准误等,标准误用于估计总体均数可信区间与假设检验。联系:二者均为变异度指标,样本均数得标准差即为标准误,标准差与标准误成正比。 2.简述假设检验得基本步骤。 1.建立假设,确定检验水准。 2.选择适当得假设检验方法,计算相应得检验统计量。 3、确定P值,下结论3.正态分布得特点与应用: 特点:1、集中性:正态曲线得高峰位于正中央,即均数所在得位置; 2、对称性:正态分布曲线位于直角坐标系上方,以x=u为中心,左右对称,曲线两端永远不与横轴相交; 3、均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均 匀下降; 4、正态分布有两个参数,即均数》与标准差0 ,可记作N(?,。):均数卩决定正态曲线得中心位置;标准差。决定正态曲线得陡峭或扁平程度。0越小,

曲线越陡峭;0越大,曲线越扁平; 5、U变换:为了便于描述与应用,常将正态变量作数据转换; 应用:1、估计医学参考值范围2、质量控制3、正态分布就是许多统计方法得理论基础 4.简述参考值范围与均数得可信区间得区别与联系 可信区间与参考值范围得意义、计算公式与用途均不同。 1、从意义来瞧95%参考值范围就是指同质总体内包括95%个体值得估计范围,而总体均数95%可信区间就是指95%可信度估计得总体均数得所在范围 2、从计算公式瞧若指标服从正态分布,95%参考值范围得公式就是: ±l、96s。总体均数95%可信区间得公式就是:前者用标准差,后者用标准误。前者用1、96,后者用a为0、05,自由度为V得t界值。 5.频数表得用途与基本步骤。 用途:(1)揭示资料得分布特征与分布类型;(2)便于进一步计算指标与分析处理;(3)便于发现某些特大或特小可疑值。 基本步骤:(1)求出极差;(2)确定组段,一般设8~15个组段;(3)确定组距;组距二R/组段数,但一般取一方便计算得数字;(4)列出各个组段并确定每一组段频数。 6.非参数统计检验得适用条件。 (1)资料不符合参数统计法得应用条件(总体为正态分布、且方差相等)或总体分布类型未知:(2)等级资料:(3)分布呈明显偏态又无适当得变量转换方法使之满足参数统计条件;(4)在资料满足参数检验得要 求时,应首选参数法,以免降低检验效能 7.线性回归得主要用途。

应用统计学概念整理

应用统计学概念整理 第一章:导论 1.只能归类于某一类别的非数字型数据称为分类数据 2.只能归于某一有序类别的非数字型数据称为顺序数据 3.按数字尺度测量的观测值称为数值型数据 4.包含所研究的全部个体的集合称为总体 5.从总体中抽取的一部分的元素的集合称为样本 6.用来描述总体特征的的概括性数字度量称为参数 7.用来描述样本特征的概括性数字度量称为统计量 8.说明事物类别的一个名称称为分类变量 9.说明事物有序类别的一个名称称为顺序变量 10.说明事物数字特征的一个名称称为数值型变量 11.只能取可数值的变量称为离散型变量 12.可以在一个或多个区间中取任何值的变量称为连续型变量 第二章:数据收集 1.从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征 的数据收集方法,称为抽样调查。 2.为特定目的而专门组织的全面调查称为普查 3.按照国家有关法律规定,自上而下地统一布置,自下而上地逐级提供基本数据的调查方 式称为统计报表 第三章:数据的图表展示 1.落在某一特定类别或组中的数据个数,称为频数 2.把各个类别及其落在其中的相应频数全部列出,并用表格形式表示出来,称为频数分布 3.一个样本或总体中各个部分的数据与全部数据之比,称为比例 4.将比例乘以100得到的数值,称为百分比或百分数,用%表示 5.样本或总体中各不同类别数值之间的比值,称为比率 6.分类数据的图示:条形图,pareto图,对比条形图,饼图 7.将各有序类别或组的频数逐级累加起来得到的频数称为累计频数 8.将各有序类别或组的百分比逐级累加起来称为累计频率 9.顺序数据的图示:累计频数分布图,环形图 10.根据统计研究的需要,将原始数据按照某种标准划分成不同的组别称为数据分组 11.分组后的数据称为分组数据 12.把变量值作为一组称为单变量值分组 13.将全部变量值一次划分为若干个区间,并将这一区间的变量值作为一组,称为组距分组 14.在组距分组中,一个组的最小值称为下限,最大值称为上限 15.一个组的上限与下限的差称为组距 16.各组组距相等的组距分组称为等距分组 17.各组组距不相等的组距分组称为不等距分组 18.每一组的下限和上限之间的重点值称为组中值

432统计学考试大纲

全国硕士研究生入学统一考试应用统计硕士专业学位统计学考试大纲 I 考查目标 全国硕士研究生入学统一考试应用统计硕士专业学位《统计学》考试是为高等院校和科研院所招收应用统计硕士生而设置的具有选拔性质的考试科目。其目的是科学、公平、有效地测试考生是否具备攻读应用统计专业硕士所必须的基本素质、一般能力和培养潜能,以利用选拔具有发展潜力的优秀人才入学,为国家的经济建设培养具有良好职业道德、法制观念和国际视野、具有较强分析与解决实际问题能力的高层次、应用型、复合型的统计专业人才。考试要求是测试考生掌握数据处收集、处理和分析的一些基本统计方法。 具体来说。要求考生: 1.掌握数据收集和处理的基本分方法。 2.掌握数据分析的基本原理和方法。 3.掌握了基本的概率论知识。 4.具有运用统计方法分析数据和解释数据的基本能力。 II 考试形式 一、试卷满分及考试时间 试卷满分为150分,考试时间180分钟。 二、答题方式 答题方式为闭卷、笔试。允许使用计算器(仅仅具备四则运算和开方运算功能的计算器),但不得使用带有公式和文本存储功能的计算器。 三、试卷内容与题型结构 统计学120分,有以下三种题型: 单项选择题25题,每小题2分,共50分 简答题3题,每小题10分,共30分 计算与分析题2题,每小题20分,共40分 概率论30分,有以下三种题型: 单项选择题5题,每小题2分,共10分 简答题1题,每小题10分,共10分 计算与分析题1题,每小题10分,共10分 III 考查内容 一、统计学 1.调查的组织和实施。 2.概率抽样与非概率抽样。 3.数据的预处理。 4.用图表展示定性数据。 5.用图表展示定量数据。 6.用统计量描述数据的水平:平均数、中位数、分位数和众数。

00974统计学原理练习题

00974统计学原理 一、单选 1、下列调查中,调查单位与填报单位一致的是( D )。 A. 企业设备调查 B. 人口普查 C. 农村耕地调查 D. 工业企业现状调查 2、每一吨铸铁成本(元)倚铸件废品率(%)变动的回归方程为: y c = 56 + 8x,这意味着( C ) 3、 A. 废品率每增加1%,成本每吨增加64元 B. 废品率每增加1%,成本每吨增加8% 4、 C. 废品率每增加1%,成本每吨增加8元 D. 废品率每增加1%,则每吨成本为56元 3、2005年某地区下岗职工已安置了万人,安置率达%,安置率是( D )。 A.总量指标 B.变异指标 C.平均指标 D.相对指标 4、下面现象间的关系属于相关关系的是( C )。 A. 圆的周长和它的半径之间的关系 B. 价格不变条件下,商品销售额与销售量之间的关系 C. 家庭收入愈多,其消费支出也有增长的趋势 D. 正方形面积和它的边长之间的关系 5、分配数列各组标志值和每组次数均增加15%,加权算术平均数的数值( B )。 A.减少15% B.增加15% C.不变化 D.判断不出 6、次数分配数列是( D)。 A.按数量标志分组形成的数列 B.按品质标志分组形成的数列 C.按统计指标分组所形成的数列 D.按数量标志和品质标志分组所形成的数列 7、对于不同水平的总体不能直接用标准差比较其标志变异度,这时需分别计算各自的 ( A )来比较。 A.标准差系数 B.平均差 C.全距 D.均方差 8、企业按资产总额分组( B ) A.只能使用单项式分组 B.只能使用组距式分组 C.可以单项式分组,也可以用组距式分组 D.无法分组 9、某企业的职工工资水平比上年提高5%,职工人数增加2%,则企业工资总额增长( B )。 A. 10% B. % C. 7% D. 11% 10、在进行分组时,凡是遇到某单位的标志值刚好等于相邻两组上下限数值时,一般是 ( B )。

《医学统计学》样题一

《医学统计学》样题一 选择题答案表(涂黑所选答案,未填此表者不给分) 一、单选题(每题2分,共40分) 1. 样本率与总体率差别的假设检验可用。 A 四格表直接概率法计算 B 四格表χ2检验 C 不能检验 D 由样本率制定总体率的可信区间来判断 E 以上都不是 2.在抽样研究中,当样本例数逐渐增多时_____。 A 标准误逐渐加大 B 标准差逐渐加大 C 标准差逐渐减小 D 标准误逐渐减小 E 标准差趋近于0 3.2008年某乡卫生院接诊结核病患者100人,其中男性76人,女性24人,分别占76%和24%,则可以推断出的结论为。 A 该病男性易患 B 该病男女患病率不同 C该病女性易患 D 该病男女发病率不同 E 尚不能得出男女间患病率孰高孰低的结论 4.要减少抽样误差,通常的做法是_____。 A 适当增加样本例数 B 将个体变异控制在一个范围内 C 减少样本例数 D 增加抽样次数 E 减小系统误差 5. 同样性质的两项研究工作中,都作两样本均数差别的假设检验,结果均为P<0.05 P值越小,则获得的结论是。

A 两样本均数差别越大 B 两总体均数差别越大 C 越有理由说两总体均数不同 D 越有理由说两样本均数不同 E 越有理由说两总体均数差别很大 6 在两样本均数比较的t检验中,无效假设是_____。 A两样本均数不等 B 两样本均数相等 C 两总体均数不等 D两总体均数相等 E样本均数等于总体均数 7.要评价某市一名12岁男孩的身高是否偏高或偏矮,应选用的统计方法是。 A 用该市8岁女孩身高的95%或99%正常值范围来评价????????? B 作身高差别的假设检验来评价 C 用身高均数的95%或99%可信区间来评价 D 不能作评价 E 以上都不是 H是_____。 8.两个独立样本秩和检验时的 A 两样本秩和相等 B 两总体秩和相等 C 两总体均数相等 D 两总体分布相同 E 两总体分布没有关联 9.在配对设计数值变量资料的对比分析中,配对的目的是为了。 A 提高测量精度 B 操作方便 C 应用t检验 D 提高组间可比性 E 减少实验误差 10.配对t检验中,用药前的数据减去用药后的数据与用药后的数据减去用药前的数据,两次t检验的结果_____。 A t值符号相反,但结论相同 B t值符号相反,结论相反 C t值符号相同,但大小不同,结论相反 D t值符号相同,结论相同 E 结论可能相同或相反 11. 总体是由组成的。 A 部分个体 B 全部个体 C 相同的观察指标 D 全部研究对象 E 同质个体的所有观察值 12.关于构成比,不正确的是。 A 构成比中某一部分比重的增减相应地会影响其他部分的比重 B 构成比说明某现象发生的强度大小

统计学复习题1要点

第一章绪论 一、填空 1、统计数据按测定层次分,可以分为分类数据、顺序数据和数值型数据;如果按时间状况分,可以分为截面数据和时间序列数据。 2、由一组频数2,5,6,7得到的一组频率依次是0.1 、0.25 、0.3 和0.35 ,如果这组频数各增加20%,则所得到的频率不变。 3、已知一个闭口等距分组数列最后一组的下限为600,其相邻组的组中值为580,则最后一组的上限可以确定为640,其组中值为620 。 4、如果各组相应的累积频率依次为0.2,0.25,0.6,0.75,1,观察样本总数为100,则各组相应的观察频数为___20 5 35 15 25___。 5、中位数e M可反映总体的集中趋势,四分位差D Q.可反映总体的离散程度,数据组1,2,5,5,6,7,8,9中位数是 5.5,众数为 5 。 6、假如各组变量值都扩大2 倍,而频数都减少为原来的1/3 ,那么算术平均数扩大为原来的2倍。 四、计算题 1、某班的经济学成绩如下表所示: 43 55 56 56 59 60 67 69 73 75 77 77 78 79 80 81 82 83 83 83 84 86 87 88 88 89 90 90 95 97 (1)计算该班经济学成绩的平均数、中位数、第一四分位数、第三四分位数(2)计算该班经济学成绩的众数、四分位差和离散系数。 (3)该班经济学成绩用哪个指标描述它的集中趋势比较好,为什么? (4)该班经济学的成绩从分布上看,它属于左偏分布还是右偏分布? (3)上四分位数和下四分位数所在区间? 4、对成年组和青少年组共500人身高资料分组,分组资料列表如下: 成年组青少年组按身高分组(cm) 人数(人) 按身高分组(cm) 人数(人) 150~155 155~160 160~165 165~170 22 108 95 43 70~75 75~80 80~85 85~90 26 83 39 28

统计学原理计算题

一、时间序列: 1.某公司某年9月末有职工250人,10月上旬的人数变动情况就是:10月4日新招聘12名大学生上岗,6日有4名老职工退休离岗,8日有3名青年工人应征入伍,同日又有3名职工辞职离 岗,9日招聘7名营销人员上岗。试计算该公司10月上旬的平均在岗人数。 解: 1.2562 12232 2591252225822623250=++++?+?+?+?+?= = ∑∑f af a 要求:(1)具体说明这个时间序列属于哪一种时间序列。 (2)分别计算该银行2001年第一季度、第二季度与上半年的平均现金库存额。 解: 2.(1)这就是个等间隔的时点序列 (2)n a a a a a a a n n 22 13210++++++=-K 第一季度的平均现金库存额: )(4803 2520 4504802 500万元=+ ++=a 第二季度的平均现金库存额: )(67.5663 2580 6005502 500万元=+ ++=a 上半年的平均现金库存额: 33.5232 67 .566480,33.52362580 6005504802 500=+==+ ++++=或K a 答:该银行2001年第一季度平均现金库存额为480万元,第二季度平均现金库存额为566、67 万元,上半年的平均现金库存额为523、33万元、 要求计算:①第一季度平均人数;②上半年平均人数。 解: 第一季度平均人数: )(10322 1221020 10501210501002人=+?++?+=a 上半年平均人数:

10233 21321008 102022102010501210501002=++?++?++?+=a 解: 解:产品总产量 ∑=+++++=)(210005000040003000400030002000件a 产品总成本 ∑=+++++=)(1.1480.346.279.214.286.216.14万元b 平均单位成本)/(52.70210001.148件元件 万元 总产量总成本= = ∑∑∑a b c 或:平均单位成本)(52.706 2100010000 61 .148万元=?= =a b c 答:该企业2001年上半年的产品平均单位成本为70.52元/件。 要求:(1)计算并填列表中所缺数字。 (2)计算该地区1997—2001年间的平均国民生产总值。 (3)计算1998—2001年间国民生产总值的平均发展速度与平均增长速度。 解: (1)计算表如下: 某地区1996--2000年国民生产总值数据 (2) )(88.545 9.61585.6811.459.40万元=++++== ∑n a a

2医学统计学试题及答案

第一套试卷及参考答案 一、选择题(40分) 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图C线图D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是(A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用(A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6. 男性吸烟率是女性的10倍,该指标为(A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同B两总体均数是否不同 C两个总体均数是否相同D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是(D ) (A)n1+ n2 (B)n1+ n2–1 (C)n1+ n2 +1 (D)n1+ n2 -2 10、标准误反映(A ) A 抽样误差的大小 B总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度 11、最小二乘法是指各实测点到回归直线的(C) A垂直距离的平方和最小B垂直距离最小 C纵向距离的平方和最小D纵向距离最小 12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验的t值为t r,对回归系数检验的t值为t b,二者之间具有什么关系?(C) A t r>t b B t r

应用统计学

应用统计学课程教学大纲 课程代码:(与教学计划课程代码一致) 课程类型:适用专业: 总课时数:学分: (注:课程类型是指通识教育、专业必修、专业选修、教师教育、实践课程、其它课程) 一、课程教学的目的和任务 1.统计学是各大专院校经济管理类专业不可或缺的一门专业基础课程。学习的任务和目的是人们要从事经济研究和各种社会经济管理活动,都应该学会运用统计工具,掌握基本的统计理论和方法,才能做好工作。 2.应用统计学可以从实际出发,运用案例讲故事式地阐明统计理论和方法。在内容上包括描述统计方法、推断统计方法以及社会经济、管理中常用的一些统计方法;在写法上与计算机紧密结合,大部分统计方法都给出了Excel的具体操作方法与数据分析结果的解析;在编排上把Excel在统计学中的应用集中在第11章阐述,保证了应用统计学理论学习的连贯性。 3.应用统计学的基本要求是使考生掌握如何应用统计学的概念与方法来解决社会经济中的各种问题。 二、教学内容纲要 1教学内容及学时分配. 应用统计学的基本要求是使考生掌握如何应用统计学的概念与方法来解决社会经济中的各种问题。

2. 教学内容的基本要求,教学的重点、难点 一绪论 基本要求:要求学生学习统计的含义,统计学的研究对象 及其特点,统计学的应用——在经济 研究和管理中的应用,统计学的基本范畴,描述统计与推断统计,计算机在统计中的应用。 重点:1统计学的应用 2统计学的的基本范畴 3描述统计与推断统计

4计算机在统计中的应用。 难点:1统计学的的基本范畴 2计算机在统计中的应用 二数据与数据收集 基本要求:要求学生学习数据,数据的收集,原始数据的收集,次级数据的收集 重点:1数据的测量尺度 2数据的收集 3次级数据的收集 难点:1数据的测量长度 2次级数据的收集 三数据整理 基本要求:要求学生学习数据的整理,数据整理结果的描述统计指标,数据整理结果的描述: 统计表和统计图 重点:1数据汇总 2统计指标 3数据整理结果的描述 统计表和统计图 难点:1统计指标 2数据整理结果的描述 统计表和统计图 四数据分布特征的度量

统计学复习提纲(考查)9

统计学复习提纲 一、单选题 1.一项调查表明,在所抽取的1000个消费者中,他们每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价格便宜”。这里的参数是(C )。 A.1000个消费者 B.所有在网上购物的消费者 C.所有在网上购物的消费者的平均花费 D.1000个消费者的平均花费 2.为了调查某学校学生的购书费用支出,从男生中抽取60名学生调查,从女生中抽取40名学生调查,这种抽样方法属于( D )。 A.简单随机抽样 B.整群抽样 C.系统抽样 D.分层抽样 3.某班学生平均成绩是80分,标准差10分。如果已知该班学生的考试分数为对称分布,可以判断考试分数在70-90分之间的学生大约占(C )。 A. 95% B.89% C.68% D.99% 4.已知总体的均值为50,标准差为8,从该总体中随机抽取容量为64的样本,则样本均值的期望和抽样分布的标准差分别为( B )。 A. 50,8 B. 50,1 C. 50,4 D. 8,8 5.根据某班学生考试成绩的一个样本,用95%的置信水平构造的该班学生考试分数的置信区间为75-85分。全班学生的平均分数(B ) A.肯定在这一区间内 B.有95%的可能在这一区间内 C.有5%的可能在这一区间内 D. 或者在区间内,或者不在。

6.一项研究发现,2000年新购买小汽车的人中有40%是女性,在 2005年所做的一项调查中,随机抽取120个新车主中有57认为女性, 检验2005年薪车主中女性的比例是否显著增加,建立的原假设和备 择假设为( C ) A. H 0: π=40%,H 1: π≠40% B. H 0: π≥40%,H 1: π<40% C. H 0: π≤40%,H 1: π>40% D. H 0: π<40%,H 1: π≥40% 7.在回归分析中,因变量的预测区间估计是指( B )。 A. 对于自变量x 的一个给定量x 0,求出因变量y 的平均值的区间 B. 对于自变量x 的一个给定量x 0,求出因变量y 的个别值的区间 C. 对于自变量y 的一个给定量y 0,求出自变量x 的平均值的区间 D. 对于自变量y 的一个给定量y 0,求出自变量x 的个别值的区间 8.在多元线性回归分析中,如果F 检验表明线性关系显著,则 意味着( A ) A. 至少有一个自变量与因变量之间的线性关系显著 B. 所有自变量与因变量之间的线性关系显著 C. 至少有一个自变量与因变量之间的线性关系不显著 D. 所有自变量与因变量之间的线性关系不显著 9.如果时间序列的逐期观察值按一定的增长率增长(即增长的增 长)或衰落,则适合的预测模型是( D )。 A.移动平均模型 B.指数平滑模型 C.线性模型 D.指数模型 10.设p 为商品价格,q 为销售量,则指数∑∑ 0010q p q p 的实际意义是综 合反映了( C )

相关文档
最新文档