中医药统计学 第一章

中医药统计学 第一章
中医药统计学 第一章

表1-1 ××病感染按性别、年龄整理表(问题表) 性别 年龄(岁) 合计 男 女 0~ 5~ 10~ 15~ 调查人数

感染人数

表1-2 ××病感染按性别、年龄整理表(正确表) 年龄组 男 女 调查人数 感染人数 调查人数 感染人数

0~ 5~ 10~ 15~ 合计 第一节 中医药统计学的意义和内容

中医药统计学(Statistics for Traditional Chinese Medicine )是将数理统计的原理和方法应用于生物医药特别是中医中药科研,收集、整理和分析资料,推断和表达不确定现象客观数量规律的一门应用学科。

中医药统计学的主要内容包括统计学基本理论和统计分析方法,统计分析方法包括统计设计(statistical design )、统计描述(statistical description )和统计推断(statistical inference ),表达因素间的关系、生存分析、多元分析等。

例如,表1-1,由于将性别与年龄这两个有联系的项目分割开来,计算不出不同性别、年龄的感染率,丧失了有价值的信息,为了克服上述缺点,应采用表1-2的整理表。又如,第

六章例6-1表6-2两种疗法的疗效资料,治愈

率按治愈数/治疗数计算,从病情重、中、轻三种情形来看,都是甲疗法治愈率低于乙疗法。但是,合计起来却是乙疗法治愈率低于甲疗法。不作统计处理,就不能得到正确的疗效结论。再如,第九章例9- 表9- 资料,怎样判断降压宁的疗效,需要一定的理论和方法,才能从

表9- 的观测数据推理到任何高血压患者服用

降压宁后的疗效。因此,国家中医药管理局规

定,未经统计处理的数据是无效数据。 中医药科研的基本步骤包括立题,设计,实施试验,收集整理分析试验所得信息和资料,均需用到中医药统计学的思维和方法。我国的《药品注册管理办法》规定,新药临床试验必须自始至终有统计学人员参与;生物医药实验室研究、临床研究和医药公共事业管理都要寻求统计学家的帮助。都说明统计学思维和方法已经渗透到医药研究和管理决策之中。中医药统计学是现代医药科研定量分析的重要工具,是认识中医药数量规律的必备知识。

第二节 统计学的几个概念

1.总体与样本 总体是根据研究目的确定的性质相同的研究对象的全体(population )。个体(individual )是总体的基本单位(Case )。根据不同的研究目的,个体可以是一个人、

一个家庭、一个地区、一只大白鼠、一个检测样品等。没有个体,总体就不存在;没有总体,也就无法确定个体。总体又有有限总体和无限总体,有明确范围(如空间、时间)限制,个体数有限的总体称有限总体。不易划分确切范围,个体数无限的总体称为无限总体。

同一总体的个体之间总是存在差异,称为个体差异(individual variation),简称变异(variation)。变异是客观存在的,由不确定因素引起的,具有偶然性的随机误差(random error s)。例如,同为正常发育的10岁男孩,各人身高有不同;又如,病情相同的患者服用相同的药物,其疗效也不尽相同。总体所要求的同质是指同一总体中的个体大同小异。总体的性质特征由其各个个体的性质而定,要研究总体的性质或特征,须对它的个体进行观测,由于有个体差异,最好是对每个个体都加以观察。但是,这样做要花费很大的人力和财力,而且有时是不允许的,例如带有破坏性的药品检验不可能逐一进行。中医药统计学是通过对变异的研究,探索中医药随机现象内在规律的一门科学。

样本(sample)是从总体中抽取的部分个体。样本中所包含的个体数目即样本例数,称为样本含量(sample size)或样本大小、样本量。从总体中抽取样本的过程称为抽样(sampling),抽样的目的是用样本推断总体,所以样本要有足够的样本含量及可靠性、代表性。样本含量应在统计设计时进行估计。样本的可靠性是指样本中每一个观察单位是否确属于既定的同质的总体。同质应考虑时间、空间、非实验因素的干扰、诊断标准等条件尽量相同。样本的代表性是指样本是否能充分反映总体的真实情况。为得到有代表性的样本,要求抽样和分配必须遵循随机化(randomization)的原则,使总体中的每个个体都有同等的机会被抽到和分配,不受研究者的主观意愿或客观无意识的偏性影响。

2.参数与统计量、抽样误差刻画总体特征的指标称为总体参数(parameter),参数一般用小写的希腊字母表示,如用μ表示总体均数、σ表示总体标准差,ρ表示总体相关系数等。

在抽到样本含量为n的一个样本以后,样本中n个个体的观察值是n个具体的数值。通过对样本数据进行统计分析所产生的样本统计指标称为统计量(statistical variable)。统计量是不包含任何未知参数的样本观测值的函数,一般用英文字母表示。样本统计量是统计推断的基础,可用来估计总体参数。

由于总体中的个体存在差异,在抽样过程中,即使从同一总体中随机抽取含量相等的若干样本,各样本统计量(如样本均数或率)相互间会有所不同,这些样本间的差异同时反映了由样本算得的统计量与相应总体参数的差异,由随机抽样造成的样本统计量与相应总体参数的差异称为抽样误差(sampling error)。例如,从某一总体中,随机抽取样本含量为n的样本,算得样本平均数x,用来估计总体平均数μ。但μ与x有差异,这种差异是由于抽样误差造成的。因为个体差异客观存在,所以抽样误差是不可避免的。

3.概率与频率对某项变异进行观察或测量得到的指标称为变量(variable)。变量的观察结果称为变量值(value of variable)或观察值(observed value)。由观察值构成资料(data)。统计学中研究的变量是随机变量(random variable),具有特性:①在一次观察下,取值具有不确定性。②在大量重复试验中,变量的各种可能取值发生的可能性具有一定的统计规律。

概率(probability)和频率(frequency)都是反映某一随机变量发生的可能性大小的数值。

若事件A在n次独立重复试验中发生了f次,则称f为频数(counts),称比值f /n为事件A在n次试验中出现的频率或相对频数(relative frequency)。医药工作中通常所说的有效率、治愈率等都是频率。显然,0≤f / n≤1。频率是统计量,反映是样本的性质,刻划样本中事件出现的可能性大小,样本不同,其值也不同,具有偶然性。

随着试验次数增多,频率呈现出稳定在一个确定常数的特征。频率的稳定性说明随机事件出现的可能性是事物本身固有的一种客观属性。

概率常用P表示。概率的统计定义:频率所稳定的常数称为概率。概率P值介于0与1之间。必然事件的概率为1,不可能事件的概率为0。概率越接近1,表明其发生的可能性越大,概率越接近0,其发生的可能性越小。

概率反映总体的性质,划的是总体中随机事件出现的可能性大小,一个随机变量A发生的概率是一个参数,具有必然性,是一种客观存在。当样本量n够大时,可用频率作为概率的估计值。由频率认识概率,体现了由样本认识总体的基本思想。

4.概率分布与抽样分布任何一个随机变量各种可能取值的概率之和恒为1。一个随机变量各种可能取值发生的概率所呈现的统计规律,称为该随机变量的概率分布(probability distribution),简称分布(distribution)。概率分布由随机变量各可能的取值与其对应的概率共同构造,完整地刻划随机变量的统计规律性。常用的分布模式:连续型变量常用正态分布,离散型变量常用二项分布、Poisson分布。

总体中有很多个体,究竟哪些个体在抽样中被抽到,要依机会而定,因此,样本是随机变量,因统计量是依赖于样本的,故统计量也是随机变量,所以就有一定的概率分布,统计量的概率分布又称为抽样分布。常用的抽样分布有样本均数的分布、 2分布、t分布、F分布。在统计推断中,抽样分布充分发挥着主要作用。统计学研究的基本方法是通过样本构造统计量,再通过抽样分布的规律,对样本来自的总体进行分析和推断。

5.统计描述与统计推断统计描述(statistical description)和统计推断(statistical inference)是统计分析(statistical analysis)的主要内容。

统计描述是对原始资料的一种概括,作用是刻画数据的分布形态,计算数据的集中趋势、离散趋势、分布的形态和范围等有特征意义的少量统计指标,利用统计表和统计图给予正确的表达(见第二十八章第二节)。

统计推断包括参数估计(parameter estimation)与假设检验(hypothesis testing ),是在考察和表明抽样误差的前提下,推断总体特征,为研究者下专业结论时提供科学的依据。

统计描述和统计推断两者常需结合使用。

第三节医药统计中的变量及资料类型

一、医药统计中的变量类型

变量的分类方法很多,按取值的结果可分为离散(discrete)和连续(continuous)两型。

离散型变量取值为有限个或可列无穷多个。例如采用某新疗法对10名病人进行试治,其治愈、好转、无效的人数为可列整数值,可能取值为0,1,…,10中的一个数,具有不连续性,为离散型变量。医药统计学中的分类资料都是离散型变量的取值。

连续型变量的可取值为某一区间的任何数值。例如,从同一批号规格为每袋重12克的玉叶解毒冲剂中任抽一袋称重,其重量可能是12.1g ,11.9 g…;7岁男孩的身高可能是120.0cm ,也可能是119.5cm 、…,等,这类变量的可取值充满某一个区间,具有连续性。

原始资料中的变量,按在统计分析中所起的作用可分为标识变量(identifiers variable )和分析变量(construe variable )。标识变量如“编号”、“姓名”,主要用于数据管理,包括数据的核对与增删等,是研究记录中的重要内容,但不是随机变量。分析变量又分为自变量和因变量,是数据分析的主要内容。因变量也称应变量,即反应变量(response variable ),是研究的观测指标,其取值受自变量的影响而具有随机性。自变量(independent variable )是影响应变量的变量,常为试验因素(即处理因素、干预因素)、分组变量(between groups variables )等。与应变量有关的影响因素称为协变量(covariate ),属于自变量。

变量按按观测方法和来源的分类,见图1-1。

二、医药统计中的资料类型

对应于变量按观测方法和来源的分类,医药统计资料的类型见表1-3。

1.定量资料(measurement data ) 又称数值资料(numerical data )或尺度资料(scale data ),

是对观察对象测量指标的数值大小所得的资料,观察指标是定量的,表现为数值大小。

2.分类资料(categorical data ) 将研究因素按属性类别或档次分组,清点各组个体的个数(频数),将分类变量的分组标志及各组频数同时给出,便得到了分类资料。分类资料有

??

??????量的变量)级变量(用顺序尺度度有序分类变量,亦称等量的变量)义变量(用名义尺度度无序分类变量,亦称名分类变量度量的变量用等距尺度或比例尺度量或尺度变量定量变量,亦称数值变)( 图1-1 变量按观测方法和来源的分类

表1-3 医药统计资料的类型及其特点

资料类型 特 点 变量类型

实 例 定量资料

(数值变量资料)

每个个体都能观察到一个观察指标的数值,有度量衡单位 连续型或离散型,数值变量 身高(cm ),体重(kg ), 细胞数(个),人口数(人) 分类资料

每个个体的观察结果是属性或分类,不是数值,清点各属性或分类中个体的个数,才得出分类资料的数据 离散型 无序分类资料

(计数资料)

每个个体观察结果的属性或分类间无大小顺序之分。二分类时为对立的两类属性,多分类时为不相容的多类属性,类与类之间界限清楚,不会错判。 离散型 名义变量 性别(男,女)为二分类; 血型(A 、B 、O 、AB )为多分类 有序分类资料

(等级资料) 多分类,按程度、挡次等级顺序分别计数,各等级之间有程度的差别,按大小

顺序排列。每个观察单位无确切定量。 离散型 顺序变量

疗效(痊愈,好转,有效,无效)

无序分类和有序分类两种:

(1)无序分类资料(unordered categorical data):又称计数资料(enumeration data)。无序分类资料的属性或类型互斥,无次序之分。根据属性或类型分组的多少又可分为两种:①两分类资料:它是将观察单位按两种对立的属性分类,如按死亡和生存、治愈和未愈、有效和无效等两种分类计数。②多分类资料:它是将观察单位按多种互斥的属性分类,清点各类观察单位的个数,如血型按A、B、AB、O四种分类计数。

(2)有序分类资料(ordered categorical data):将观察单位按某种属性的不同程度、档次或等级顺序分类或分组后,清点各顺序分组的观察单位数所得的资料为有序分类资料,亦称等级资料(ranked data)。例如,化验结果按-,+,++,+++分组计数等,虽有档次或等级的差别,可以用X=0,1,2,3等区别表示,等级之间的差别并非确切定量差别,可以是量的差别,也可以是质的差别,给人以“半定量”的概念,故又称半计量资料。

根据分析研究的需要,定量资料可以转化为分类资料,定量资料和有序分类资料可以互相转化,例如,白细胞计数属于定量资料值;如果按白细胞总数正常与不正常分为两组,然后清点各组人数,便成为两分类资料值了;如果按白细胞总数过高、正常、低下分为三组,然后清点各组人数,就成为有序分类资料值了;将有序资料的各个类别分别赋予一个合适的数量,可转化为定量资料,例如,将不咳嗽,轻度咳嗽,中度咳嗽,重度咳嗽的4个等级分别赋予0,1,2,3得分,就量化了。须指出的是:无论是有序分类资料或转化为定量资料,存在如何变换才合理的问题,例如,上面说的咳嗽4个等级,可以分别赋予0,1,2,3的得分,也可以分别赋予0、1、3、6的得分。研究者可依据自身的经验判断作出不同的变换,也可采用等级(秩)得分或Ritdit得分的方法赋值。多元分析中,定性指标和等级指标的数量化方法见第十七章。

医药统计中的资料除按观测方法和来源分为定量和分类资料之外,对呈周期性变化规律或表示在圆周上位置特点的资料,称为圆分布资料;随访慢性病例或保健对象远期效果的资料,常有未达到预定观察终点的不完全数据特点,称为随访资料;等等。

对任何一份资料进行统计分析之前,首先要分辨其资料类型和数据特点,因为不同类型的资料,统计分析方法有不同。

第四节统计工作的基本步骤

统计工作分为设计,收集资料,整理资料,分析资料四个基本步骤:

1.设计(design)就是制定完成科研目标的技术路线和实施方案。

医药研究从不同的角度有不同的分类:按从研究设计的角度分类,研究目的可分为验证性研究与探索性研究。按设计的依据、目的、内容不同,可分为专业设计与统计设计(见表1-4);按研究指标的多少可分为单因素研究与多因素研究;按研究的对象可分为以“正常”人群为基础的社区干预试验,以病人为基础的临床试验和以动物或其他实验材料为基础的动物实验;按对研究对象是否施加干预,可以分为实验性研究与观察性研究(其设计见第二、十

二、二十六章)。从统计学角度说,研究设计的基本内容包括:选题和立题,确定设计类型,确定研究总体及样本,拟定观察指标及测量方法,资料的可靠性及质量控制,数据的管理及统计分析计划等。医药论文中的统计学处理应交代统计设计的名称和主要做法。

2.收集资料 收集资料,即取得准确可靠的原始资料,是统计分析的前提与基础。资料

收集必须严格按科研设计方案,及时、准确、完整、清楚、统一收集,要注意防止误差及偏倚影响观察结果的精确性,确保统计资料的科学性和可靠性。例如随机抽样,要注意审查样本是否从同质总体中随机抽取,样本含量是否适当,资料是否完整,数据是否准确,是否是同时期的资料,诊断标准和疗效判断标准要有科学依据并要求统一,避免研究者的主观偏见。

3.整理资料 整理资料是将原始资料进行科学加工,去粗取精,去伪存真,使之系统化、条理化,便于进一步计算统计指标和分析。整理资料包括:①对原始数据进行逻辑和计算审核。②设计分组,包括质量分组(如病人按性别、职业、病情轻重分组)和数量分组(如按年龄、体重、身高分组)两种,往往结合使用,一般是在质量分组基础上进行数量分组。分组的原则是合理,具有同质性,先细后粗,先分后合。③拟订整理表。整理表是统计表的前身,是过渡性表格,作归纳汇总用。宜尽量把整理表设计成复合表及相关表,以免漏掉两指标间存在的相关信息。④编制统计表。

整理资料存在的问题主要表现在:① 编制整理表时,未将有联系的项目安排适当,不便说明事物之间相互的规律性。如表1-1,应改用表1-2的整理表。② 分组不合理;③ 有意将过高或过低数据筛选掉或无意舍弃掉,使原始资料所提供的信息变样;④ 统计表编制不规范(例见第二十六章表26-5)。

4.分析资料 分析资料是指进行统计描述和统计推断。常见的问题有:抽样研究未作统计检验,只凭表面数据大小即下结论;统计分析方法的选择不当或统计方法交待不清;对有关联事物的分析提不出数据,找不出规律;将偶然因素当作因果分析;忽视对比条件,未作标准化处理;将构成比当作率分析;发病率与患病率相混淆,死亡率与病死率相混淆等。

统计工作的四个基本步骤是互相联系,不可分割的,任何步骤的缺陷都将影响统计工作的效果。

强调指出:统计工作必须持严肃认真,实事求是的科学态度。反对伪造和篡改统计数据。

表1-4 专业设计与统计设计对比

专 业 设 计

统计学设计 依据

运用现代科学技术与医药专业知识进行设计 运用数理统计的原理和方法进行设计 目的 主要解决调查或实验观察结果的创新性、先进

性和应用性

主要解决抽样误差的问题,保证样本的代表性和组间的可比性,实现调查或实验观察结果的可靠性、科学性、可重复性和经济性 意义 专业是基础,专业设计方法因课题而异,是科

研创造性与学术水平的决定因素。

统计学设计有效地控制误差和提高检验效率,是保证专业设计布局合理性和科研结果可靠性的关键。 内容

①选择研究题目;

②明确观察指标及研究方法;

③确定诊断标准及观察对象 ①对照形式;②选择调查或实验的设计方案;③随机抽样和均衡分配;④样本含量及抽样误差大小的估计;⑤盲法

第五节关于统计软件的说明

一、关于统计软件的使用

统计软件能迅速完成统计的复杂计算。一般说来,使用统计软件,需要掌握“分析方法、数据格式、读取结论”三个方面的基本技能。只学会统计软件的操作方法,并不见得就会进行数据的统计处理,因为无论统计方法是否正确选择,无论数据格式是否满足运算要求,只要录入数据,统计软件都会输出一大堆计算结果。如果用统计软件乱套计算一通后,随意地从计算结果中挑出一部分感兴趣的东西,由此得出的统计结论缺乏科学性,统计就失去了意义。

本书同步介绍国际通用统计软件SPSS17.0、SAS8.0和国产优秀统计软件DPS11.0企业版,并指出最常见的操作错误。不同的统计软件,由于设计不同,在计算结果的精度、输出图表的精美、数据录入的简繁、操作方法的难易等4个方面不尽相同。学习和了解多种统计软件的使用,至少有以下好处:①可以通过这4个方面的对比,使我们更好地将统计软件用于中医药的科研和实践;②可以实际练习熟练运用统计方法,提高数据处理技能;③可以帮助摆脱对单一软件的过分依赖,防止科研工作中的造假作伪。

二、统计软件说明

为简便计,本书在说明统计软件的操作方法时:

采用“→”表示用“用鼠标左键点击”的操作;用户界面的名称用仿宋体小5号表示,变量名称和输入输出结果用Arial体小5号表示;用系统默认选项时一般不再写出。

三、SPSS17.0简介

SPSS(Statistical Product and Service Solution,统计产品与服务解决方案)由美国SPSS 公司开发。SPSS能用菜单操作完成大多数统计分析,具有操作简单、输出美观的优点,是非专业统计人员的首选软件。最新版本SPSS17.0,最大改进是可以互相切换英文与简体中文的用户界面。SPSS17.0可以在Windows Vista或XP下安装,下面简要介绍SPSS17.0。

(一)数据编辑器

→开始菜单→程序→SPSS Statistics 17.0,或双击SPSS17.0安装文件夹下的statistics.exe,或在桌面创建SPSS17.0的快捷方式,均可以启动SPSS17.0。

【例1-1】对SPSS17.0设置简体中文的输出结果和用户界面:启动英文界面的SPSS,→Edit(编辑)→Options(选项)→General(常规),→Output(输出)→Language(语言)→Simplified Chinese(简体中文),→User Interface(用户界面)→Language→Simplified Chinese,→OK。

类似操作,可以切换回英文用户界面。设置简体中文的用户界面后,启动SPSS17.0打开简体中文界面的数据编辑器,数据视图与变量视图可以互相切换,状态栏显示“SPSS Statistics处理器已就绪”,见图1-2。

1. 数据视图 数据视图用来输入和编辑数据,顶部是菜单栏和工具栏,中部是工作表。 菜单栏或工具栏,可以选择命令完成操作。菜单栏的命令后面标记圆点表示有对话框,标记箭头表示有下拉菜单。对话框中,主要功能按钮有:确定(执行操作),粘贴(将命令复制到语法编辑器),重置(重新设置),取消(取消操作),帮助(帮助信息)。→文件→新建或打开→数据,可以打开新的数据编辑器,新建或打开已有的数据文件。在多个数据编辑器打开时,可以通过任务栏的图标切换当前数据编辑器。

工作表,可以指定单元格直接输入数据,也可以从Word 、Excel 文档复制、粘贴数据。工作表每一列为一变量,每一行为一个案(记录)。工作表上方的当前坐标栏以“个案编号:变量名”显示当前单元格的位置,当前数据栏显示当前单元格的值。左右及上下滚动条,可以移动工作表。

2. 变量视图 变量视图用来定义和修改变量的名称、类型、宽度、小数、标签、值、缺失、列、对齐、度量标准等10项属性。

名称、标签分别是变量名与别名,可以在该列的单元格直接键入或粘贴输入。名称的首字符必为字母或汉字(低版本不能超过8个字符)。名称不能用空格或“!” 或“?” 或“*”,不能用SPSS 的关键字ALL 、AND 、BY 、EQ 、GE 、GT 、LE 、L T 、NE 、NOT 、OR 、TO 、WITH ,不能以“_”、“.”结尾。若不定义名称,则系统依次默认为“var 00001”、“var 00002”、…。

类型、值、缺失分别是变量类型、取值说明(标签)、缺失值。点击该列的单元格时,其右侧会出现灰色按钮,点击它,弹出对话框,可以选择数值(系统默认)、科学记数法、字符串等8种类型,设置值标签,定义缺失值。

宽度、小数、列分别是变量的宽度、小数位、显示的列宽,系统默认数值型变量的宽度为8位、小数为2位,列为8位。点击该列的单元格时,其右侧会出现上下双向箭头,点击一次可以增加或减少1位。

对齐、度量标准分别是变量的对齐方式、度量标准。点击该列的单元格时,其右侧会出现下拉箭头,可以选择左、右、居中三种对齐方式,度量、有序、名义三种度量标准。

3.数据文件 在数据视图输入数据,在变量视图定义属性,形成数据集。可以由编辑菜单、数据菜单或转换菜单的各命令进行编辑,可以用分析菜单、图形菜单进行统计分析,可以存为“.sav ”文件,称为数据文件。

图1-2 简体中文界面的数据编辑器数据视图与变量视图

图1-3 SAS8.0窗口

数据集编辑操作中,常用的有:

→编辑菜单→插入变量、或插入个案,即产生一新的变量列或产生一个新的记录行。

→数据菜单→排序个案、或转置、或加权个案,可以指定变量升序或降序,将原始数据的行与列进行互换,指定列联表资料分析的频数变量。

→转换菜单→计算变量,按表达式计算变量值,建立新变量或替换原变量。

值得注意的是,SPSS17.0的结果文件,扩展名为“.sp v ”,与低版本的“.sp o ”不兼容。结果及图形,可以粘贴或选择性粘贴到Word 文档中保存。

(二)语法编辑器

语法编辑器用于显示和编辑SPSS 语句,每个语句以点号结束,关键字可以缩写为前3个字符。完成某一任务的多个语句,可以保存为“.sys ”程序文件。SPSS 程序可以在SPSS 关闭后把菜单操作保存下来,可以简化重复操作,还可以完成菜单操作无法实现的一些任务。

在SPSS 的数据编辑器,打开语法编辑器的方法有;

(1)菜单操作完成,不击确定按钮,而是击粘贴按钮,打开语法编辑器把菜单操作翻译为SPSS 语句。

(2)→文件→新建或打开→语法,打开新的语法编辑器,新建或打开已有的SPSS 程序。

(3)→编辑→选项→常规→在启动时打开语法窗口,可以在启动时自动打开语法编辑器。 在打开多个语法编辑器时,可以通过任务栏的图标切换当前语法编辑器。

四、SAS8.0简介

SAS (Statistical Analysis System ,统计分析系统),由美国SAS 公司编制。最新版本为SAS9.0,在《SAS 统计软件》中介绍。SAS 具有权威地位,美国FDA 新药审批程序规定,统计处理只能使用SAS ,其它软件处理无效。SAS 只有程序方式,但功能强大、编程简单,受到科研人士的欢迎。SAS8.0可以在Windows Vista 或XP 下安装,下面简要介绍SAS8.0。

→开始菜单→程序→The SAS System

for Windows V8,或双击SAS8.0安装文件

夹的sas.exe ,或在桌面创建SAS8.0的快

捷方式,均可以启动SAS8.0,见图1-3。

1.SAS8.0窗口 SAS 窗口由标题

栏、菜单栏、两个工具栏以及五个工作区组

成。五个工作区,是窗口左部的Explorer

(资源管理器,用于文件管理)和Results

(结果,计算结果的分层结构),右部的

Log (日志,程序运行的纪录)、Output (输出,显示计算结果)和Editor (编辑器,显示和编辑程序)。 鼠标点击窗口底部任务栏的最小化图标,或于窗口的菜单选定工作区名称,或按功能键F5、

F6、F7,都可以转换当前工作区。当前工作区激活后,其标题栏显示出最小化按钮“-”、最大化按钮“□”、关闭按钮“×”。各工作区的大小与排列方式,可以用窗口的菜单改变,也可以用鼠标拖动边框改变。工作区关闭后,可以用View(查看)菜单打开。

工具栏的左部是输入命令工具栏,右部是常用命令工具栏。输入命令工具栏用于输入立即执行的命令,如输入“assist”并选择确定按钮“∨”,即转换到菜单界面模块。常用命令工具栏用于实现SAS菜单常用命令的功能,如Open、Save、Submit。

→File菜单→Exit(退出),或标题栏关闭按钮“×”,或于输入命令工具栏键入“bye”并选择确定按钮“∨”,均可以关闭SAS系统。

2.SAS程序SAS程序由SAS语句组成,通常可以分为数据集和过程两部分。SAS语句以分号结束,命令字、参数字均为固定的英文词,大小写不论,称为关键字。

数据集就是为分析准备的数据,需要确定数据集名称、适当的变量并输入数据。SAS程序常用赋值、读入、循环三种方式输入数据。

赋值方式,是使用赋值语句把表达式的值输入给变量。赋值语句格式为

变量=表达式;

读入方式,是使用input输入语句读入多个变量的多个值。数据语句以datalines(或cards)为起始行,以分号为结尾行,中间以空格分隔多个变量的值。多个变量的每一组值称为一个记录,一个记录排列一行时,输入语句的变量后不用@@;多个变量的多个记录排列到一行时,输入语句的变量后必须用@@;@@称为不分行符。输入语句及数据语句的格式为

input变量变量@@;

datalines;

数据数据

;

循环方式,是使用循环语句读入变量的多个值。循环变量从初值开始,每次加上增量,只要不超过终值,就执行循环体语句。循环体最后一个语句,用输出语句output保存数据。循环变量超过终值时,执行end下面的语句。循环语句的格式为

do 循环变量=初值to 终值by增量;

循环体语句;

output;

;

过程也称为子程序,是SAS的分析模块,使用proc(procedure,过程)调用、并用run 返回调用处或结束程序。多次调用过程,前面的run可以省略。过程的使用格式为

proc 过程名data=数据集名; 该过程的专用语句描述;

var 变量序列; where 条件表达式; by 变量序列; run;

在Editor为当前工作区时,→File(文件)菜单→New(新建)或Open(打开),可以打开新的Editor,新建或打开已有程序。→File菜单→Save(保存)或Save As(另存为),可以把当前Editor 程序存为“.sas”文件。→Edit(编辑)菜单→Cut(剪切)、Copy(复制)、Paste(粘贴),可以实

图1-4 DPS11.0窗口 现程序块的编辑。→Run (运行)菜单→Submit (提交),或点击工具栏的Submit 按钮,均可以运行当前Editor 程序。

程序执行后,若有错误,则在Log 输出提示信息,便于用户修改程序;若无错误,则在Output 显示运行结果。结果及图形,可以粘贴或选择性粘贴到Word 文档中保存。

五、DPS11.0简介

DPS (Data Processing System ,数据处理系统)软件由我国浙江大学唐启义教授编制,最新版本为DPS11.0企业版。DPS 操作简单、功能齐全,是国内最好的统计软件。DPS9.50标准版在《中医药统计学(第二版)》中介绍,下面简单介绍DPS11.0。

DPS11.0可以在Windows Vista 或XP 下安装,用鼠标击Windows 桌面上形如太极八卦图的DPS 图标,可以打开如图1-4所示的DPS11.0窗口。

DPS 窗口顶部是菜单栏及常用、矩阵

工具栏,中部是数据运算的电子表格,底

部是数学建模的公式区。电子表格与公式

区,可以用鼠标拖动窗框调整大小。

在DPS 电子表格,用工具栏表格尺寸

按钮可以设置行数及列数。指定空白单

元格,可以直接输入数据,也可以用打开

按钮调用已有的数据文件。当前电子表格,

可以用另存按钮存为.cll 文件。 电子表格的每一格称为单元格,第A 列第1行单元格记为A1,左上及右下角分别为A1及B2的区域记为A1:B2。用鼠标单击或拖动,可以选定单元格对象。用鼠标单击左上角单元格,再按住Shift 键不放击右下角单元格,可以选定连续区域。按住Ctrl 键不放用鼠标击或拖动,可以选定多个区域。对选定对象,可以指定方法进行统计分析,可以用工具栏设置数值格式或调整小数位数按钮指定数据的小位数。

指定空白单元格,在半角状态下,输入等号“=”再键入表达式,或击工具栏输入公式fx 按钮于输入参数框键入表达式,回车或→OK ,可得到计算结果。表达式的加、减、乘、除、乘方,分别用键盘的+、-、*、/ 、^键表示,可以使用函数,可以使用单元格区域。鼠标点击单元格时,单元格边框右下角会出现小黑块,称为填充柄。用鼠标拖动填充柄,可以把单元格的公式复制到单元格区域。

相应操作,也可以用菜单完成。→文件菜单→新建,可以打开新的电子表格。标题栏关闭按钮,或→文件菜单→退出,或快捷键Alt +F4,均可以退出DPS 。

数据、输出的计算结果及图形,都可以粘贴或选择性粘贴到Word 文档中保存。

练习题1

1.判断题

(1)统计分析包括统计描述和统计推断。(√)

(2)统计的结论永远是推断性的。(√)

(3)抽样研究的目的是由样本信息推断总体。(√)

(4)研究人员测量了100例患者外周血的红细胞数,所得资料为计数资料。(×)

2.选择题或最佳选择题

(1)下列资料中属于计量资料的是(D)

A.病人的血型

B.粪便潜血试验++

C.某地乙肝发病率5%

D.小鼠染毒后外周血白细胞数

E.在临床疗效试验中,好转的有10人

(2)以下属于数值变量的是(B E)

A.性别

B.病人白细胞计数

C.血型

D.疗效

E.某病感染人数

(3)用同一培养基分别在5个单元上培养疫鼠杆菌,48小时内各单元上生长的活菌数分别为:80,90,100,110,120(个)。该资料为(D)

A.圆形分布资料

B.计数资料

C.等级资料

D.计量资料

(4)下列资料等级资料的是(D)计数资料的是(E)。

A.白细胞计数

B.住院天数

C.门、急诊就诊人数

D.病人的病情分级(轻.中.重)

E.检查结果(阴性.阳性)

(5)参数是(B)

A.参与个体数

B.总体的统计指标

C.样本的统计指标

D.样本的总和

E.统计量

(6)观察单位为研究中的(D)。

A.样本

B.全部对象

C.影响因素

D.个体

E.观察指标

(7)总体是由(E)组成。

A.部分个体

B.全部对象

C.全部个体

D.相同的观察指标

E.同质个体的所有观察值

3.问答题.思考题

(1)统计学研究的基本方法是什么?

通过样本构造统计量,再通过抽样分布的研究,对样本所来自的总体进行分析推断。

(2)某年级甲班.乙班各有学生50人。从两个班各抽取10人测量身高,并求其平均身高。如果甲班的平均身高大于乙班,能否推论甲班所有同学的平均身高大于乙班?为什么?

不能。因为,从甲.乙两班分别抽取的10人,测量身高,得到的分别市甲.乙两班的一个样本。样本的平均身高只是一个统计量,即使是按随机化原则进行抽样,由于存在抽样误差,样本均数与总体均数一般很难恰好相等。因此,不能仅凭两个样本均数高低就作出两总体均数孰高孰低的判断。

(3)统计分析要求每一个样本应该具有哪些特性?

代表性,可靠性,随机性,可比性。

中医统计学复习

1.中医统计学:处理中医理论与实践中的同质性和变异性的科学与艺术.以概率论和数理统计原理为基础,以中医理论与实践为主体,通过对数据的搜集、整理、分析和推断,从而达到探讨中医理论与方法内在规律的目的. 2.总体:根据研究目的确定的同质观测单位的集合. (无限总体和有限总体) 3.样本:从统计总体中随机抽取的、具有代表性的部分观测单位的集合. 4.同质:构成总体的各个观测单位在某一方面或某几方面的性质相同或基本相同. 5.变异:在同质基础上各观察单位(或个体)之间的差异. 6.事件:泛指事物发生的某种情况或在调查、观察和实验中获得的某种结果.(确定性事件和随机事件) 8.频率:某种现象在重复随机试验中发生的比例. 9.概率:某随机事件A发生的可能性大小,记为P(A). 10.频数:指研究对象安某属性进行分组后,各组中观测值的个数. 11.众数:一群数据中出现次数(频数)最多的值. 12.随机:在抽样、分组、实验/试验顺序安排过程中,每个观测单位都不受研究者主观意愿 驱使,具有同等的机会被抽中、分配或安排,目的是保证样本具有代表性. 13.随机变量:随机事件各种不同的结果.(离散型变量和连续型变量) 14.量值:随机事件各种具体的观测值. 15.误差:实际观测值与真值之差个差或样本指标与总体指标之差.(非随机误差(粗差、系 统误差)和随机误差(测量误差、抽样误差)) 16.分布:随机变量取值的变化及相应的频率变化的规律性. 17.频数分布:指观测值按大小分组,各个组段内观测值个数(频数)的分布,是了解数据分 布形态特征和规律的基础. 18.正态分布:(高斯分布)一种常见的、最重要的连续型对称分布 标准正态分布:期望值μ=0,标准差σ=1的正态分布 19.医学参考值范围:为了减小变异的影响,提高参考值作为为判断正常或异常的可靠性所 确定的绝大多数正常人医学参考值的波动范围. 20.构成比:事物内部各组成部分所占整体的比重或分布,常用百分数表示.构成比=(某现 象内部某一部分的个体数/某现象内部个体数之和)×100% 21.相对比:描述两个有关指标的比例关系(通常以倍数或百分数表示). 率:表示某现象发生的频率或强度,是频率指标. 22.抽样误差:由个体差异和随机抽样造成的样本和总体、样本与样本相应统计指标之间的差异. 23.区间估计:结合样本统计量和标准误确定一个具有较大可信度的包含总体参数的区间, 该区间称为总体参数的1-α可信区间(CI) 24.无效假设:记为 H0,表示差别由抽样误差引起,无统计学意义. 备择假设: 记为 H1,表示差别为处理因素所致,有统计学意义.分为单侧和双侧两种形式 25.检验水准:(显着性水准)符号为α,事先规定的对假设成立与否作出判断的依据,常取0.05或0.01 26.P值:在检验假设所规定的总体中作随机抽样,获得等于及大于/小于现有样本统计量的 概率,即各样本统计量的差异来自抽样误差的概率,是判断H0成立与否的依据.确定P值

中医药统计学第1章题解

《中医药统计学》习题解答 1 总体分布题解 习题解答 1. 对三人做舌诊算一次试验。设A ={3人正常}、B ={至少1人不正常}、C ={只有1人正常}、D ={只有1人不正常}。分析这四个事件中的互斥事件、对立事件,描述事件A +D 、BD 各表示什么意思? 解 设A i ={第i 人正常},用A i 表示A 、B 、C 、D 得到 A ={三人正常}=321A A A B ={至少一人不正常} =321321321321321321321A A A A A A A A A A A A A A A A A A A A A ++++++ C ={只有一人正常}=321321321A A A A A A A A A ++ D ={只有一人不正常}=321321321A A A A A A A A A ++ 可以看出,互斥事件有A 与B ,A 与C ,A 与D ,C 与D ,A 与C 、D ;对立事件有A 与B 。 A +D =321A A A +321321321A A A A A A A A A ++ ={至少2人正常}={至多1人不正常} BD =321321321A A A A A A A A A ++={只有1人不正常}={只有2人正常}=D 2. 我国四个地区一年的生育情况如表1-2所示,求生男孩的概率。 解 设A ={生男孩},计算得到 )()(A f A P n ≈964573 1022811994101990993496986 528072514765513654++++++== 3. 在40个药丸中有3丸失效,任取5丸,求其中有2丸失效的概率。 解 这是古典概率模型。在40个药丸中任取5丸,每一个药丸均可能被取到,且被取到表1-2 四个地区生育情况 地区编号 生育总数 生男孩数 1 990 993 513 654 2 994 101 514 765 3 1 022 811 528 072 4 964 573 496 986

医学统计学练习题与答案

一、单向选择题 1. 医学统计学研究的对象是 E.有变异的医学事件 2. 用样本推论总体,具有代表性的样本指的是E.依照随机原则抽取总体中的部分个体 3. 下列观测结果属于等级资料的是 D.病情程度 4. 随机误差指的是 E. 由偶然因素引起的误差 5. 收集资料不可避免的误差是 A.随机误差 1.某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是 A. 中位数 2. 算术均数与中位数相比,其特点是 B.能充分利用数据的信息 3. 一组原始数据呈正偏态分布,其数据的特点是 D.数值分布偏向较小一侧 4. 将一组计量资料整理成频数表的主要目的是E.提供数据和描述数据的分布特征 1. 变异系数主要用于 A .比较不同计量指标的变异程度 2. 对于近似正态分布的资料,描述其变异程度应选用的指标是E. 标准差 3.某项指标95%医学参考值范围表示的是D.在“正常”总体中有95%的人在此范围 4.应用百分位数法估计参考值范围的条件是B .数据服从偏态分布 5.已知动脉硬化患者载脂蛋白B 的含量(mg/dl)呈明显偏态分布,描述其个体差异的统计指标应使用 E .四分位数间距 1.样本均数的标准误越小说明 E.由样本均数估计总体均数的可靠性越大 2. 抽样误差产生的原因是D.个体差异 3.对于正偏态分布的的总体,当样本含量足够大时,样本均数的分布近似为C.正态分布 4. 假设检验的目的是 D.检验总体参数是否不同 5. 根据样本资料算得健康成人白细胞计数的95%可信区间为7.2×109 /L ~9.1×109 /L ,其含义是 E.该区间包含总体均数的可能性为95% 1. 两样本均数比较,检验结果05.0 P 说明 D.不支持两总体有差别的结论 2. 由两样本均数的差别推断两总体均数的差别, 其差别有统计学意义是指 E. 有理由认为两总体均数有差别 3. 两样本均数比较,差别具有统计学意义时,P 值越小说明 D.越有理由认为两总体均数不同 4. 减少假设检验的Ⅱ类误差,应该使用的方法是 E.增加样本含量 5.两样本均数比较的t 检验和u 检验的主要差别是B.u 检验要求大样本资料

经济统计学专业培养方案流程

经济统计学专业培养方案 Economic Statistics 学科门类:经济学专业代码:020102 一、专业培养目标 本专业培养德、智、体、美全面发展,具有良好的经济学和数学素养,掌握现代统计学基本理论和方法,能熟练运用统计软件并借助计算机进行数据搜集、整理、计算和分析的应用型高级统计专门人才。能在金融保险等企事业单位、政府机构及市场中介机构等其它经济管理部门从事市场调查与分析、经济统计与分析、金融统计与管理、信息处理和数据挖掘等开发和应用性工作,或在科研机构、教育部门从事科学研究和教学工作。 本专业下设两个方向:“经济统计”方向、“金融统计”方向。“经济统计”方向侧重培养学生运用统计理论和方法对国民经济和社会发展问题进行数据搜集与整理、市场调查与分析的能力。“金融统计”方向强调统计方法在金融领域中的应用,侧重培养学生运用统计理论和方法分析和解决金融市场分析、投资与风险管理等金融领域问题的能力。 二、专业培养要求 本专业坚持以学生为中心,教书育人,采取知识、能力、素质三方面并重的人才培养模式,培养学生具有广博的人文知识、厚实的专业基础、过硬的基本技能、宽阔的国际视野、高尚的人格情操。具体的专业培养要求是: (一)具有扎实的文化基础和专业知识 1.有坚定正确的政治方向,拥护中国共产党的领导,热爱祖国,遵纪守法;关心国家的改革开放事业,具有正确的人生观和价值观; 2.掌握经济学、管理学的基本理论与知识; 3.掌握统计学的基本理论、基本知识和基本技能,知识面宽,对国内外本专业领域的新成果及其发展动态有一定了解; 4.有良好的数学基础,受到比较严格的统计思维和逻辑思维训练。 (二)具有较强的综合知识运用能力和动手能力 1.掌握统计学的基本方法,具有采集数据、处理数据和分析数据的基本能力; 2.掌握一门外国语,具有较强的听、说、读、写能力; 3. 具有综合运用经济学、统计学等知识分析、解决问题的初步能力; 4.掌握主要的统计分析软件应用,有较强的统计计算能力。 三、课程设置

中医药统计学 复习重点

某市12岁男童110人的身高(cm)如下: 身高组段 124— 128— 132— 136— 140— 144— 148— 152— 156— 160—164 频数(f) 1 2 9 20 35 24 13 3 2 1 (2)写出该市男童身高95%的参考值范围。 (1)110名男童身高的均数、标准差为: ∑ ∑=f fx x =140、9cm 1/)(1) (222--=--=∑∑∑∑∑∑f f fx fx f x x f s =5、99cm (2)该市男童身高95%的参考值范围: 百分位数法:(5..2P ,5.97P )=(128,156)cm 正态分布法:(s x 96.1-,s x 96.1+) =(140、9-1、96×5、99,140、9+1、96×5、99) =(129、2,152、6)cm 某市12岁男童110人的身高(cm)如下: 身高组段 124— 128— 132— 136— 140— 144— 148— 152— 156— 160—164 频数(f) 1 2 9 20 35 24 13 3 2 1 1、对该资料作正态性检验; 2、求这110名男童身高的均数、标准差、变异系数; 3、写出该市男童身高95%的参考值范围; 1、 用SAS/INSIGHT 建立如下形式的数据集: A B 124 1 128 2 ………… 156 2 160 1 2、 SAS 处理主要步骤: 鼠标点击Edit →Variables →Other →将变量A 移到Y 框下,选a+b*Y 后在a:出键入2,点击OK,形成组中值变量A-A 。鼠标点击Analyze →Distribution(Y),将变量A-A 移到Y 框下,将B 移到Freq 框下→点击Output,选Tests for Normality →OK 、 3、 SAS 输出结果: 正态性检验:p=0、0007, 均数Mean:140、8727cm,标准差Std 、 Deviation:5、99405cm 该市男童身高95%的参考值范围(p2、5,p97、5)=(128、5455,154、8000)cm 某市12岁男童110人的身高(cm)如下: 身高组段 124— 128— 132— 136— 140— 144— 148— 152— 156— 160—164 频数(f) 1 2 9 20 35 24 13 3 2 1 2、写出该市男童身高95%的参考值范围。

统计学习题与答案

第一章总论 一.填空题 1.统计一词的三种含义是()、()、()。 2.统计学的研究对象是社会经济现象()。 3. 统计的工作过程包括()、()、()、()四个阶段。 4. 统计总体的特征是()、()、()。 5.标志是反映()特征的名称,指标是反映()数量特征的范畴。 二、单项选择题 1.要了解100名学生的学习情况,则总体单位是()A.100名学生 B.每一名学生 C. 100名学生的学习成绩 D.每一名学生的学习成绩 2.某工人月工资1000元,则“工资”是() A.数量指标 B.质量指标 C.数量标志 D.品质标志 3.某县农村居民的年人均收入8000元是()。 A.数量指标 B.质量指标 C.数量标志 D.品质标志 4.标志有数量标志和品质标志,因此() A. 标志值有两类:品质标志值和数量标志值。 B. 品质标志才有标志值 C.数量标志才有标志值 D.品质标志和数量标志都有标志值 5.某地区全部商业企业作为总体,每个商业企业作为总体单

位,则该地区全部商品销售额是() A.数量指标 B.质量指标 C.数量标志 D.品质标志 三、多项选择题 1.下列属于离散变量的是() A.人口数 B.播种面积 C.设备台数 D.企业数 2.下列指标中,属于质量指标的有() A.工人劳动生产率 B.单位产品成本 C.利润额 D. 银行存款余额 E.废品率 F.人口密度 3下列各项中,属于统计指标的有() A.某同学某学期平均成绩 B. 某地区人口出生数 C.某个企业全部工人生产某钟产品的人均产量 D.2010年我国国民生产总值 四.判断题 1..用文字表示的统计指标是质量指标,用数字表示的统计指标是数量指标。 2.总体和总体单位不是固定不变的,随着研究目的的改变是可以相互转化的。 3.某学生的性别是“男”,“男”是品质标志。

经济统计学专业人才培养方案

经济统计学专业人才培养方案 (专业代码:020102) 一、培养目标 坚持立德树人,培养具有社会责任感,适应区域经济社会发展与京津冀协同发展需要,德、智、体、美等方面全面发展,具备扎实的经济学和管理学理论及基础知识,具有良好的数学素养,正确掌握统计学的基本理论和一般方法,在大数据时代能熟练地运用统计软件分析数据和解决实际问题,具有创新创业精神和较强实践能力,能在企业、事业单位和行政机关从事统计调查、统计信息处理、数量分析、预测与决策等工作的复合应用型经济统计人才。 二、毕业生的基本要求 1.热爱社会主义祖国,拥护中国共产党的领导,掌握马列主义、毛泽东思想和中国特色社会主义理论体系的基本知识;具有服务国家服务人民的社会责任感、勇于探索的创新精神和善于解决问题的实践能力;具有良好的思想品德、社会公德和职业道德。 2.本专业学生主要学习经济、统计、管理方面的基本理论和基础知识,受到统计学分析方法,数据搜集、数据整理、数据建模、数据分析以及应用统计软件操作等方面的基本训练,掌握科学的采集社会、经济和技术信息数据资料,并运用现代技术手段建立统计模型,熟练使用各种统计软件,综合分析解决相关领域实际问题的基本能力。 毕业生应获得以下几方面的知识和能力: (1)掌握统计学的基本理论、基本方法和统计工作的基本操作技能; (2)掌握设计调查问卷、收集、整理和分析经济数据的基本技术; (3)具备从事统计分析、应用与管理,市场调查与策划,统计教育与研究工作的基本能力; (4)掌握中外经济学文献检索、资料查询的基本方法、具有较强的文字和口头表达能力,较为熟练的掌握一门外国语,熟练应用计算机等现代化工具应用技能; (5)熟悉国家统计、经济发展的方针、政策和统计法律、法规; (6)了解大数据时代统计学数据分析方法的发展动态和应用前景; (7)具有一定的经济社会领域的科学研究和实际工作能力,具备统计理念并具有较强的统计思维能力。 3.具有一定的体育和军事基本知识,掌握科学锻炼身体的基本技能,养成良好的体育锻炼和卫生习惯,受到必要的军事训练,达到国家规定的大学生体育训练合格标准,具备健全

统计学专业职业生涯规划

职业生涯规划书 一、职业规划对自我的意义 从专业角度来看,职业生涯规划是指个人与组织相结合,在对一个人职业生涯的主客观条件进行测定、分析、总结的基础上,对自己的兴趣、爱好、能力、特点进行综合分析与权衡,结合时代特点,根据自己的职业倾向,确定其最佳的职业奋斗目标,并为实现这一目标做出行之有效的安排。职业设计的目的绝不仅是帮助个人按照自己的资历条件找到一份合适的工作,达到与实现个人目标,更重要的是帮助个人真正了解自己,为自己定下事业大计,筹划未来,拟定一生的发展方向,根据主客观条件设计出合理且可行的职业生涯发展方向。 于我自身而言,职业生涯规划就是有计划的规划自己的未来,一步一个脚印的去实现自己的职业理想。学习了职业生涯规划,让我更加清晰的认清了自己的发展方向,让我更加明白这条路该如何走。 二、自我分析 1.兴趣爱好:自己的性格有时候比较活泼开朗,有时候又比较内向,不太善和同学交流;喜欢听歌,但不会唱歌;还是比较喜欢运动,比如篮球、足球都还挺喜欢的,但对于舞蹈不太感冒;平时就上上网啊,看看电影,玩玩游戏,时不时出去游玩;对于学习,通常是前半学期比较积极,后半学期就开始懒惰了,导致成绩总是不理想。 2.性格特征:具有双重性的,在做事方面通常都是很认真但不太积极,有时存在一定的惰性,在理智中又存在着盲目。现在来到学校我想主动去观察已经代替了过去在高中的那种被动的接受,自己在清醒的面对现实时又多少带有一种脱离实际的幻想。在以后的学习工作中,我要努力改进自己的不足,发扬自己的长处,让自己变的更优秀。 3.学习方面:有点马虎不认真,造成学习成绩的不理想,以后这方面应该积极的改进,在以后我将以积极的态度努力学习,争取以优异的成绩完成学业。 4. 自我潜能分析:我想每个人都有自己的潜能,只是发挥没发挥出来的问题,我相信在后天的努力中,也是会充分发挥出来的。在高中里我的数学虽然不是名列前茅,也还是算不错的,我想我的逻辑思维有较好的潜能。

中医药统计学深刻复习重要

某市12岁男童110人的身高(cm )如下: 身高组段 124— 128— 132— 136— 140— 144— 148— 152— 156— 160—164 (1∑ ∑=f fx x =140.9cm 1/)(1) (222--=--=∑∑∑∑∑∑f f fx fx f x x f s =5.99cm (2)该市男童身高95%的参考值范围: 百分位数法:(5..2P ,5.97P )=(128,156)cm 正态分布法:(s x 96.1-,s x 96.1+) =(140.9-1.96×5.99,140.9+1.96×5.99) =(129.2,152.6)cm 某市12岁男童110人的身高(cm )如下: 身高组段 124— 128— 132— 136— 140— 144— 148— 152— 156— 160—164 频数(f ) 1 2 9 20 35 24 13 3 2 1 1、对该资料作正态性检验; 2、求这110名男童身高的均数、标准差、变异系数; 3、写出该市男童身高95%的参考值范围; 1、 用SAS/INSIGHT 建立如下形式的数据集: A B 124 1 128 2 ………… 156 2 160 1 2、 SAS 处理主要步骤: 鼠标点击Edit →Variables →Other →将变量A 移到Y 框下,选a+b*Y 后在a:出键入2,点击OK ,形成组中值变量A-A 。鼠标点击Analyze →Distribution(Y),将变量A-A 移到Y 框下,将B 移到Freq 框下→点击Output,选Tests for Normality →OK. 3、 SAS 输出结果: 正态性检验:p=0.0007, 均数Mean :140.8727cm ,标准差Std. Deviation :5.99405cm 该市男童身高95%的参考值范围(p2.5,p97.5)=(128.5455,154.8000)cm 某市12岁男童110人的身高(cm )如下: 身高组段 124— 128— 132— 136— 140— 144— 148— 152— 156— 160—164 频数(f ) 1 2 9 20 35 24 13 3 2 1

中医统计学复习

统计学思考题(以下一切公式仅为帮助理解)总体:是根据研究目的所确定的研究对象的全体。它是由许多性质相同的个体组成样本:是从总体中随机抽取的一部分有代表性的个体参数:根据总体分布的特征而计算的总体数值(总体的统计指标)统计量:由总体中随机抽取样本而计算的相应指标(样本的统计指标)抽样误差:指样本与总体之间的差别或同一总体中相同大小样本之间的差别 概率:反映某一事件发生的可能性大小的量,常用P表示,0冬PG 当某事件发生的概率P< 0.05或0.01,称为小概率事件。 数值变量资料:又称计量资料,对每一个观察单位用定量的方法测定某项指标的数值大小所得的资料 分类变量资料:又称计数资料,是先将观察单位按性质或类别进行分组,然后清点各组观察 单位的个数所得的资料统计工作的基本步骤:研究设计、收集资料、整理资料、分析资料实验设计基本要素:处理因素、受试对象、实验效应实验设计基本原则:对照原则、随机原则、重复原则(、均衡原则、盲法原则)资料的分析:统计描述、统计推断(参数估计、假设检验)统计表的基本结构:标题、标目(横标目、纵标目)、线条、数字如何正确编制统计表和统计图(讲稿P4、P5) 常用统计图直条图:适用于按性质分组的不连续资料构成图:适用于构成比资料,分为百分条图和圆形图普通线图:适用于按数量分组的连续性资料直方图:适用于连续性频数分布资料计量资料的频数分布 特征:集中趋势、离散趋势 类型:对称分布、偏态分布 平均数 意义:分析计量资料的基本指标,表示一组性质相同的观察值的平均水平或集中趋势的指标常用平均数 1. 算术平均数:(均数)当一组变量值的频数分布呈对称分布或近似对称分布(正态

实用卫生统计学复习题与答案2

《卫生统计学》 一、名词解释 1.计量资料 2.计数资料 3.等级资料 4.总体 5.样本 6.抽样误差 7.频数表 8.算术均数 9.中位数 10.极差 11.方差 12.标准差 13.变异系数 14.正态分布 15.标准正态分布 16.统计推断 17.抽样误差 18.标准误 19.可信区间 20.参数估计 21.假设检验中P的含义 22.I型和II型错误 23.检验效能 24.检验水准 25.方差分析 26.随机区组设计 27.相对数

28.标准化法 29.二项分布 30.Yates校正 31.非参数统计 32.直线回归 33.直线相关 34.相关系数 35.回归系数 36.人口总数 37.老年人口系数 38.围产儿死亡率 39.新生儿死亡率 40.婴儿死亡率 41.孕产妇死亡率 42.死因顺位 43.人口金字塔 44.灵敏度 45.特异度 46.误诊率 47.漏诊率 48.阳性似然比 49.阴性似然比 50.Youden指数 51.ROC曲线 52.统计图 二、单项选择题 1.观察单位为研究中的( )。 A.样本B.全部对象C.影响因素D.个体2.总体是由()。

A.个体组成B.研究对象组成 C.同质个体组成D.研究指标组成 3.抽样的目的是()。 A.研究样本统计量B.由样本统计量推断总体参数C.研究典型案例研究误差D.研究总体统计量 4.参数是指()。 A.参与个体数B.总体的统计指标 C.样本的统计指标D.样本的总和 5.关于随机抽样,下列那一项说法是正确的()。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取B.研究者在抽样时应精心挑选个体,以使样本更能代表总体C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后()。 A.均数不变,标准差改变B.均数改变,标准差不变C.两者均不变D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用()。 A.变异系数B.方差 C.极差D.标准差 8.以下指标中()可用来描述计量资料的离散程度。 A.算术均数B.几何均数 C.中位数D.标准差 9.血清学滴度资料最常用来表示其平均水平的指标是()。A.算术平均数B.中位数 C.几何均数D.平均数 10.两样本均数的比较,可用()。 A.方差分析B.t检验 C.两者均可D.方差齐性检验 11.配伍组设计的方差分析中,ν配伍等于()。 A.ν总-ν误差B.ν总-ν处理

经济统计学专业就业方向与就业前景分析

经济统计学专业就业方向与就业前景分析 经济统计学专业就业方向与就业前景分析 经济统计学就业方向可以面向金融,统计,经济,会计这四个大方向。而经济统计学毕业生中大部分人成为了会计,其次是数学教师,然后是银行等金融机构。金融统计学最好的就业方向就是进入 事业单位,但这些单位往往很少招本科的学生,一般都是要求硕士 以上学历。因而,对于本科生来说,经济统计学由于所学范围宽广,知识涉及学科较多,学得广而不精,所以在就业的时候就存在一个 转向的问题。但数据处理是统计学的优势所在,是会计,经济等专 业都没有的优势,所以不必为就业的问题担心。 经济统计学专业能在企事业单位和经济、金融和管理部门从事统计调查、统计信息管理、数量分析、市场研究、质量控制以及高新 技术产品开发、研究、应用和管理工作,或在科研教育部门从事研 究和教学工作的高级专门人才。统计学不仅要注重与其它学科的结合,统计学自身在统计原理、统计技术、统计方法等领域也要谋求 创新和突破。 一直以来,政府统计、部门统计在统计学生的就业中占有较高的比重。然而,随着社会主义市场的完善,随着中国全球化贸易的发展,民间统计越来越热。民间统计是政府统计之外的涉及市场调研、统计分析、预测和决策等内容的`一系列统计活动,包括各类统计调 查公司、统计信息咨询中心、统计师事务所、统计研究所,以及把 统计方法运用于企业决策和管理的企业管理咨询公司等,是介于市 场和企业、居民之间的一个桥梁,主要为企业和居民提供市场微观 信息。民间统计机构,由于其服务的多样性、形式的灵活性,目前 在我国获得大幅度的发展,已经逐渐为广大统计学生提供广阔的就 业机会。随着民间统计机构的持续发展,民间统计机构必将成为统 计学生就业的主要渠道之一。

统计学习题集与参考答案

统计学原理练习题及答案 2007/12/7 9:32:24 阅读数:23905 《统计学原理》综合练习题 一、判断题(把正确的符号“V”或错误的符号“X”填写在题后的括号中。) 1、社会经济统计的研究对象是社会经济现象总体的各个方面。() 2、在全国工业普查中,全国企业数是统计总体,每个工业企业是总体单位。 () 3、总体单位是标志的承担者,标志是依附于单位的。() 4、数量指标是由数量标志汇总来的,质量指标是由品质标志汇总来的。() 5、全面调查和非全面调查是根据调查结果所得的资料是否全面来划分的 ()。 6、调查单位和填报单位在任何情况下都不可能一致。() 7、在统计调查中,调查标志的承担者是调查单位。() 8、对全同各大型钢铁生产基地的生产情况进行调查,以掌握全国钢铁生产的基本情况。这种调查属于非全面调查。() 9、统计分组的关键问题是确定组距和组数() 10、按数量标志分组的目的, 就是要区分各组在数量上的差别() 11、总体单位总量和总体标志总量是固定不变的,不能互相变换。() 12、相对指标都是用无名数形式表现出来的。() 13、众数是总体中出现最多的次数。() 14、国民收入中积累额与消费额之比为1:3,这是一个比较相对指标。()15、总量指标和平均指标反映了现象总体的规模和一般水平。但掩盖了总体各单 位的差异情况,因此通过这两个指标不能全面认识总体的特征。()16、抽样推断是利用样本资料对总体的数量特征进行估计的一种统计分析方法, 因此不可避免的会产生误差,这种误差的大小是不能进行控制的。()17、从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样本。() 18、在抽样推断中,作为推断的总体和作为观察对象的样本都是确定的、唯一的。() 19、抽样估计置信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度。() 20、在其它条件不变的情况下,提高抽样估计的可靠程度,可以提高抽样估计的 精确度。() 21、抽样平均均误差反映抽样的可能误差范围,实际上每次的抽样误差可能大于

经济统计学专业培养方案

经济统计学专业培养方案 一、培养目标 本专业旨在培养经济领域中德才兼备,具有国际视野,具备扎实的经济学理论、统计学基础,掌握金融与贸易基础知识,能熟练地运用统计软件分析和处理包含金融与贸易在内的各类经济数据的国际化复合应用型高素质人才。 学生毕业后,可在国际组织、政府部门、金融机构和各类企事业单位从事经济、金融、贸易等方面的政策咨询、信息管理等工作,以及相关数据的搜集、管理、数量分析的开发、应用和管理工作,或可在国内外继续深造。 二、培养规格及标准 ⒈知识结构 本专业学生应具备以下几方面的知识: ⑴通识类知识:哲学与社会、文学与艺术、科学与创新、数学思维与经济分析、文化历史与国际视野等; ⑵基础知识:数学(数学分析、高等代数、应用随机过程、概率论、数理统计)、英语、计算机、经济学等; ⑶专业知识:宏观经济学、微观经济学、国民经济统计学、贸易统计、金融统计、统计软件与应用SAS、应用多元统计分析、抽样技术与应用、应用时间序列分析等; ⑷相关专业知识:会计学、国际贸易、中级计量经济学(英)、运筹学、国际金融、市场调查等; 具体课程设置详见本专业指导性教学计划。 ⒉能力 通过培养,学生应具备以下几方面的能力; ⑴掌握经济统计学领域的基本理论、基本知识、基本方法和统计软件应用技能,了解本学科发展的前沿和动态,具有获取新知识的能力; ⑵具有扎实的数理基础和较强的实证分析能力以及运用统计方法分析解决问题的能力; ⑶具备扎实的经济学基础,掌握与本专业密切相关的经济学、国际贸易、金融学等学科的基本知识; ⑷熟练掌握英语,在听、说、读、写、译能力均达到较高水平,能够运用英语进行科学研究和实践工作,能够进行跨文化交流; ⑸熟悉国内外统计、经济、金融、贸易等领域的政策法规和发展趋势; ⑹具有较好的团队合作精神和人际交往能力。 ⒊素质

中医药统计学与软件应用试题1

1.测量体重、转氨酶等生理指标所得的资料类型是(B ) A、计数资料 B、计量资料 C、等级资料 D、间断性资料 2.、用某种新疗法治疗某病患者41人,治疗结果如下: 治疗结果治愈显效好转恶化死亡 治疗人数8 23 6 3 1 该资料的类型是(C ) A、数值资料 B、计量资料 C、等级资料 D、个体资料 3.观察川芎对冠心病患者心血管功能影响的实验中,川芎属于( A ) A.被试因素B.受试对象C.因素水平D.以上都不是 4.为了直观地比较化疗后相同时间点上一组乳癌患者血清肌酐和血液尿素氮两项指标观测值的变异度的大小,可选用的指标是(D ) A、标准差 B、标准误 C、相关系数 D、变异系数 5.不同地区水中平均碘含量与地方性甲状腺肿患病率的资料如下: 地区编号: 1 2 3 4 . . . . . . 17 碘含量:10.0 2.0 2.5 3.5 . . . . . . 24.5 患病率:40.5 37.7 39.0 20.0 . . . . . . 0.0 为了通过测定碘含量来预测地方性甲状腺肿的患病率,应选用(B ) A、相关分析 B、回归分析 C、正常值范围 D、均不对 6.参数是(B ) A.参与个体数B.总体的统计指标C.样本的统计指标D.样本的总和 7.随机抽得观察指标为数值变量的实验数据为21.23.25.27.28.20.22.23.25.24.求平均水平,最好选用(C ) A.中位数B.几何均数C.算术均数D.众数 8.有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度应该是(D ) A.n1+n2 B.n1+n2 -1 C.n1+n2 +1 D.n1+n2 -2 9.已知甲药的疗效不会低于乙药,检验的目的是为了得出甲药的疗效是否明显地优于乙药,此时应选用(B ) A.t检验B.单侧检验C.卡方检验D.双侧检验 10.关于标准差,下面哪个说法是正确的(B ) A.标准差可以是负数B.标准差必定大于或等于零 C.标准差无单位D.同一资料的标准差一定比均数小 11.在某个连续分布总体中随机抽样的变量是X,(B ),理论上样本均数的分布很快趋向正态分布。 A.X服从正态分布,随样本大小n增大 B.X不服从正态分布,随样本大小n增大 C.n不变,随样本个数k增多 D.X不服从正态分布,随样本个数k增多

中医统计学习题与答案

《中医统计学》练习题 第一部分绪论 一、最佳选择题 1.抽样研究是一种科学、高效的方法,目的是研究( B ) A.样本 B.总体 C.抽样误差 D.概率 2.由样本推断总体,样本应该是( D ) A.总体中的典型部分 B.总体中有意义的部分 C.总体中有价值的部分 D.总体中有代表性的部分 3.统计上所说的系统误差、过失误差、测量误差和抽样误差四种误差,在实际工作中( C ) A.四种误差都不可避免 B.过失误差和测量误差不可避免 C.测量误差和抽样误差不可避免 D.系统误差和抽样误差不可避免 4.统计描述是指( C )

A.比较指标的差别有无显著性 B.估计参数 C.用统计指标描述事物的特征 D.判断无效假设是否成立 5.统计推断是指( D ) A.从总体推断样本特征 B.从总体推断总体特征 C.从样本推断样本特征 D.从样本推断总体特征 6.对某样品进行测量时,由于仪器事先未校正,造成测量结果普遍偏高,这种误差属于( A ) A.系统误差 B.随机测量误差 C.抽样误差 D.过失误差 7.随机抽样的目的是( D ) A.消除系统误差 B.消除测量误差 C.消除抽样误差 D.减小样本偏性 8.对某地200名16岁中学生口腔检查,发现患龋齿的人数为54人,该资料属于( B ) A.数值变量资料 B.无序分类变量资料 C.有序分类变量资料 D.三个都不是

9.数值变量资料是( C ) A.用仪器测量出来的资料 B.按观察单位的类别,清点各类观察单位数的资料 C.用定量方法测定观察单位某个变量的大小的资料 D.按观察单位的等级,清点各等级观察单位数的资料 10.无序分类变量资料是( B ) A.用仪器测量出来的资料 B.按观察单位的类别,清点各类观察单位数的资料 C.用定量方法测定观察单位某个变量的大小的资料 D.按观察单位的等级,清点各等级观察单位数的资料 11.有序分类变量资料是( D ) A.用仪器测量出来的资料 B.按观察单位的类别,清点各类观察单位数的资料 C.用定量方法测定观察单位某个变量的大小的资料 D.按观察单位的等级,清点各等级观察单位数的资料

吉林大学经济统计学答案讲解

1:某投资项目某年前3年的平均投资收益率分别为5 %,7 % 和9 %,则该项目的年平均投资收益率为()。(注::选项中符号 ^ 表示乘幂,如:8^1/3 =2) 1.(105% x 107% x109%)^1/3 ?1 2.(105% x 107% x 109%) ?1 3.(5% + 7% +9%)/ 3 ?1 4.(105% +107% +109%)/ 3 ?1 2:国庆60周年献礼影片《建国大业》上映第一周的票房收入不属于()数据 1.数值型 2.品质数据 3.分类 4.定量数据 3:假设某班级20人的英语测试成绩分布如下: 分 数 50~60 60~70 70~80 80~90 90~100 人数 1 2 8 6 3 则,这20名学生的英语成绩的异众比例是() 1.40% 2.60%

3.80% 4.20% 4:据调查,某班级20人的上学期每周平均上网时间(以整小时计)分布如下: 小时数 0 1 3 5 6 7 人 数 2 2 4 8 3 1 则,这20名学生上学期每周平均上网时间的中位数是() 1.3小时 2.4小时 3.5小时 4.不存在 5:适合用累计频数进行统计整理的数据的类型最低级别应是( ) 1.分类数据 2.顺序数据 3.数值型数据 4.定量数据 6:某例甲型H1N1流感病例的流行病学调查(病人所接触者调查)是属于() 1.普查

2.抽样调查 3.重点调查 4.典型调查 7:某地区某年7月份的零售价格指数为105 %,这说明该地区 () 1.零售商品销售量平均增长了5% 2.由于销售量变动使商品价格平均增长了5% 3.零售商量销售价格平均上涨了5% 4.零售商量销售价格平均上涨了5% 8:据调查,某班级20人的上学期每周平均上网时间(以整小时计)分布如下: 小时 数 0 1 3 5 6 7 人 数 2 2 4 8 3 1 则这20名学生上学期每周平均上网时间的众数是() 1.3小时 2.4小时 3.5小时

中医药统计学第1章题解

《中医药统计学》习题解答 1 总体分布题解 习题1.1解答 1. 对三人做舌诊算一次试验。设A ={3人正常}、B ={至少1人不正常}、C ={只有1人正常}、D ={只有1人不正常}。分析这四个事件中的互斥事件、对立事件,描述事件A +D 、BD 各表示什么意思? 解 设A i ={第i 人正常},用A i 表示A 、B 、C 、D 得到 A ={三人正常}=321A A A B ={至少一人不正常} =321321321321321321321A A A A A A A A A A A A A A A A A A A A A ++++++ C ={只有一人正常}=321321321A A A A A A A A A ++ D ={只有一人不正常}=321321321A A A A A A A A A ++ 可以看出,互斥事件有A 与B ,A 与C ,A 与D ,C 与D ,A 与C 、D ;对立事件有A 与B 。 A +D =321A A A +321321321A A A A A A A A A ++ ={至少2人正常}={至多1人不正常} BD =321321321A A A A A A A A A ++={只有1人不正常}={只有2人正常}=D 2. 我国四个地区一年的生育情况如表1-2所示,求生男孩的概率。 解 设A ={生男孩},计算得到 )()(A f A P n ≈964573 1022811994101990993496986 528072514765513654++++++==0.5169 3. 在40个药丸中有3丸失效,任取5丸,求其中有2丸失效的概率。 表1-2 四个地区生育情况 地区编号 生育总数 生男孩数 1 990 993 513 654 2 994 101 514 765 3 1 022 811 528 072 4 964 573 496 986

(2018)经济统计学专业博士研究生

(2018)经济统计学专业博士研究生 《现代统计分析方法》考试大纲 经济统计学专业下设两个研究员方向:宏观经济统计分析与国民经济核算分析,根据研究方向专业理论基础需要,故拟定专业课《现代统计分析方法》考试大纲如下: 统计学理论、模型与方法 一、统计学概论 1.1 统计学研究对象和方法 统计与统计学、统计学研究对象、总体与样本及其关系、指标与 指标体系 1.2 统计研究方法 大量观察法、综合指标法、统计模型法、归纳推断法 1.3 统计学研究内容与学科体系 统计学研究内容,统计学学科体系 二、概率论基础 2.1 概率基本概念 随机事件、频率与概率、相容与独立、古典概率模型、几何概率、 全概率与条件概率、BAYES概率 2.2 随机变量及其概率分布 随机变量概念、随机变量的概率分布,常用的几种离散和连续随 机变量的概率分布

2.3 随机变量的数字特征 随机变量的数学期望、方差与矩,多维随机变量概念,多维随机 变量的联合分布与边际分布、条件分布,多维随机变量的数字特 征、协方差与相关系数 2.4 大数定律与中心极限定理 贝努力、车贝雪夫大数定律,中心极限定理与正态逼近 三、抽样调查方案设计与方式方法 3.1 抽样调查概念、抽样调查方案设计 3.2 抽样调查方式方法 简单抽样,分层抽样、等距抽样、整群抽样、多阶段抽样 四、抽样分布 4.1 正态总体抽样分布 4.2 t分布、F分布、2χ分布及其构成 五、统计基本推断原理——统计估计与统计检验 5.1 统计估计 统计估计原理,参数估计方法:矩估计、极大似然估计、BAYES 估计, 参数区间估计 5.2 统计检验 假设检验基本原理与与功效、两类错误,参数显著性检验、非参 数2χ检验、符号检验、秩和检验、游程检验 六、统计指数 6.1 统计指数与编制方法

中医药统计学第2章题解

2 计量资料分析题解 习题2.1解答 1. 从同一批号的阿斯匹林片随机抽取5片,测得溶解50%的时间(min )为:5.3、6.6、5.2、3.7、4.9,做总体均数和总体方差的无偏点估计,求样本标准差及变异系数。 解 分别计算样本均数、样本方差,得到 X =(5.3+6.6+5.2+3.7+4.9)/5=5.1400 S 2=[(5.3-5.14)2+(6.6-5.14)2+(5.2-5.14)2+(3.7-5.14)2+(4.9-5.14)2]=1.0730 S =0730.1=1.0359 CV =1.0359/5.1400=0.2015 故μ及σ2的无偏点估计分别为 μ ?=5.1400,2?σ=1.0730 2. 某药的某种成分含量服从正态分布,方差σ2=0.1082。现测定9个样品,含量的均数X =4.484,根据α=0.05求含量总体均数的置信区间。 解 σ已知,用u 估计,μ的置信度0.95的置信区间为 )5546.4,4134.4(9/108.0960.1484.4=?μ 3. 从一批药丸随机抽取35丸,测得平均丸重为1.5 g 、标准差为0.08 g ,求该批药丸平均丸重总体均数置信度为95%的置信区间。 解 小样本,用t 估计,μ的置信度0.95的置信区间为 )5275.1,4725.1(35/08.00322.25.1=?μ 4. 检查某市12岁健康女学生144人的血红蛋白含量,求得其样本均数为119.62L g ,样本标准差为9.98L g ,试求该市12岁健康女学生学血红蛋白含量总体均数置信度为95%的置信区间。 解 大样本,用u 估计,μ的置信度0.95的置信区间为 )2639.121,9761.117(35/08.0960.15.1=?μ 5. 用1题的样本,求总体方差置信度为95%的置信区间。 解 σ 2的置信度0.95的置信区间为 )8608.8,3852.0(1.0359 42484.015 ,.03591· 3143.111522=??? ? ???--

经济统计学学习感想

经济统计学学习有感 在经历了一个学期的学习之后,我们对《经济统计学》的学习也来到了最后的阶段。在这一个学期的学习中,有很多感想,也有很多收获。虽然课程有些枯燥,但无疑的是,我们掌握了经济统计学这门实用的工具,在我们未来的人生中,也必将会运用这个工具,陪伴我们前行。 作为一个曾经以政治为高考内容文科生,在学习经济统计学之前,在我的心目中,经济统计学是一门非常枯燥以及复杂的学科,以我的数学水平以及从未涉及高等数学的学习,令我对这门学科有着异乎寻常的恐惧。经过几堂课的学习之后,基础的缺乏更令我感到难以下手,后来,每当有人谈起统计,我脑袋中就浮现出计数,一大堆枯燥的数字,还有一长串的数学计算式。 但是经过半个学期的学习,我对经济统计学有了全新的认识。在学习的过程中,我渐渐开始意识到经济统计学在学术研究中,在公司决策中,在国家制定方针政策时……在社会生活的各个方面都发挥着重要作用,它有它独立而完备的理论体系,它是相当科学的,它是以数学作为它的基本工具,但它有比数学更有实际用途,它可以对生活中大量的无序的数据进行分析,找出它们的规律,从而为研究、决策提供基本的依据,它是其他学科的一切理论的基础和来源……因此,为了掌握这门有用的科学,我决定开始努力学习。 在很多跟我一样以人力资源为学习对象的同学们的心目中,经济统计学跟我们的专业关系并不是很大。但是实际上却截然不同。作为我们课程学习的骨干部分,经济学来源于经济统计学。自然界的现象可以通过实验解剖等方法来被人们掌握。但是人类社会的经济现象就不一样了,它们复杂多样、变化多端,没有任何实验的方法可以来准确的研究。因此我们就只有借助于经济统计学,通过统计分析社会经济的各种数据,我们就可以发现社会的经济问题,为经济学的研究提供了素材。因此,我们完全可以认为,统计是沟通经济学与实际的一个重要桥梁。没有经济统计学,就没有经济学今天的发展。正因为经济学和经济统计学这样密切的关系,我意识到,光学好经济学理论知识是不够的,我必须还要同时学好经济统计学。因为作为人力资源学科的学习者的我们来说,掌握这门学科,对于我们未来的管理和经济学的进一步学习,经济统计学的基本运用,是必不可少的。 经过了长时间对这门学科的学习,我初步了解了经济统计学的基本论理。刚开始接触一门学科,都必须了解大量的术语,经济统计学也是一样。学习这门课的开始两三周我都感到比较痛苦,因为我们学习的都是一些经济统计学的基本的术语,例如:(1)统计主要分为了理论统计和应用统计,其中理论统计又分为了描述统计和推断统计。顾名思义,理论统计是研究统计的一般理论和方法的,而应用统计运用在某一特定领域的统计问题等等;(2)经济统计学的分析法有很多,如大量观察法、分组法、综合分析法、统计模型法、归纳推断法等等……(3)统计的研究对象是同类事物所构成的总体的数量特征,因为只有是同类事物才有相同的数量特征,才有一定的规律。其中这些统计需要研究的全部事物的总体就是统计总体。它具有客观性、大量性、同质性、变异性、相对性等特征。而由于它有大量性,所以在研究的时候经常不能把所有的总体单位都进行调查研究,所以需要抽取一部分出来研究,然后通过样本的特征去推断总体的数量特征,这部分总体单位所构成的整体就是样本,它具有随机性的特点。这个过程体现了一种科学的精神,如何抽取样本,如何控制样本的代表性误差,如何从样本推断总体,每一个环节都需要运用科学的方法,谨慎地进行等等……对于这些枯燥的

相关文档
最新文档