统计学必看教材

统计学必看教材
统计学必看教材

一、统计学基础部分

1、《统计学》 David Freedman等着,魏宗舒,施锡铨等译中国统计出版社据说是统计思想讲得最好的一本书,读了部分章节,受益很多。整本书几乎没有公式,但是讲到了统计思想的精髓。

2、《Mind on statistics(英文版)》机械工业出版社只需要高中的数学水平,统计的扫盲书。有一句话影响很深:Mathematics as to statistics is something like hammer, nails, wood as to a house, it\'s just the material and tools but not the house itself。

3、《Mathematical Statistics and Data Analysis(英文版.第二版)》机械工业出版社看了就发现和国内的数理统计树有明显的不同。这本书理念很好,讲了很多新的东西,把很热门的Bootstrap方法和传统统计在一起讲了。Amazon上有书评。

4、《Business Statistics a decision making approach(影印版)》中国统计出版社在实务中很实用的东西,虽然往往为数理统计的老师所不屑

5、《Understanding Statistics in the behavioral science(影印版)》中国统计出版社和上面那本是一个系列的。老外的书都挺有意思的

6、《探索性数据分析》中国统计出版社和第一本是一个系列的。大家好好看看陈希儒老先生做的序,可以说是对中国数理统计的一种反思。

二、回归部分

1、《应用线性回归》中国统计出版社还是着名的蓝皮书系列,有一定的深度,道理讲得挺透的。看看里面对于偏回归系数的说明,绝对是大开眼界啊!非常精彩的书

2、《Regression Analysis by example (3rd Ed影印版)》这是偶第一本从头到底读完的原版统计书,太好看了。那张虚拟变量写得比小说都吸引人。没什么推导,甚至说“假定你有统计软件可以算出结果”,主要就是将分析,怎么看图,怎么看结果。看完才觉得回归真得很好玩

3、《Logistics回归模型——方法与应用》王济川郭志刚高等教育出版社不多的国内的经典统计教材。两位都是社会学出身,不重推导重应用。每章都有详细的SAS和SPSS程序和输出的分析。两位估计洋墨水喝得比较多,中文写的书,但是明显老外写书的风格

三、多元

1、《应用多元分析(第二版)》王学民上海财经大学出版社现在好像就是用的这本书,但是请注意,这本书的亮点不是推导,而是后面和SAS结合的部分,以及其中的一些想法(比如P99 n对假设检验的影响,绝对是统计的感觉,不是推推公式就能感觉到的)。这是一本国内很好的多元统计教材。

2、《Analyzing Multivariate Data(英文版)》 Lattin等着机械工业出版社这本书有很多直观的感觉和解释,非常有意思。对数学要求不高,证明也不够好,但的确是“统计书”,不是数学书。

3、《Applied Multivariate Statistical Analysis (5th Ed影印版)》 Johnson&Wichem 着中国统计出版社个人认为是国内能买到的最好的多元统计书了。Amazon 上有人评论,评价很高的。不过据王学民老师说,这本书的证明还是有不太清楚,老外实务可以,证明实在不咋的,呵呵

四、时间序列

1、《商务和经济预测中的时间序列模型》弗朗西斯着 Amazon 上五星推荐的书,讲了很多很新的东西也非常实用。我看完才知道,原来时间序列不知有AR(1) MA(1)啊,哈

2、《Forecasting and Time Series an applied approach(third edition)》Bowerman&Connell 着本书的主讲Box-Jenkins(ARIMA)方法,附上了SAS和Minitab程序

五、抽样

1、《抽样技术》科克伦着张尧庭译绝对是该领域最权威,最经典的书了。王学民老师说:这本书不是那么好懂的,数学系的人,就算看得懂每个公式,未必能懂它的意思(不是数学系的人,还是别看了吧)。

2、《Sampling: Design and Analysis(影印版)》 Lohr着中国统计出版社讲了很多很

新的方法,无应答,非抽样误差,再抽样,都有讨论。也很不好懂,当时偶是和《Advance Microeconomic Theory》一起看的,后者被许多人认为是梦魇,但是和前者一比,好懂多了。主要还是理念上的差距。我们的统计思想和数据感觉有待加强啊

六、软件及其他

1、《SAS软件与应用统计分析》王吉利张尧庭主编好书啊!!!!

2、《SAS V8基础教程》汪嘉冈编中国统计出版社主要讲编程,没怎么讲统计。如果想加强SAS编程可以考虑。

3、《SPSS11统计分析教程(基础篇)(高级篇)》张文彤北京希望出版社当初第一次

看这本书,发现怎么几乎都看不懂,尤其是高级篇,现在终于搞清楚了:)

4、《金融市场的统计分析》张尧庭着广西师范大学出版社张老师到底是大家,薄薄的一本书,言简意言简意赅,把主要的金融模型都讲清楚了。看完会发现,分析金融单单数学模型还是纸上谈兵,必须加上统计模型和统计方法才能真正应用。本书用的多元统计(代数知识)比较深。

卫生统计学考试试题及答案

卫生统计学试题及答案(一) 1.用某地6~16岁学生近视情况的调查资料制作统计图,以反映患者的年龄分布,可用图形种类为______. A.普通线图 B.半对数线图 C.直方图 D.直条图 E.复式直条图 【答案】C(6——16岁为连续变量,得到的是连续变量的频数分布) 直方图(适用于数值变量,连续性资料的频数表变量) 直条图(适用于彼此独立的资料) 2.为了反映某地区五年期间鼻咽癌死亡病例的年龄分布,可采用______. A.直方图 B.普通线图 C.半对数线图 D.直条图 E.复式直条图(一个检测指标,两个分组变量) 【答案】E 3.为了反映某地区2000~1974年男性肺癌年龄别死亡率的变化情况,可采用______. A.直方图 B.普通线图(适用于随时间变化的连续性资料,用线段的升降表示某事物在时间上的发展变化趋势) C.半对数线图(适用于随时间变化的连续性资料,尤其比较数值相差悬殊的多组资料时采用,线段的升降用来表示某事物的发展速度) D.直条图 E.复式直条图 【答案】E 4.调查某疫苗在儿童中接种后的预防效果,在某地全部1000名易感儿童中进行接种,经一定时间后从中随机抽取300名儿童做效果测定,得阳性人数228名。若要研究该疫苗在该地儿童中的接种效果,则______. A.该研究的样本是1000名易感儿童 B.该研究的样本是228名阳性儿童 C.该研究的总体是300名易感儿童 D.该研究的总体是1000名易感儿童 E.该研究的总体是228名阳性儿童 【答案】D 5.若要通过样本作统计推断,样本应是__________. A.总体中典型的一部分 B.总体中任一部分 C.总体中随机抽取的一部分 D.总体中选取的有意义的一部分 E.总体中信息明确的一部分 【答案】C 6.下面关于均数的正确的说法是______.

统计学基础知识要点 很重要

第一章:导论 1、什么是统计学?统计方法可以分为哪两大类? 统计学是收集、分析、表述和解释数据的科学。统计方法可分为描述统计方法和推断统计方法。 2、统计数据可分为哪几种类型?不同类型的数据各有什么特点? 按照所采用的计量尺度不同,分为分类数据、顺序数据和数值型数据;按照统计数据的收集方法,分为观测的数据和实验的数据;按照被描述的对象与时间的关系,分为截面数据和时间序列数据。 按计量尺度分时:分数数据中各类别之间是平等的并列关系,各类别之间的顺序是可以任意改变的;顺序数据的类别之间是可以比较顺序的;数值型数据其结果表现为具体的数值。按收集方法分时:观测数据是在没 有对事物进行人为控制的 条件下等到的;实验数据的 在实验中控制实验对象而 收集到的数据。按被描述的 对象与时间关系分时:截面 数据所描述的是现象在某 一时刻的变化情况;时间序 列数据所描述的是现象随 时间而变化的情况。 3、举例说明总体、样本、 参数、统计量、变量这几个 概念。 总体是包含研究的全部个 体的集合。比如要检验一批 灯泡的使用寿命,这一批灯 泡构成的集合就是总体。样 本是从总体中抽取的一部 分元素的集合。比如从一批 灯泡中随机抽取100个,这 100个灯泡就构成了一个样 本。参数是用来描述总体特 征的概括性数字度量。比如 要调查一个地区所有人口 的平均年龄,“平均年龄” 即为一个参数。统计量是用 来描述样本特征的概括性 数字度量。比如要抽样调查 一个地区所有人口的平均 年龄,样本中的“平均年龄” 即为一个统计量。变量是说 明现象某种特征的概念。比 如商品的销售额是不确定 的,这销售额就是变量。 第二章:数据的收集 1、调查方案包括哪几个方 面的内容? 调查目的,是调查所要达到 的具体目标。调查对象和调 查单位,是根据调查目的确 定的调查研究的总体或调 查范围。调查项目和调查 表,要解决的是调查的内 容。 2、数据的间接来源(二手 数据)主要是公开出版或公 开报道的数据;数据的直接 来源一是调查或观察,二是 实验。 3、统计调查方式:抽样调

《卫生统计学》试卷(3)答案

2001级预防医学专业《卫生统计学》试卷 2004年5月31日专业学号姓名得分 一、单项选择题(每题2分,共40分) 1.标准正态分布的中位数为________A A. 0 B. 1 C. 0.5 D. 与标准差有关 2. 2检验能分析 D A.两样本率差异有无统计学意义 B. 多个样本率差异有无统计学意义 C. 两有序分类变量的关联性 D. 以上都对 3.医学试验设计的基本原则是D A. 对照 B. 随机 C. 重复 D. 以上均正确 4.以下关于二项分布的说法,错误的是________ D A. 二项分布要求随机试验仅有两个互相对立的结果,每次试验间是互相独立的; B. 二项分布要求各次随机试验的阳性率是恒定不变的; C. 从一个装有10个白球和10个黑球的口袋中随机摸球,每次摸出一球,记录其颜色后放回袋中,重复10次,作为一次试验。若以摸出白球作为阳性,则每次试验的阳性率服从二项分布; D. 虽然二项分布要求各次随机试验的阳性率是不变的,但在样本含量比较大,且阳性率和阴性率均不太小时,也可以近似利用二项分布的原理来解决阳性率有微弱改变时的有关问题。如从一个装有5000个白球和5000个黑球的口袋中随机摸球,每次摸出一球,记录其颜色后不放回袋中,重复10次,作为一次试验。可以近似利用二项分布的有关原理来解决这样的问题。 5.关于正态分布,以下说法正确的是________ B A.仅仅标准正态分布其曲线下面积才为1; B.在横轴上,从负无限大到1.96所对应的曲线下面积为0.975; C.从服从正态分布的总体中抽样,不管其样本含量有多大,其样本均数均服从正态分布; D.以上都不对。

统计学基础知识要点

第一章:导论 1、什么就是统计学?统计方法可以分为哪两大类? 统计学就是收集、分析、表述与解释数据的科学。统计方法可分为描述统计方法与推断统计方法。 2、统计数据可分为哪几种类型?不同类型的数据各有什么特点? 按照所采用的计量尺度不同,分为分类数据、顺序数据与数值型数据;按照统计数据的收集方法,分为观测的数据与实验的数据;按照被描述的对象与时间的关系,分为截面数据与时间序列数据。 按计量尺度分时:分数数据中各类别之间就是平等的并列关系,各类别之间的顺序就是可以任意改变的;顺序数据的类别之间就是可以比较顺序的;数值型数据其结果表现为具体的数值。按收集方法分时:观测数据就是在没有对事物进行人为控制的条件下等到的;实验数据的在实验中控制实验对象而收集到的数据。按被描述的对象与时间关系分时:截面数据所描述的就是现象在某一时刻的变化情况;时间序列数据所描述的就是现象随时间而变化的情况。 3、举例说明总体、样本、参数、统计量、变量这几个概念。 总体就是包含研究的全部个体的集合。比如要检验一批灯泡的使用寿命,这一批灯泡构成的集合就就是总体。样本就是从总体中抽取的一部分元素的集合。比如从一批灯泡中随机抽取100个,这100个灯泡就构成了一个样本。参数就是用来描述总体特征的概括性数字度量。比如要调查一个地区所有人口的平均年龄,“平均年龄”即为一个参数。统计量就是用来描述样本特征的概括性数字度量。比如要抽样调查一个地区所有人口的平均年龄,样本中的“平均年龄”即为一个统计量。变量就是说明现象某种特征的概念。比如商品的销售额就是不确定的,这销售额就就是变量。 第二章:数据的收集 1、调查方案包括哪几个方面的内容? 调查目的,就是调查所要达到的具体目标。调查对象与调查单位,就是根据调查目的确定的调查研究的总体或调查范围。调查项目与调查表,要解决的就是调查的内容。 2、数据的间接来源(二手数据)主要就是公开出版或公开报道的数据;数据的直接来源一就是调查或观察,二就是实验。 3、统计调查方式:抽样调查、普查、统计报表等。 抽样调查就是从调查对象的总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体数量特征的一种数据收集方法。特点:经济性,时效性强,适应面广,准确性高。普查就是为某一特定目的而专门组织一次性全面调查。我国进行的普查主要有人中普查、工业普查、农业普查等。统计报表就是按照国家有关法规的规定,自上而下地统一布置、自下而上地逐级提供基本统计数据的一种调查方式。 除此之外,还有重点调查与典型调查。 4、统计数据的误差通常就是指统计数据与客观现实之间的差距,误差的主要类型有抽样误差与非抽样误差两类。 抽样误差主要就是指在样本数据进行推断时所产生的随机误差(无法消除);非抽样误差就是人为因素造成的(理论上可以消除) 5、统计数据的质量评价标准:精度,即最低的抽样误差或随机误差;准确性,即最小的非抽样误差或偏差;关联性,即满足用户决策、管理与研究的需要;及时性,即在最短的时间里取得并公布数据;一致性,即保持时间序列的可比性;最低成本,即在满足以上标准的前提下,以最经济的方式取得数据。 6、数据的收集方法分为询问调查与观察实验。 7、统计调查方案包括哪些内容? 调查目的即调查所要达到的具体目标;调查对象与调查单位,调查对象就是根据调查目的确定的调查研究的总体或调查范围,调查单位就是构成调查对象中的每一个单位;调查项目与调查表,就就是调查的具体内容;其它问题,即明确调查所采用的方式与方法、调查时间及调查组织与实施细则。 第三章:数据整理与展示 1、对于通过调查取得的原始数据,应主要从完整性与准确性两个方面去审核。 2、对分类数据与顺序数据主要就是做分类整理,对数值型数据则主要就是做分组整理。 3、数据分组的步骤:确定组数、组距,最后制成频数分布表 统计分组时“上组限不在内”,相邻两组组限间断,上限值采用小数点。 组中值=(下限值+上限值)/2 4、频数:落在各类别中的数据个数;频数分布指把各个类别及落在其中的相应频数全部列出,并用表格形式表现出来;比例:某一类别数据占全部数据的比值;百分比:将对比的基数作为100而计算的比值;比率:不同类别数值的比值;分类数据的图示包括条形图与饼图。 5、直方图与条形图的差别:条形图就是用条形的长度表示各类别频数的多少,宽度则就是固定的,直方图就是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义。其次,直方图的各矩形通常就是连续排列,而条形图则就是分开排列。最后,条形图主要用于展示分类数据,而直方图则主要用于展示数值型数据。 第四章:数据分布特征的测度 1、一组数据的分布特征可以从哪几个方面进行测度? 一就是分布的集中趋势反映各数据向其中心值靠拢或聚集的程度;二就是分布的离散程度,反映各数据据远离其中心值的趋势;三就是分布的形状,反映数据分布偏斜程度与峰度。 2、简述众数、中位数与均值的特点与应用场合及关系。

统计学中几个基本理论

统计学中几个基本理论的释疑 文章摘要:如果仍用教材中的公式计算样本成数,则所计算出来结果就会与实际不符。 在计算加权算术平均数时,即使各组的单位数相等,权数也不一定会失去其应有的作用。正确的说法应该是:当各组权数相等且都等于某一任意常数时,权数就失去了其应有作用。此时,加权算术平均数就变成了简单算术平均数。也正是因为如此,所以我们说简单算术平均数是加权算术平均数的一个特例,是各组权数相等时的一种特殊的加权算术平均数。 对“下限在内,上限不在内”原则的辨析现行统计学教材在讲到组距式变量数列的编制时,指出“凡遇到某单位的变量值刚好等于相邻两组界限时,例行规定是将这个单位归入作为下限的组内,即所谓…下限在内,上限不在内?的原则。”代写理论统计学论文笔者认为,对其变量值刚好等于相邻两组界限值的单位,究竟是归入作为下限的组内,还是归入作为上限的组内,不应简单地像教材中所说的那样用一条“下限在内,上限不在内”的原则去解决,而是应当视变量的取值是越大越好还是越小越好来分别解决。具体说来,对于其取值越大越好的变量,当某一单位的变量值刚好等于相邻两组的界限值时,应按“下限在内 ,上限不在内”的原则归组;而对于其取值越小越好的变量,当某一单位的变量值刚好等于相邻两组的界限值时,则应按“上限在内,下限不在内”的原则归组。因为只有这样,才能将性质不同的单位分别划归到不同的组里去,从而实现统计分组的目的。否则,就不能做到这一点。以下分别举例说明。 “下限在内,上限不在内”原则的例题资料如表6所示。表 6 按耐穿时间分组(天) 鞋数(双) 280~300 300~320 320~340 340~360 360~380 2 000 3 000 26 000 8 000 1 000 ∑40 000 注:国家规定,该种鞋的耐穿时间在300天以上(含300 天)为合格。此例中,由于鞋的耐穿时间是一个取值越大越好的变量, 因此,当某一双鞋的耐穿时间刚好等于300天时,理应将其归入300天作为下限的第二组,而不应将其归入300天作为上限的第一组。因为只有这样,才能保证第一组的鞋都是不合格的,第二组的鞋都是合格品。现在如果硬要将耐穿时间刚好等于300天的鞋划归到第一组中去,则第一组的全部鞋中,既有合格品,又有不合格品,这样就达不到统计分组的目的。“上限在内,下限不在内”的原则的例题资料如表7所示因为只有这样,才能确保第三组中的零件都为不合格品。否则的话,如果硬要将尺寸误差刚好等于3mm 的零件划归到第三组中去,则就会使第三组的全部零件中,既有合格品,又有不合格品,从而也就不能达到统计分组的目的。对“整群抽样中样本成数计算公式”的质疑与释疑现行统计学教材中, 在谈到整群抽样方式下样本成数的计算公式时,往往是这样介绍的:若已知样本中各群的成数分别P1, P2, P3,…Pr,则样本成数计算公式为: P=P1+P2+P3+…Prr=∑Pir(i=1, 2, 3,…, r) 例如,从某县的50个村中随机不重复抽取5个村,对被抽中的5个村的所有养猪专业户进行全面调查,以推算该县存栏牲猪数及其优良品种率。调查结果,各村养猪专业户存栏牲猪的优良品种率分别为90%、80%、50%、70%和55%,则该县养猪专业户样本存栏牲猪的优良品种率为: P =∑Pir =90%+80%+50%+70%+55%5 =69% 笔者认为,用上述公式计算样本成数是不正确的一方面,在介绍平均数时,所有教材都讲到如果只知道若干个比率而要求计算其平均数,则最合适的方法应是简单几何平均法,而不应是简单算术平均法;另一方面,在实际抽样中,所获取的信息往往是计算各样本群成数的原始信息,此时,如果仍用教材中的公式计算样本成数,则所计算出来结果就会与实际不符。 因此,我认为,在计算样本成数时,应针对不同的已知条件,采取不同的计算方法: (1)当已知样本中各样本群内具有某种特征的单位数n1i、不具有某种特征的单位数noi和样本单位总数n三个中的任意两个时,可采用下列公式计算样本成数: P=∑n1i∑ni或=∑(ni-noi)∑ni=∑n1i∑(n1i+noi)(i=1, 2, 3, …, r) 如,假设原例中被抽中的5个村养猪专业户的存栏牲猪数分别为5 000头、8 000头、7 000头、8 800头和6 500头, 且其中的优良品种数分别为4 500头、6 400头、3 500头、6 160头和3 575头,则该县养猪专业户样本存栏牲猪

《统计学》自学指导书

统计学(课程自学指导书) 课程名称:统计学原理 自学学时:64课时 推荐教材:《统计学》(修订版本),杜欢政等.科学,2010.2 参考资料:《统计学原理》,洁明,祁新娥著,复旦大学2007年第四版 《统计学》袁卫等.高等教育,2000 《统计学》,贾俊平等.中国人民大学,2000 《统计学》,[美]David Freedman 等.中国统计,1998 考核方式:平时作业成绩×30%+笔试(闭卷)成绩×70% 课程的性质、目的、任务 《统计学》是经管类各专业的核心课程之一。本课程是以定量分析为主的方法论科学。设置本课程的目的在于培养学生有关统计知识方面的基本技能,培养学生应用统计方法分析问题和解决问题的实际能力。教学应达到的总体目标是:使学生能系统地掌握各种统计方法,并理解各种统计方法中所包含的统计思想;使学生掌握各种统计方法的不同特点、应用条件及适用场合。 第一章绪论学时:9学时(面授3学时,自学6学时) 一、本章自学容及要求 1、了解统计学的产生与发展 2、重点掌握统计一词的三种含义及其它们之间的关系、统计学的特点 3、了解统计工作任务、掌握统计工作的过程 4、重点掌握统计学中的基本概念 二、重点与难点 1、统计一词的三种含义及其它们之间的关系 2、统计学的特点 3、统计学中的基本概念 三、学习方法指导 1、本章主要介绍统计学中的一些理论问题,但是一些理论贯穿于本课程的始终,因此希望学员认真阅读本章的重点与难点。 2、特别强调统计学中的几个基本概念是本章的重点和难点,要求学员必须做到熟练掌握每一个概念、它们之间的关系。为学好以后各章打下扎实的理论基础。 3、学员可以通过认真阅读教材,然后做章后的练习来检验自己掌握知识的程度。 四、典型例题介绍

统计学基础知识及其概念

一、概念篇 总体:总体是指客观存在的,在同一性质基础上结合起来的许多个别事务的整体,亦称统计总体。 总体单位:总体单位是指构成统计总体的个别事物的总称。 指标:指标是反映总体现象数量特征的概念。 标志:标志是说明总体单位特征的名称。 统计调查:是按照预定的目的和任务,运用科学的统计调查方法,有计划有组织地向客观实际搜集统计资料的过程。 调查对象:是根据调查目的、任务确定的调查的范围,即所要调查的总体,它是由某些性质上相同的许多调查单位所组成的。 调查单位:是所要调查的现象总体中的个体,即调查对象中的一个一个具体单位,它是调查中要调查登记的各个调查项目的承担者。 报告单位:是负责向统计调查机关提交调查资料的单位。 普查:是专门组织的一次性的全面调查,用来调查属于一定时点上或时期内的现象的总量。 抽样调查:是从研究的总体中按随机原则抽取部分单位作为样本进行观察研究,并根据这部分单位的调查结果来推断总体,以达到认识总体的一种统计调查方法。抽样调查又称为概率抽样或称为随机抽样。 抽样调查是抽取总体重的部分单位,收集这些单位的信息,用来对总体进行推断的调查方法。这里的总体是指抽样推断所要认识的研究对象的整体,它是由所要研究的范围内具同一性质的全体单位所组成的整体。被抽中的部分单位构成样本。一般的,将总体记作N,将样本记作n。 面谈访问法:是由访问员与被调查者见面,通过直接访问来填写调查问卷的方法。 统计整理:是统计工作的一个重要环节,它是根据统计研究的任务与要求,对调查所取得的各种原始资料,进行审核、分组、汇总,使之系统化、条理化,从而得到反映总体特征的综合资料的过程。 复合分组:对同一总体选择两个或两个以上的标志重叠起来进行分组。 复合分组体系:多个复合分组组成的分组体系。 频数:是指分配数列中各组的单位数,也称次数。 频率:是将跟组的单位数(频数)与总体单位数相比,求得的用百分比表示的相对数,也称比率或比重。 统计指标:是反映总体现象数量特征的基本概念及其具体数值的总称。 总量指标:是反映总体规模的统计指标,表明现象总体发展的结果。 平均指标:是总体各单位某一数量标志一般水平的统计指标。 是将一个总体内各个单位在某个数量标志上的差异抽象化,以反映总体的一般水平的综合指标。 标志变异指标:是表明总体各个单位标志值的差异程度(离散程度)的指标。 强度相对指标:是不属于同一总体的两个性质不同但相互间有联系的总量指标对比的比值,是用来反映现象的强度、密度和普遍程度、利用程度的综合指标。 加权算数平均数:是在总体经过分组形成变量数列(包括单项数列和组距数列),有变量值和次数的情况下,将各组变量值分别与其次数相乘后加总求得标志总量,再除以总体单位数(即次数总和)而求得的数值。 标准差:是总体各单位变量值与其平均数的离差平方的算术平均数的平方根。 发展速度:是表明社会经济现象发展程度的相对指标,它是根据两个不同时期发展水平对比求得,说明报告期水平是基期水平的几倍或百分之几,常用倍数或百分数来表示。由于所采用的基期不同,发展速度又可分为定基发展速度和环比发展速度。 概率抽样:概率抽样在抽取样本时不带有任何倾向性,它通过从总体中随机抽选单位来避免这种偏差,因而对总体的推断更具代表性。 比例分析法:比例分析法又名“比率分析法”,是用倍数或百分比表示的分数式,即通过计算相关指标之间的相对比值,来揭示和对比不同规模、不同性质事物的水平和效益的好坏,或分析部分和整体之间比例关系的分析方法。 国家统计报表制度:国家统计报表制度是各级政府统计部门实施国家统计调查项目的业务工作方案,由国家统计局制定,或者由国家统计局和国务院有关部门共同制定。 现行国家统计报表制度分为周期性普查制度、经常调查制度和非经常性调查制度三大类。 周期性普查制度:是国家统计报表制度的一个类型,是就我国社会经济发展的状况,由国务院组织,每隔一段时

统计学经典书籍推荐

统计学经典书籍推荐 这是我碰巧在网上看到有人做了一些关于统计学经典书籍推荐和建议的总结,所以特意 转载与此,希望对大家有用。 一、统计学基础部分 1、《统计学》David Freedman等著,魏宗舒,施锡铨等译中国统计出版社 据说是统计思想讲得最好的一本书,读了部分章节,受益很多。整本书几乎没有公式,但是讲到了统计思想的精髓。 2、《Mind on statistics(英文版)》机械工业出版社 只需要高中的数学水平,统计的扫盲书。有一句话影响很深:Mathematics as to statistics is something like hammer, nails, wood as to a house, it's just the material and tools but not the house itself。 3、《Mathematical Statistics and Data Analysis(英文版.第二版)》机械工业出版社 看了就发现和国内的数理统计树有明显的不同。这本书理念很好,讲了很多新的东西,把很热门的Bootstrap方法和传统统计在一起讲了。Amazon上有书评。 4、《Business Statistics a decision making approach(影印版)》中国统计出版社 在实务中很实用的东西,虽然往往为数理统计的老师所不屑 5、《Understanding Statistics in the behavioral science(影印版)》中国统计出版社 和上面那本是一个系列的。老外的书都挺有意思的 6、《探索性数据分析》中国统计出版社和第一本是一个系列的。大家好好看看陈希儒老先生做的序,可以说是对中国数理统计的一种反思。 二、回归部分 1、《应用线性回归》中国统计出版社 还是著名的蓝皮书系列,有一定的深度,道理讲得挺透的。看看里面对于偏回归系数的说明,绝对是大开眼界啊!非常精彩的书 2、《Regression Analysis by example (3rd Ed影印版)》 这是偶第一本从头到底读完的原版统计书,太好看了。那张虚拟变量写得比小说都吸引人。没什么推导,甚至说“假定你有统计软件可以算出结果”,主要就是将分 析,怎么看图,怎么看结果。看完才觉得回归真得很好玩 3、《Logistics回归模型——方法与应用》王济川郭志刚高等教育出版社不多的国内的经典统计教材。两位都是社会学出身,不重推导重应用。每章都有详细的SAS和SPSS程序和输出的分析。两位估计洋墨水喝得比较多,中文写的书,但是明显老外写书的风格 三、多元 1、《应用多元分析(第二版)》王学民上海财经大学出版社 现在好像就是用的这本书,但是请注意,这本书的亮点不是推导,而是后面和SAS结合的部分,以及其中的一些想法(比如P99 n对假设检验的影响,绝对是统计的感觉,不是推推公式就能感觉到的)。这是一本国内很好的多元统计教材。 2、《Analyzing Multivariate Data(英文版)》Lattin等著机械工业出版社这本书有很多直观的感觉和解释,非常有意思。对数学要求不高,证明也不够好,但的确是“统计书”,不是数学书。

卫生统计学试卷B含答案

卫生统计学试卷 适用范围:__________ 出题教师:__________ 试卷满分 100 分,考试时间 60 分钟;书写要工整、清楚、标点符号使用正确。 一、单选题,以下各题有多个选项,其中只有一个选项是正确的,请选择正确答案(本大题满分40分,每小题1分) 1. 某研究属于观察性研究抑或试验性研究是根据确定的。 A. 是否给予研究对象干预措施 B. 是否遵循随机化原则 C. 研究者的工作属性 D. 研究对象所提供的信息 E. 在现场工作,还是在实验室工作 2. 为了反映某地区五年期间鼻咽癌死亡病例的年龄分布,可采用( )。 A. 普通线图 B. 直方图 C. 复式直条图 D. 直条图 E. 半对数线图 3. 统计中所说的总体是指:( ) A. 根据地区划分的研究对象的全体。 B. 据研究目的确定的同质的研究对象的全体。 C. 根据时间划分的研究对象的全体。 D. 随意想象的研究对象的全体。 E. 根据人群划分的研究对象的全体。 4. 对两样本均数作t检验,n1=20,n2=20,其自由度等于:( ) A. 39 B. 40 C. 20 D. 19 E. 38 5. 标化后的总死亡率:( ) A. 它反映了事物实际发生的强度 B. 以上都不对 C. 仅仅作为比较的基础,它反映了一种相对水平 D. 它反映了实际水平

E. 它不随标准选择的变化而变化 6. 计量资料编制频数表时,一般分组数目为:( ) A. 8~15组 B. 15~20组 C. 5~10组 D. 10~15组 E. 随便分几组 7. 均数与标准差适用于:( ) A. 偏态分布 B. 不对称分布 C. 正偏态分布 D. 负偏态分布 E. 正态分布的资料 8. 某地区抽样调查1000名成年人的血压值,此资料属于:( ) A. 有序分类资料 B. 离散型资料 C. 无序分类资料 D. 数值变量资料 E. 集中型资料 9. 120名10岁男孩身高资料是:( ) A. 定量不连续资料 B. 定性连续资料 C. 定性二分类资料 D. 定量连续性资料 10. 偏态分布资料宜用下面那一项描述其分布的集中趋势:( ) A. 标准差 B. 算术均数 C. 四分位数间距 D. 中位数 E. 方差 11. 两样本均数比较时,分别取以下检验水准,以所犯第二类错误最小:( ) A. α=0.02 B. α=0.01 C. α=0.05 D. α=0.15 E. α=0.10

统计学基础知识

一、数据的特征值 (一)数据的位置特征值 1)平均值 如果从总体中抽取一个样本,得到一批数据x 1,x 2,x 3….x n ,则样本的平均值x 为: n-数据个数; x i -第i 个数据数; ∑-求和。 2)中位数 有时,为减少计算,将数据x 1,x 2,x 3….x n 按大小次序排列,用位居于正中的那个数或中间两个数的平均值(当数据为偶数时)表示数据的总体平均水平。 3)中值M 测定值中的最大值x max 与最小值x min 的平均值,用M 表示。 4)众数 在用频数分布表示测定值时,频数最多的值即为众数。若测定值按区间做频数分布时,频数最多的区间代表值(一般取区间中值)也称众数。 (二)数据的离散特征值 1)极差R 测定值中的最大值x max 与最小值x min 之差称为极差。通常R 用于个数n 小于10的情况下,n 大于10时,一般采用标准偏差s 表示。 2)偏差平方和S 各测定值x i 与平均值 之差称为偏差。各测定值的偏差平方和称为偏差平方和,简称平方和,用S 表示。 无偏方差 各个测定值的偏差平方和除以(n-1)后所得的值称为无偏方差(简称方差),用s 2表示: ~ x _x _ x ∑ =--=-=n i i x x n n S s 1 2 _2)(1112 _ 2 _ 22 _ 1)(...) () (x x x x x x n -+-+-∑=-n i i x x 1 2 _ )(S = =

标准偏差s 2 (三)变异系数 以上反映数据离散程度的特征值,只反映产品质量的绝对波动大小。在工程实践中,测量较大的产品,绝对误差一般较大,反之亦然。因此要考虑相对波动的大小,在统计技术上 上式中σ和μ为总体均值和总体标准差,当过程在受控状态下,且样本容差较大时,可用样本标准差s 和样本均值 估计。 _x

卫生统计学试题6含答案

统计试题题库 1、下列那个就是对标化后总死亡率的正确描述? A A.仅仅作为比较的基础,它反映了一种相对水平 B.它反映了实际水平 C.它不随标准选择的变化而变化 D.它反映了事物实际发生的强度 E.以上都不对 2、两样本作均数差别的t检验,要求资料分布近似正态,还要求: D A.两样本均数相近,方差相等 B.两样本均数相近 C.两样本方差相等 D.两样本总体方差相等 E.两样本例数相等 3、四格表资料的卡方检验时无需校正,应满足的条件就是: D A.总例数大于40 B.理论数大于5 C.实际数均大于l D.总例数大于40且理论数均大于或等于5 E.总例数小于40 4、总体应该就是由: D

A.研究对象组成 B.研究变量组成 C.研究目的而定 D.同质个体组成 E.任意个体组成 5、两样本均数比较的t检验中,结果为P<0、05,有统计意义。P愈小则: E A.说明两样本均数差别愈大 B.说明两总体均数差别愈大 C.说明样本均数与总体均数差别愈大 D.愈有理由认为两样本均数不同 E.愈有理由认为两总体均数不同 6、抽样误差就是指: D A.总体参数与总体参数间的差异 B.个体值与样本统计量间的差异 C.总体参数间的差异 D.样本统计量与总体统计量间的差异 E.以上都不对 7、抽签的方法属于下列那种抽样: D A.分层抽样 B.系统抽样 C.整群抽样 D.单纯随机抽样 E.分级抽样

8、以舒张压≥12、7KPa为高血压,测量1000人,结果有990名非高血压患者,有10名高血压患者,该资料属下列那类资料: B A.计算 B.计数 C.计量 D.等级 E.都对 9、实验设计中要求严格遵守四个基本原则,其目的就是为了: D A.便于统计处理 B.严格控制随机误差的影响 C.便于进行试验 D.减少与抵消非实验因素的干扰 E.以上都不对 10、两个样本作t检验,除样本都应呈正态分布以外,还应具备的条件就是: B A.两样本均数接近 B.两S2数值接近 C.两样本均数相差较大 D.两S2相差较大 E.以上都不对 11、同一总体的两个样本中,以下哪种指标值小的其样本均数估计总体均数更可靠?A A.Sx B.S C.X D.CV E.S2

统计学重点知识点

基本统计方法 第一章 概论 1. 总体(Population ):根据研究目的确定的同质对象的全体(集合);样本(Sample ):从总体中随机抽取的部分具有代表性的研究对象。 2. 参数(Parameter ):反映总体特征的统计指标,如总体均数、标准差等,用希腊字母表示,是固定的常数;统计量(Statistic ):反映样本特征的统计指标,如样本均数、标准差等,采用拉丁字字母表示,是在参数附近波动的随机变量。 3. 统计资料分类:定量(计量)资料、定性(计数)资料、等级资料。 第二章 计量资料统计描述 1. 集中趋势:均数(算术、几何)、中位数、众数 2. 离散趋势:极差、四分位间距(QR =P 75-P 25)、标准差(或方差)、变异系数(CV ) 3. 正态分布特征:①X 轴上方关于X =μ对称的钟形曲线;②X =μ时,f(X)取得最大值;③有两个参数,位置参数μ和形态参数σ;④曲线下面积为1,区间μ±σ的面积为68.27%,区间μ±1.96σ的面积为95.00%,区间μ±2.58σ的面积为99.00%。 4. 医学参考值范围的制定方法:正态近似法:/2X u S α±;百分位数法: P 2.5-P 97.5。

第三章 总体均数估计和假设检验 1. 抽样误差(Sampling Error ):由个体变异产生、随机抽样造成的样本统计量与总体参数的差异。抽样误差不可避免,产生的根本原因是生物个体的变异性。 2. 均数的标准误(Standard error of Mean, SEM ):样本均数的标准差,计算公式: X σσ=误差的大小。 3. 降低抽样误差的途径有:①通过增加样本含量n ;②通过设计减少S 。 4. t 分布特征: ①单峰分布,以0为中心,左右对称; ②形态取决于自由度ν,ν越小,t 值越分散,t 分布的峰部越矮而尾部翘得越高; ③当ν逼近∞,X S 逼近X σ, t 分布逼近u 分布,故标准正态分布是t 分布的特例。 5. 置信区间(Confidence Interval , CI ):按预先给定的概率(1-α)确定的包含总体参数的一个范围,计算公式:/2,X X t S αν±或/2,X X u S αν±。95%CI 含义:从固定样本含量的已知总体中进行重复抽样试验,根据每个样本可得到一个置信区间,则平均有95%的置信区间包含了总体参数。 6. 假设检验的基本原理:小概率反证法的思想。 ①反证法:从问题的对立面(H 0)出发间接判断要解决的问题(H 1)

统计学必看教材推荐

一、统计学基础部分 1、《统计学》 David Freedman等著,魏宗舒,施锡铨等译中国统计出版社据说是统计思想讲得最好的一本书,读了部分章节,受益很多。整本书几乎没有公式,但是讲到了统计思想的精髓。 2、《Mind on statistics(英文版)》机械工业出版社只需要高中的数学水平,统计的扫盲书。有一句话影响很深:Mathematics as to statistics is something like hammer, nails, wood as to a house, it\'s just the material and tools but not the house itself。 3、《Mathematical Statistics and Data Analysis(英文版.第二版)》机械工业出版社看了就发现和国内的数理统计树有明显的不同。这本书理念很好,讲了很多新的东西,把很热门的Bootstrap方法和传统统计在一起讲了。Amazon上有书评。 4、《Business Statistics a decision making approach(影印版)》中国统计出版社在实务中很实用的东西,虽然往往为数理统计的老师所不屑 5、《Understanding Statistics in the behavioral science(影印版)》中国统计出版社和上面那本是一个系列的。老外的书都挺有意思的 6、《探索性数据分析》中国统计出版社和第一本是一个系列的。大家好好看看陈希儒老先生做的序,可以说是对中国数理统计的一种反思。 二、回归部分 1、《应用线性回归》中国统计出版社还是著名的蓝皮书系列,有一定的深度,道理讲得挺透的。看看里面对于偏回归系数的说明,绝对是大开眼界啊!非常精彩的书 2、《Regression Analysis by example (3rd Ed影印版)》这是偶第一本从头到底读完的原版统计书,太好看了。那张虚拟变量写得比小说都吸引人。没什么推导,甚至说“假定你有统计软件可以算出结果”,主要就是将分析,怎么看图,怎么看结果。看完才觉得回归真得很好玩 3、《Logistics回归模型——方法与应用》王济川郭志刚高等教育出版社不多的国内的经典统计教材。两位都是社会学出身,不重推导重应用。每章都有详细的SAS和SPSS 程序和输出的分析。两位估计洋墨水喝得比较多,中文写的书,但是明显老外写书的风格 三、多元 1、《应用多元分析(第二版)》王学民上海财经大学出版社现在好像就是用的这本书,但是请注意,这本书的亮点不是推导,而是后面和SAS结合的部分,以及其中的一些想法(比如P99 n对假设检验的影响,绝对是统计的感觉,不是推推公式就能感觉到的)。这是一本国内很好的多元统计教材。

卫生统计学试题

卫生统计学习题 定量资料的统计描述 1. 1985年某省农村30例6-7岁正常男童胸围(cm)测量结果如下:51.654. 154.056.9 57.755. 558.355. 453.857. 751.353. 857.354. 852.155. 354.854.7 53.457. 153.155. 951.454. 656.161. 859.356. 859.853.9 (1)试编制以上数据的频数表,绘制直方图,概括其分布特征。(2)用合适的统计量描述其集中趋势和离散趋势。 (3)对样本进行正态性检验

第三章定性资料的统计描述 1.某地通过卫生服务的基线调查得到如下资料,试作如下分析:(1)计算全人口的性别比; (2)计算育龄妇女(15~49岁)占总人口的百分比; (3)计算总负担系数; (4)计算老年人口系数 某地人口构成情况 年龄组(岁)男(%)女(%)年龄组(岁)男(%)女(%)0~ 4.24.045~ 2.42.7 5~ 3.23.150~ 2.12.4 10~ 4.44.255~ 1.2 2.2 15~ 5.55.360~ 1.3 2.4 20~

5.15.265~ 1.11.4 25~ 6.06.170~ 0.81.2 30~ 4.34.575~ 0.50.9 35~ 3.23.380~ 0.20.5 40~ 2.32.585~ 0.10.2 第四章常用概率分布 1.假定虚症患者中,气虚型占30%。现随机抽查30名虚症患者,求其中没有1名气虚型的概率、有4名气虚型的概率。 2.某溶液平均1毫升中含有大肠杆菌3个。摇均后,随机抽取1毫升该溶液,内含大肠杆菌2个和低于2个的概率各是多少? 3.某人群中12岁男童身高的分布近似正态分布,均数为 144.00cm,标准差为 5.77cm,试估计

《统计学》教材各章参考答案

各章思考与练习参考答案 第一章导论 (一)单项选择题 1.D 2.C 3.B 4.D 5.D 6.D 7.B 8.A 9.B 10.A (二)多项选择题: 1.ABCD 2.CD 3.AD 4.BCDE 5.ABDE (三)判断题: 1.×2.×3.×4.√5.× (四)简答题: 答案略 (五)综合题 答案略 第二章统计调查 (一)单项选择题: 1.C 2.C 3.B 4.C 5.C 6.A 7.B 8.C 9.C 10.B (二)多项选择题: 1.ACD 2.ABC 3.ABCD 4.ABC 5.ACD 6.ABCD 7.ABDE 8.BCE 9.ABE 10.CD (三)判断题: 1.×2.×3.×4.√5.× (四)名词解释: 答案略 ㈤(五)简答题: 答案略 第三章统计整理 (一)单项选择题:

1.C 2.B 3.C 4.B 5.B 6.A 7.B 8.C 9.B 10.B (二)多项选择题: 1.AB 2.BD 3.ACD 4.AD 5.BCD 6.BD 7.ABC 8.AC 9.ABC 10.CD (三)判断题: 1.×2.√3.×4.×5.× (四)名词解释: 答案略 (五)简答题: 答案略 (六)计算题: 1.解: 2

可见,组距1000元的分布数列,更为合理。 (2)对选中的分布数列,计算频率、较小制累计次数、较大制累计次数、组中值: (3)略 第四章总量指标与相对指标 (一)单项选择题: 1.C 2.B 3.A 4.B 5.C 6.B 7.B 8.C 9.B 10.D (二)多项选择题: 1.ABCD 2.CE 3.ABCDE 4.BCE 5.ABCD (三)判断题: 1.X 2.X 3.X 4.√5.X (四)名词解释: 答案略 (五)简答题: 答案略 (六)计算题: 1.解:该企业集团实现利润比去年增长百分比 =110%/(1+7%)-1=2.80% 2.解: (1)2011年的进出口贸易差额=12178-9559=2619(亿元)(顺差) 2011年进出口总额的发展速度=21737/17607×100%=123.46% (2)2011年进出口额比例相对数=9559/12178×100%=78.49%

卫生统计学试题(含答案)

医学统计方法选择题一 医学统计方法概述 l .统计中所说的总体是指: A A 根据研究目的确定的同质的研究对象的全体 B 随意想象的研究对象的全体 C 根据地区划分的研究对象的全体 D 根据时间划分的研究对象的全体 E 根据人群划分的研究对象的全体 2. 概率P=0,则表示B A 某事件必然发生 B 某事件必然不发生 D 某事件发生的可能性很大 E 以上均不对 7. 将计量资料制作成频数表的过程,属于 A 统计设计 B 收集资料 C 整理资料 8. 统计工作的步骤正确的是 C A 收集资料、设计、整理资料、分析资料 C 设计、收集资料、整理资料、分析资料 E 搜集资料、整理资料、分析资料、进行推断 ¬¬ 统计工作哪个基本步骤: C D 分析资料 E 以上均不对 B 收集资料、整理资料、设计、统计推断 D 收集资料、整理资料、核对、分析资料 B 10. 以下何者不是实验设计应遵循的原则 D A 对照的原则 B 随机原则 C 重复原则 D 交叉的原则 E 以上都不对 第八章 数值变量资料的统计描述 11. 表示血清学滴度资料平均水平最常计算 B A 算术均数 B 几何均数 C 中位数 D 全距 E 率 12. 某计量资料的分布性质未 明,要计算集中趋势指标,宜选择 C A X B G C M D S E CV 13. 各观察值均加(或减)同一数后: B A 均数不变,标准差改变 B 均数改变,标准差不变 C 两者均不变 D 两者均改变 E 以上均不对 14. 某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、10、2、24+(小时), 问 3.抽签的方法属于 D A 分层抽样 B 系统抽样 C 整群抽样 4.测量身高、体重等指标的原始资料叫: A 计数资料 B 计量资料 某种新疗法治疗某病患者 治愈 8 D 单纯随机抽样 E 二级抽样 5. 治疗结果 治疗人数 该资料的类型是: A 计数资料 6.样本是总体的 A 有价值的部分 D 任意一部分 显效 23 B C 等级资料 41 人, 好转 6 D 分类资料 治疗结果如下: 恶化 3 E 有序分类资料 计量资料 C B 有意义的部分 C 有代表性的部分 E 典型部分 C 无序分类资料 死亡 1 D 有序分类资料 E 数值变量资料 A 抽样误差 B 系统误差 C 随机误差 D 责任事故 E 以上都不对 C 某事件发生的可能性很小 9.良好的实验设计,能减少人力、物力,提高实验效率;还有助于消除或减少:

如何学好统计学科

如何学好统计学科 统计师考试频道,整理收集如何学好统计学2020,供大家参考与阅读。 可能很多人都会有这样的体会:在学校上了无数次的统计课程,学了一大堆的理论知识,也记住了好多的计算公式,但是一旦碰到实际数据,总是不知如何下手,最终只能找几篇类似的文章,照搬上面的方法,也不管对不对了。 我们为什么学不会统计,估计很多人很少会去像这个问题。我虽然也没有刻意去思考,但是在多年的协助别人设计、分析的经历中,慢慢地发现了一些可能的原因。 第一、统计学本身是一个非常灵活的学科,真正符合具体问题具体分析这样的一个哲学理念。即使是同样的指标,在不同场合下所选用的方法也可能不同。单说一个简单的方差分析,就因不同的设计类型需要采用不同的分析方法。甚至于同一批数据如果目的不同,其方法与结果也是不同的。 第二、大多数人最头疼的问题应该是:对于一批数据,不知道到底应该选用什么方法。尽管各种方法应用的前提条件背了一堆,但好像每个都像,每个又都不像。感觉好像用哪个方法也行,就是不知道哪个方法更准确。对于这样的问题,确实没有什么好办法能解决。正

像医学生刚毕业时判断不准疾病一样,只能靠经验积累。 第三、目前的医学统计学教材大都是一个模式,冷冰冰的框架,没有一点人性化的词语,全是一些让人摸不着头脑的话语。实际上,这也正是目前医学统计学领域的悲哀,真正有水平的人很少,大多都是似懂非懂,缺乏分析的经验,写书时只能是照搬,相互抄来抄去,最终导致所有的医学统计学教材都是一个面孔。 第四、目前是学术界烦躁的一个时期,没有多少人能够耐住寂寞地真正研究理论。多数人都只是学了一知半解,就自封为专家、人才。帽子很大,学问不多。也有很多人能够学习理论,但是又不能结合实际,脱离实际问题,没有真正的效益。统计学是一门方法学,本身也在不断地发展,真正想要掌握统计,必须不断地学习新知识,同时应不断地应用,只有在应用过程中才能真正地学会并理解。目前国内医学统计领域真正的高手已经越来越少,主要就是因为大多数人都很难沉下心来仔细研究统计学方法的进展和应用。如果自己都对统计学不了解,如何谈得上教授学生,结果必将是让学生更加糊涂。 真正的统计高手,至少应熟悉传统的统计学理论,了解最新的统计学进展,经常应用统计学解决各种各样的问题,至少精通一个数据库工具,至少掌握一门编程语言,必须精通SAS,这里不说SPSS,因为只有在SAS编程过程中,才能够更加理解统计学理论,而SPSS

相关文档
最新文档