第1章 统计和数据
环境信息技术与统计分析——第一章 环境统计数据及其整理公布

请同学们试着 编制本监测值 的频数表。
25
• 第一步:计算全距(极差)
R=87-51=36(dB)
第二步:确定组数、组距和组限 原则:
确定组数在9组。 组限(组距)是相邻两组的界限:上限不在内
的原则 计数,用“正”
计算组距:d 369 4
26
画记图整理表
噪声测量值(dB) 画记
3
1.1 环境统计数据的整理与公布
1.1.1环境统计数据类型
• 环境数据是按性质不同亦与环境资料一样,可以分 为三大类。
• 计量数据:如COD浓度为100mg/L。一般有计量单位; • 计数数据:如北京市有除尘设施的工业企业共计1236家,计 数数据不能是小数。 • 等级数据:可序数据或半计量数据,是用技术方法对观察单 位按某一种属性和类别的不同程序进行清点所得。如:地表 水质量为Ⅲ类。 • 等级数据不能计算平均值
生活污染, 46.32
单位:吨
图1. 某乡镇省各类污染源COD排放量
15
1.1 环境统计数据的整理与公布
含镉浓度(μg/Kg)
0.60 0.50 0.40 0.30 0.20 0.10 0.00
1
2
3
4
5
6
7
水田编号
图2. 某地区污染农田镉浓度
16
1.1 环境统计数据的整理与公布
1. 1.3数据的整理与公布 • 统计图表制作注意事项 • 统计图表制作没有绝对的好坏之分,但应注意以下
直观了解环境信息的发展变化规律。 • 而对于初始数据,量大、杂乱的情况统计图表还需
要进行初步的分析。
18
1.2 频数表与频数图
1.2 频数与频数图
• 例如: • 食堂的西红柿炒蛋这个菜,打了100次同学打了,
第一章 统计学概述

二、统计学的发展
• (一)古典统计学时期 • 1、国势学派 • 国势学派产生于17世纪的德国,其创始人是海 尔曼·康令(Hermann Conring,1606-1681) 教授。 • 2、政治算术学派 • 治算术学派产生于17世纪中叶的英国,主要代 表人物是威廉· 配第(William Petty,1623-1687) 和约翰· 格朗特(Johan Graunt,1620-1674)。
一、总体和样本
• (一)总体 • 统计总体简称总体,是指由特定的研究目 的确定的一定范围内的所有单位构成的集 合体。 • (二)样本 • 广义而言,样本是指从总体中抽取的部分 单位构成的集合体;但为了符合统计理论 的需要,统计中所指的样本特指从总体中 按照随机原则抽取的部分单位构成的集合。
二、统计标志
三、统计学在我国的应用
• 第一,对系统性及系统复杂性的认识为统 计学的未来发展增加了新的思路。
• 第二,定性与定量相结合的综合集成法将 为统计分析方法的发展提供新的思想。 • 第三,统计科学与其他科学渗透将为统计 学的应用开辟新的领域。
第二节 统计学的特点和分类
• 一、统计学的特点 • 二、统计学的类别
标志与指标的区别和联系。
• 它们的主要区别是:
• 第一、标志是说明总体单位特征的,指标 是说明总体特征的。例如,一个工人的工 资是数量标志,全体工人的工资总额是统 计指标。 • 第二、标志有用文字表示的品质标志和用 数值表示的数量标志,指标则都是用数值 表区别和联系。
• 在该时期,为现代统计学的发展作出重大 贡献的主要统计学家和理论有:20世纪初 英国的戈赛特(W.S. Gosset,1876-1937)的T 分布理论;20年代英国的费雪(R.A. Fisher, 1890-1962)的F分布理论;30年代波兰的尼 曼(J.S. Neyman,1894-1981)等人的假设检验 理论及置信区间估计等理论;40年代美国 的瓦尔德(A. Wasld, 1902-1950)等学者的统 计决策理论,多元分布理论等。
应用统计学—第1章 统计学与统计数据

2.指标:是反映总体数量特征的概念及其数值。
一项完整的统计指标由总体范围、时间、地点、指标数 值和数值单位等构成。
(1)统计指标的特征:1)是一定社会经济范畴的具体表 现;2)具有可量性;3)具有综合性 例如:在2007年西南大学本科教学评估中,我们可以
查阅到资源环境学院一系列的指标。如学院拥有一级 学科农业资源利用博士点1个,农业部研究基地1个, 农业部研究室4个,省部级重点学科4个,博士学位授 予点5个,硕士学位授予点12个。现有在职教职工 105人(具有博士学位的47人),其中博士生导师18 人,硕士生导师53人,教授21人,副教授31人。这 些指标从某一侧面反映了资源环境学院的教学水平的 数量特征。
第1章 统计学与统计数据
1.1 1.2 统计学的基本原理与内容 统计数据的来源与类型
1.1 统计学的基本原理与内容
1.1.1统计与统计学 1.统计的含义: 就是人们认识客观世界总体数量 变动关系和变动规律的活动的总称,是人们 认识客观 世界的一种有力工具。
指标设计 重要内容
(1)统计工作:统计设计、统计调查、统计整理、
收集数据 分析数据 整理数据 解释数据
图1.1 统计研究的过程
(2)统计学的分类 根据统计学的方法的构成,可以将统计学分为 1) 描述统计学: 研究如何取得反映客观现象的数据, 并以图表的形式对所收集的数据进行加工处理和显 示,进而通过综合、概括与分析,得出反映客观现 象的规律性特征。 描述统计学属于初等统计学。 2) 推断统计学: 研究如何根据样本信息来推断总体的 特征,所应用的知识主要是概率论与数理统计,属 于较高级的统计学。 描述统计学用的是总体数据,而推断统计学则往往 用样本数据。推断统计学是统计学的核心内容。
应用统计知识点总结-第一章统计与统计数据收集

2.茎叶图:
2.3
当数据量很大时,排序和茎叶图都很难得出结论。此时需要使用图表。有多种不同类型的图表可以用来精确描述数值数据,包括频数分布表、折线图、面积图、柱形图、条形图、直方图、频数多边形、圆饼图、散点图、时间序列、曲线图以及对数图等等。
4.测量误差:测量误差是指由于样本数据测量程序的设计和应用不当所引起的误差。
1.3.6
优势:及时性和共享性 ,便捷性和低成本 ,可靠性和客观性 ,更好的接触性 ,穿越时空性 。
1.4
问卷是一种特殊形式的调查表。其特点是表中用一系列按照严密逻辑结构组成的问题,向被调查者调查具体事实和个人对某问题的反映、看法,它不要求被调查者填写姓名。问卷设计一般要遵循以下原则。
3组限:组限也即各组区间的上、下限。确定各组区间的上限和下限时,应保证各组之间既不重叠,又不能遗漏任一数据,使每一个数据都属于某一确定的分组。
重叠和组限不重叠组限
重叠组限——相邻组的上下限重合。
适用于连续型变量。但各组上、下限中有一个不包含再内。通常按“上限不在内”处理,即组区间是 [a, b)的形式。
例:第七次全国人口普查
1.3.3
在总体中选择部分重点单位进行调查,以了解总体基本情况的一种非全面调查。
重点调查的特点:
(1) 重点调查适用于调查对象的标志值比较集中于某些单位的场合,这些单位的管理比较健全,统计力量比较充实,能够及时取得准确资料。
(2) 重点调查的目的在于了解总体现象某些方面的基本情况,而不要求全面准确地推算总体数字。
应用统计学侧重于阐明统计学的基本原理,并将理论统计学的成果作为工具应用于各个领域。
统计学和统计法基础知识

统计法规第一章1.统计数据的真实、准确、完整、及时是整个统计工作的灵魂。
2.统计法的立法宗旨是保障统计资料的准确性和及时性。
3.国家统计标准由国家统计局制定,或者由国家统计局和国务院标准化主管部门共同制定;国务院有关部门可以制定补充性的部门统计标准,报国家统计局审批。
4.国家制定统一的统计标准,保障统计调查采用的指标涵义、计算方法、分类目录、调查表式和统计编码等的标准化。
第二章1. 《中华人民共和国统计法》是由全国人民代表大会常务委员会制定颁布的。
2. 《统计法实施细则》在性质上属于行政法规,由国务院审批。
3. 统计法律→统计行政法规(条例、细则、规定):《统计法实施细则》、《全国经济普查条例》、《全国农业普查条例》、《关于工资总额组成的规定》、《关于加强统计工作的决定》(法规性文件)→地方性法规/→统计行政规章(办法)→政府规章/→部门规章4. 《中华人民共和国统计法》1983年12月8日通过,1996年5月15日第一次修订,2009年6月27日第二次修订,2010年1月11日施行。
5. 政府规章是人民政府所制定的统计行政规章;部门规章是由国务院各部委和国务院直属机构制定的统计行政规章。
第三章1. 统计资料,是指统计活动过程中所产生的、反映国民经济和社会发展情况的统计成果以及与之相联的其他资料的总称。
2. 统计工作的统一性最为关键的是统计管理体制的集中统一。
3. 统计法的基本原则:①保障统计工作统一性原则:统计管理体制集中统一;统计制度统计标准统一;统计资料统一管理和公布。
②保障统计工作的独立性原则:独立行使职权,不受非法干涉;县级以上人民政府统计机构独立单设。
③统计机构依法履行职责原则:职责法定;依法履行职权不可放弃、超越、滥用;减轻统计调查对象的负担。
④保障统计信息社会共享原则:统计信息共享;定期公布统计资料;公布的权限;公开的方式;统计信息咨询服务工作。
⑤统计资料保密原则5.凡通过抽样调查、重点调查、行政记录能取得统计数据的,不得制发定期全面统计报表。
统计学基础复习提纲复习内容统计数据数据搜集

统计学基础复习提纲复习内容:第一章:统计数据;第二章;数据搜集;第四章:数据分布特征的测度;第五章:抽样与参数估计;第六章:假设检验;第七章:相关与回归分析;第八章:时间序列分析和预测:第九章:指数。
重点内容:第一章统计和数据(1)统计的概念和应用(2)统计数据类型:分类数据、顺序数据、数值型数据;观测数据和实验数据;截面和时间序列数据。
(3)统计中的基本概念:总体与样本;参数与统计量;变量。
第二章数据搜集(1)数据来源:直接来源和间接来源(2)调查设计:调查方案设计和调查问卷设计(3)统计数据质量第四章数据分布特征的测度(1)集中趋势的测度:平均数;中位数和分位数;众数(2)离散程度的度量:极差和四分位差;平均差;方程和标准差;离散系数(3)偏态与峰态度量:偏态系数;峰态系数第五、六章参数估计与假设检验(1)参数估计的基本原理:点估计与区间估计(2)总体均值的区间估计和总体比率的区间估计(3)样本容量的确定(4)假设检验的基本原理:原假设与备择假设;两类错误与显著性水平;检验统计量与拒绝域。
(5)总体均值的检验:大样本检验方法;小样本检验方法。
第七章相关与回归分析(1)变量间关系度量:相关关系的描述和测度;散点图与离散系数。
(2)一元线性回归:一元线性回归模型;参数的最小二乘估计;回归方程的拟合优度;显著性检验。
(3)利用回归房产进行估计和预测第八章时间序列分析与预测(1)时间序列的分解和描述:图形描述;增长率分析(2)预测方法的选择和估计(3)平稳序列的预测:移动平均法;指数平滑法(4)趋势序列的预测:线性趋势预测;非线性趋势预测平均数:x 二2 4 10 11| 14 151096 9.610(2-9.6)2(4-9.6)2 川(15-9.6)2n -110-12、一家公司在招收职员时,首先要进行两项能力测试。
在A 测试中,其平均分数是100分, 标准差是15分;在B 项测试中,其平均数是 400分,标准分数是50分。
统计一到三章重点
第一章概述重点第一节统计的含义和特点1、统计概念:统计是人们正确运用统计理论和方法采集数据、整理数据、分析数据和由数据得出结论的实际操作过程,是人们从数据上对客观世界的一种认识活动和结果。
2、统计学的研究对象:大量社会经济现象总体的数量方面3、社会经济统计的特点:数量性、总体性、具体性、社会性4、统计工作过程:统计设计阶段、统计调查阶段、统计整理阶段、统计分析阶段、统计数据提供与管理阶段5、统计职能:信息、咨询、监督6、统计研究的具体方法:大量观察法、统计分组法、综合指标法、统计推断法第二节统计中常用的基本概念1、统计总体及总体单位的概念:统计总体是根据研究目的确定的所要研究的对象的全体,它是由客观存在的、具有某种共同性质的许多个体所构成的整体。
构成总体的个体则称为总体单位。
2、统计总体的特点:同质性、大量性、差异性3、统计标志概念及分类:标志是说明总体单位属性或特征的名称。
按其性质不同可分为品质标志和数量标志。
品质标志的具体表现用文字表示;数量标志的具体表现用数值来表示。
4、统计指标概念、六要素及种类:统计指标是各种说明总体综合数量特征和数量关系的数字资料。
六要素:时间限制、空间限制、指标名称、计量单位、计算方法、指标数值。
种类:数量指标(又分为总体单位总量和总体标志总量)、质量指标5、标志与指标的区别与联系:区别:(1)标志是表明总体单位特征的;指标是表明总体特征的(2)标志可以用数量表示为数量标志,也可以用文字表示为品质标志;指标都是用数量表示联系:(1)统计指标的基础是总体单位及其标志值,总体单位及数量标志值的汇总与综合(2)由于统计研究目的和任务不同,确定的总体和总体单位不同,标志与指标也不同6、变异的概念及种类:变异是标志的具体表现在总体个单位间的差异。
种类:品质变异和数量变异7、变量的概念及种类:变量是可变的数量标志和所有的统计指标。
种类:按变量值是否连续分为离散变量(只能用整数表示)和连续变量(可用小数表示);按性质不同可以分为确定性变量和随机变量。
第一章 期末复习总结与习题数据与统计学
第一章期末复习总结与习题数据与统计学第一章期末复习总结与习题数据与统计学第一章数据和统计1.1.1统计数据它是统计实践过程中获得的各种数字数据和其他相关实际数据的总称。
它是统计工作的目标和成果。
(1)变量和变量值说明现象的某一数量特征的概念也被称为变量,变量的具体取值是变量值,统计数据就是统计变量的具体表现。
例如,固定资产是一个变量,每个企业固定资产的具体价值就是变量值。
为了区别,在本书中,凡是变量均用大写的英文字母表示,而变量值则用小写英文字母表示。
连续变量是指变量的值在数轴上是连续的,不能逐个枚举,也就是说,可以在一个区间内取任何实数。
例如,气象上的温度、湿度,零件的尺寸等。
离散变量是指变量的值,它们是整数值,可以逐个列出。
比如企业的数量,员工的数量等等。
确定性变量是受确定性因素影响的变量,即影响变量值变化的因素是明确的,是可解释和可控制的。
随机变量是受许多小的不确定因素(也称为随机因素)影响的变量。
变量的值不能预先确定。
社会经济现象既有确定性变量也有随机变量。
统计学所研究的主要是随机变量。
(二)数据的计量尺度统计数据是整体单位符号或统计指标的具体定量表达。
根据对研究对象计量的不同精确程度,人们将计量尺度由低到高、由粗略到精确分为四个层次:定类尺度、定序尺度、定距尺度和定比尺度。
1.1.2统计学统计学是一门关于如何收集、组织、显示和分析统计数据的方法学科学。
其目的是探索数据的内在定量规律。
1.1.3统计数据的规律性客观事物本身是必然性和偶然性的对立统一,必然性反映事物的本质特征,偶然性反映事物表现形式上的差异。
而统计数据是事物必然性与偶然性共同作用的结果,偶然性是对同一事物的多次观察得到的统计数据有差异,而必然性则隐含在统计数据本身。
统计学提供了探索数据内在规律的一套方法,利用统计方法是可以探索出其内在的数量规律性的。
1.4.1直接获取的数据直接统计调查:为获取统计数据而专门组织的调查。
如普查、重点调查和典型调查查、抽样调查、统计报表。
第一章 统计学基础知识-1
直 图 方
30 25 20 15 10 5 0 120% 100% 80% 60% 40% 20% 0%
频 率 累 % 积
频率
5.55 7.05 8.55 10.05 11.55 13.05 14.55 16.05 17.55 其 他
蔗 含 % 糖 量
第三节 统计特征数
反映数据资料的集中性趋势或分散程度的一些特 征数字,统称为统计特征数。 平均数,方差。 征数字,统称为统计特征数。如,平均数,方差 。 平均数: 一、集中性趋势的度量--平均数: 集中性趋势的度量 平均数 描述数据资料的集中性趋势, 描述数据资料的集中性趋势 , 反映资料的一般水 平及中心位置, 平及中心位置,并可作为资料的代表跟其它资料 比较。 比较。
(2)随机误差(偶然误差): )随机误差(偶然误差) 由很多不可避免且无法控制的偶然因素引起的误差。 由很多不可避免且无法控制的偶然因素引起的误差 。 分析测试中: 分析测试中: 分析方法本身的不完善性、仪器、环境、 分析方法本身的不完善性 、仪器、 环境、操作等各个 方面的偶然变化。 方面的偶然变化。 生物试验中: 生物试验中:产生随机误差的原因 供试材料的不均一性如种子质量、 供试材料的不均一性如种子质量、秧苗素质不可能完 全一致; 全一致; 光照、温度、湿度等影响生长的环境因子也可能随时 光照、温度、 随地发生的变化; 随地发生的变化; 农时操作的不一致性; 农时操作的不一致性; 其它不可预测的自然或人为因素的干扰。 其它不可预测的自然或人为因素的干扰。
编号 0 1 2 3 4 5 6 7 8 9 0 11.8 14.1 12.8 14.6 14.9 10.1 11.6 11.0 15.1 13.4 1 13.1 11.9 15.3 10.4 15.0 12.4 12.2 13.0 14.9 10.6 2 9.2 16.7 12.6 13.4 12.1 10.8 7.5 9.2 12.6 6.5 3 8.7 7.4 16.1 14.6 12.6 11.3 13.4 7.0 14.1 11.0 4 12.9 10.0 17.2 10.5 13.0 6.3 14.7 13.2 11.4 11.9 5 13.7 4.4 13.5 8.6 14.1 15.7 14.2 9.0 9.4 11.8 6 9.6 13.2 11.9 15.2 14.4 14.3 14.0 14.0 12.4 12.6 7 13.7 13.8 16.7 11.1 13.1 15.0 15.1 13.2 15.0 9.5 8 8.5 9.1 9.6 14.5 13.3 12.5 6.5 15.0 9.4 12.2 9 15.7 11.9 15.1 12.1 15.0 11.8 8.7 13.8 12.9 8.2
第1章 数据与统计学习题
第一章数据与统计学一、单项选择题1、指出下面的数据哪一个属于分类数据()A、年龄B、工资C、汽车产量D、购买商品的支付方式(现金、信用卡、支票)2、指出下面的数据哪一个属于顺序数据()A、年龄B、工资C、汽车产量D、员工对企业某项制度改革措施的态度(赞成、中立、反对)3、某研究部门准备在全市200万个家庭中抽取2000个家庭,据此推断该城市所有职工家庭的年人均收入,这项研究的统计量是()A、2000个家庭B、200万个家庭C、2000个家庭的人均收入D、200万个家庭的人均收入4、一家研究机构从IT从业者中随机抽取500人作为样本进行调查,其中60%的人回答他们的月收入在5000元以上,50%的回答他们的消费支付方式是使用信用卡。
这里的“月收入”是()A、分类变量B、顺序变量C、数值型变量D、离散变量5、一项调查表明,在所抽取的1000个消费者中,他们每月在网上购物的平均消费是200元,他们选择在网上购物的主要原因是“价格便宜”。
这里的参数是()A、1000个消费者B、所有在网上购物的消费者C、所有在网上购物的消费者的平均消费额D、1000个消费者的平均消费额6、一名统计学专业的学生为了完成其统计作业,在《统计年鉴》中找到的2006年城镇家庭的人均收入数据属于()A、分类数据B、顺序数据C、截面数据D、时间序列数据7、一家公司的人力资源部主管需要研究公司雇员的饮食习惯,改善公司餐厅的现状。
他注意到,雇员要么从家里带饭,要么在公司餐厅就餐,要么在外面的餐馆就餐。
他收集数据的方法属于()A、访问调查B、邮寄调查C、个别深度访问D、观察调查8、从含有N个元素的总体中抽取n个元素作为样本,使得总体中的每一个元素都有相同的机会(概率)被抽中,这样的抽样方式称为()A、简单随机抽样B、分层抽样C、系统抽样D、整群抽样9、为了调查某校学生的购书费用支出,从全校抽取4个班级的学生进行调查,这种调查方法是()A、简单随机抽样B、分层抽样C、系统抽样D、整群抽样10、为了调查某校学生的购书费用支出,将全校学生的名单按拼音顺序排列后,每隔50名学生抽取一名进行调查,这种调查方式是()A、简单随机抽样B、分层抽样C、系统抽样D、整群抽样11、在一项调查中,调查单位和填报单位()A、无区别,是一致的B、有区别,是不一致的C、无区别,是人为确定的D、有区别,但有时是一致的12、对家用电器的平均寿命进行调查,应该采用()A、普查B、重点调查C、典型调查D、抽样调查。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2.统计量
用来描述样本特征的概括性数字度量, 它是根据样本数据计算出来的一些量。 – 样本统计量有样本均值(x )、样本标准差 (s)、样本比例(p)等
– 样本统计量通常用小写英文字母来表示
四、变 量
说明现象某种特征的概念,称为变量。如商品销 售额、受教育程度、产品的质量等级等。
说明事物类别的一个名称,称为分类变量。 说明事物有序类别的一个名称,称为顺序变量。 说明事物数字特征的一个名称,称为数值型变量。
变量的具体表现称为变量值,即数据。
连续型变量
可以在直线上或区间中取任何值的变量,称为 连续型变量。连续型变量的数值是连续不断的,任 意两个变量值之间可以做无数种分割。
人的身高、体重、年龄 产品的产量(重量、体积、面积 等),产值、销售额等价值量
需要使用度量工 具取值
166
身高的例子:
165
● ●
离散型变量
三、统计学和其他学科
– 统计学与相关实质性学科的区别。 实质性学科研究该领域现象的 本质关系并对有关规律作出合 理的解释和论证。而统计学只
是为实质性学科研究和认识数
量规律提供专门的方法和工具, 并不直接对规律产生的原因和
机理作进一步的分析。
三、三门学科之间的关系
数学
数理统计学
数理经济学 计量经济学
• 统计学与相关的实质性学科如经济学等,有密切 的联系。
– 统计学是开展经济研究不可或缺的重要工具。通过统计 的实证研究,可以帮助人们认识有关的数量规律,同时 检验经济学理论的真实性和完善程度。
– 经济学等实质性学科对经济统计学起着重要的指导作用。
不仅统计指标的设定离不开实质性学科的指导,而且应 用统计方法也在很大的程度上受所研究对象性质的影响。
无限总体
指所包含的单位数目无 限的总体
二、样本
从总体中抽取的一部分元素的集合,称 为样本。 构成样本的元素的数目称为样本容量或 样本量。
三、参数和统计量
1. 参数描述总体特征的概括性数字度量。
– 参数主要有总体均值()或(X)、标准 差()、总体比例(P)等 – 总体参数通常用希腊字母表示
不同计量层次的比较
测定层次 特征 运算功能 举例
1、分类数据
2、顺序数据 3、数值型数据
分类
分类;排序
计数
计数;排序
产业分类
企业等级 产品质量 差异
分类;排序; 计数;排序; 有基本测量单位 加减
量 化 等 级
3
2
1
功 能 包 容
3 2
1
二、按收集方法分
1. 观测数据(observational data) – 通过调查或观测而收集到的数据 – 在没有对事物人为控制的条件下而得到的 – 有关社会经济现象的统计数据几乎都是观测 数据
• 从研究对象看,数学以最一般的形式研究数量的联系和空间形式。 统计学特别是应用统计学则总是与客观的对象联系在一起的。 • 从研究方法看,数学主要是逻辑推理和演绎论证的方法。而统计 本质上是归纳的方法。统计学家特别是应用统计学家需要深入实 际,进行调查或实验去取得数据,研究时不仅要运用统计的方法, 而且还要掌握某一专门领域的知识。
2.实验数据(experimental data) – 在试验中控制试验对象而收集到的数据 – 比如,对一种新药疗效的试验,对一种新 的农作物品种的试验等 – 自然科学领域的数据大多数都为试验数据
三、按时间状况分
截面数据 时间序列数据 在不同时间上收集到 的数据 描述现象随时间变化 的情况 比如,2000年至2011 年国内生产总值数 据
三、统计的误用与滥用
错误的统计定义、错误的图表展示、不合理的样 本、数据的遗漏或逻辑错误等。
统计学与其他学科的关系
一、数学与统计学
– 数学与统计学都是研究数量规律的,都要利用各种公式进 行运算。数学中的概率论,为统计学提供了数量分析的理 论基础。统计学中的理论统计学以抽象的数量为研究对象, 其大部分内容也可以看作是数学的分支。 – 统计学与数学的区别。
案例3
后40回的作者是高鹗吗?
• 1981年,首届国际《红 楼梦》研讨会在美国召 开,威斯康星大学讲师 陈炳藻独树一帜,宣读 了题为《从词汇上的统 计论〈红楼梦〉作者的 问题》的论文。他从字、 词出现频率入手,通过 计算机进行统计、处理、 分析,对《红楼梦》后 40回系高鹗所作这一流 行看法提出异议,认为 120回均系曹雪芹所作。
案例4
身高?
体重?
钱?
案例5
历届诺贝尔经济学奖得主
1969-2010年共36位诺贝尔 经济学获奖者中,大约有三分 之二(21项)的研究成果与统 计和定量分析有关。因此,著 名经济学家萨缪尔森在其经典 的教科书,《经济学》12版中 特别提到:“在许多与经济学 有关的学科中,统计学是特别 重要的”。
2.顺序数据(rank data)
– 只能归于某一有序类别的非数字型数据 – 对事物类别顺序的测度,数据表现为类别, 用文字来表述 – 例如,产品分为一等品、二等品、三等品、 次品等
3.数值型数据
– 按数字尺度测量的观察值 – 结果表现为具体的数值,对事物的精确 测度 – 例如:身高为175cm、168cm、183cm
统计的应用领域
hydrology (水文学) industry (工业) linguistics (语言学) literature (文学) manpower planning (劳动力计划) management science (管理科学) marketing (市场营销学) medical diagnosis (医学诊断) meteorology (气象学) military science (军事科学) nuclear material safeguards (核材料安全管理) ophthalmology (眼科学) pharmaceutics (制药学) physics (物理学) political science (政治学) psychology (心理学) psychophysics (心理物理学) quality control (质量控制) religious studies (宗教研究) sociology (社会学) survey sampling (调查抽样) taxonomy (分类学) weather modification (气象改善)
只能取可数值的变量,称为离散型变量。 离散型变量的取值可以按一定次序一一列举, 变量值通常用整数表示。
特定范围的人口数、汽车数 量、企业数量、林木株数、 畜禽数量等等
取值不需要用工 具度量,用计数 的方式即可
总体
样本
参数
统计量 平均数 标准差 比 例 x
(X) P
统计学
经济统计学
经济学
第二节 统计数据及其类型
分类数据 顺序数据 数值型数据
观测数据
实验数据
截面数据 时间序列数据
一、按计量尺度分
1. 分类数据(categorical data) – 只能归于某一类别的非数字型数据 – 对事物进行分类的结果,数据表现为类别, 用文字来表述 – 例如,人口按性别分为男、女两类
actuarial work (精算) agriculture (农业) animal science (动物学) anthropology (人类学) archaeology (考古学) auditing (审计学) crystallography (晶体学) demography (人口统计学) dentistry (牙医学) ecology (生态学) econometrics (经济计量学) education (教育学) election forecasting and projection (选举预测和策划) engineering (工程) epidemiology (流行病学) finance (金融) fisheries research (水产渔业研究) gambling (赌博) genetics (遗传学) geography (地理学) geology (地质学) historical research (历史研究) human genetics (人类遗传学)
s
p
End of Chapter 1
统计学家与数学家
• 统计学家调侃数学家:你们不是说若 X=Y且Y=Z,则X=Z吗!那么想 必你若喜欢一个女孩,那么这个女孩喜 欢的男生你也喜欢吧? •也没事吧!因为它们平均不 过是五十度而已!”
二、统计学与经Leabharlann 学在相同或近似相同的时 间点上收集的数据
描述现象在某一时刻的 变化情况 比如,2011年各国的国 内生产总值数据
第三节 统计中的基本概念
一、总体与样本 总体 即统计总体,是指客观存在的、在同一 性质基础上结合起来的许多个别事物的整体。 总体单位 即构成统计总体的个别单位。
总体
统计总体的种类
有限总体 指所包含的单位数目有 限的总体
案例2:撑死的人比饿死的人多! 据统计,肥胖并发脑血栓和心衰的发病率比正 常体重者高一倍,患冠心病者多2~5倍,高血压发 病率多2~6倍,合并糖尿病者高4倍,合并胆石症者 高4~6倍。美国生命保险协会的统计调查结果显示, 超重25%和35%的肥胖症者的死亡率比正常人高28 %和50%,表明肥胖程度和死亡率呈正相关。美国 每年因肥胖伴有冠心病、高血压、高血脂、糖尿病 和脑血管意外而死亡的人数大约有30万人。
第一节 统计及其应用领域
一、什么是统计学 统计学是收集、处理、分析、解释数据并从数据中 得出结论的科学
统计方法
描述统计
推断统计
参数估计
假设检验
描述统计
1.研究数据收集、整理和描 述的统计学分支 2.内容:收集数据 整理数据 展示数据 描述性分析 3.目的:描述数据特征 找出数据的基本规律