第三章 有限数据的统计与检验
09、第三章第一节质量统计分析(一)

第三章建设工程质量的统计分析和试验检测方法第一节质量统计分析一、工程质量统计及抽样检验的基本原理和方法㈠总体、样本及统计推断工作过程:总体(母体);个体; 有限总体;无限总体;样本(子样);样品;样本容量㈡质量数据的特征值⒈描述数据集中趋势的特征值样本数据特征值是由样本数据计算的描述样本质量数据波动规律的指标。
算术平均数(均值) 是消除了个体之间个别偶然的差异。
是数据的分布中心,对数据的代表性好总体算术平均数μ样本算术平均数 x样本中位数按数值大小有序排列样本数n为奇数,数列居中的一位数样本数n为偶数,取居中两个数的平均值⒉描述数据离散趋势的特征值极差计算简单、使用方便,但粗略,数值仅受两个极端值的影响,损失的质量信息多,不能反映中间数据的分布和波动规律,仅适用于小样本标准偏差标准差值小说明分布集中程度高,离散程度小,均值对总体(样本)的代表性好;总体标准差样本样本容量较大(n≥1(标准差或均方差) 标准差的平方是方差,有鲜明的数理统计特征,能确切说明数据分布的离散程度和波动规律,是最常用的反映数据程度的特征值标准差50)时,分母n-1简化为n变异系数(离散系数) 表示数据的相对离散波动程度。
变异系数小。
说明分布集中程度高,离散程度小,均值对总体(样本)的代表性好。
适用于均值有较大差异的总体之问离散程度的比较标准差除以算术平均数得到的相对数【例】下列质量数据特征值中,用来描述数据集中趋势的是()。
A.极差B.标准偏差C.均值D.变异系数【答案】C【例】下列质量数据特征值中,用来描述数据离散趋势的是()。
A.极差B.中位数C.算术平均数D.极值【答案】A㈢质量数据的分布特征⒈质量数据的特性质量数据具有个体数值的波动性和总体(样本)分布的规律性。
⒉质量数据波动的原因正常波动偶然性原因引起影响因素的微小变化具有随机发生的特点,是不可避免、难以测量和控制的,或者是在经济上不值得消除,它们大量存在但对质量影响很小,属于允许偏差、允许位移范畴异常波动系统性原因引起影响质量的人机料法环等因素发生了较大变化,如工人未遵守操作规程、机械设备发生故障或过度磨损、原材料质量规格有显著差异等情况发生时,没有及时排除⒊质量数据分布的规律性2。
统计学第三章统计数据的整理与显示(新).

人 数 15 12 9
6
3 80 90 100 110 120 130 身高
折线图、曲线图
折线图 将组中值用折线连接而成。 曲线图:当组数无限增多,则组距无限减小,此 时折线趋近于曲线。
160000 140000 120000 100000 80000 60000 40000 20000 0
GDP(亿元)
调查所得到的大量原始资料进行科学分组和汇总,使其 系统化、条理化,以得出反映总体综合特征的资料的工 作过程。
二、数据整理的原则:条理化,系统化(P40)
三、数据汇总的组织和技术
数据汇总的组织 逐级汇总:从下到上,如,县、市、省、中央 集中汇总:一次性汇总,如,直接在中央汇总 统计资料汇总技术(P41) 一手资料汇总方法:手工、计算机 二手资料汇总方法:调整法、推算法、再 分组法
身高(cm) 人数(人) 80—90 3 90—100 7 100—110 13 110—120 5 120—130 2 合计 30
编制数列:一个例子
例1:某生产车间50名工人日加工零件数 (个)如下,试采用单项数列对数据进行 分组;
122 131 118 134 114 124 125 123 127 120 129 117 126 123 128 139 122 133 119 124 107 133 134 113 115 117 126 127 120 139 130 122 123 123 128 122 118 118 127 124 125 108 112 135 121
对上例的数据进行组距分组; 第一步:排序; 第二步:确定全距R=139-107=32; 第三步:用经验公式确定组数: m=1+lg50/lg2(约)=1+3.3lgN=7 第四步:确定组距=全距/组数=32/7 (约)=4.6; 为便于计算统计,也为了与组限的确定(以尾数 5或0)衔接,确定组距为5; 第五步:确定组限;第一组的下限应略低于最小 变量值(本例中为107),故第一组的下限取为 105;最后一组的上限应略大于最大变量值(本 例中为139),故最后一组的上限取为140; 第六步:编制变量数列(见下页)
第三章统计数据的整理与展示

编制结果
组中值: 5-(10-5)/2=S2T.A5T
根据“上限不包括在内”原则,所以在
5的销~1数0售之值额间值,有(不:百应5.万0该5把元.81)06包.0括组6在.4内中6.,8值这7.里0 商店数
7.4 8.3 8.5 9.5
5以下
2.5
4
5~10 10~15 15~20
172.5.5组25中+值(:211006-25)/2=27.5 17.5 13
储蓄存款
品
活期
质 标 志
定期 财政性存款
复合 分组
分 组
活期 定期
STAT
例2 :企业职工按工龄分组
5年以下
5~10年
10~15年
数量标志分组
15~20年
20年以上
统计分组的程序与原则
选择分 组标志
确定分 组体系
总体单 位归类
科学性: 组间差异 大,组内 差异小。
完备性和互斥性: 每个单位均能且 只能归到某个组 中。
2. 时效性审核 – 应尽可能使用最新的统计数据
3. 确认是否必要做进一步的加工整理
数据的筛选
STAT
1. 对审核过程中发现的错误应尽可能予以纠正 2. 当发现数据中的错误不能予以纠正,或者有些
数据不符合调查的要求而又无法弥补时,需要 对数据进行筛选 3. 数据筛选的内容包括:
▪ 将某些不符合要求的数据或有明显错误的数
志作为分组标志 • 要结合现象所处的具体历史条件或经济条
件来选择分组标志
例 1 : 为了了解某地区银行存款的构成,可以选 用存款性质、期限两个标志分别进行分组
STAT
按存款性质分组 企业存款 储蓄存款 财政性存款
分析化学 第3节 有限量测量数据的统计处理

2020/12/16
h
30
2.格鲁布斯(Grubbs法)测定次数 置信度 置信度
h
3
•正态分布的数学表达式为
yf(x)
1
( x )2
e 2 2
2
2020/12/16
h
4
y
y
10
5
0 15.80 15.90 16.00 16.10 16.20
x
25.0 20.0 15.0 10.0 5.0 0.0
15.80 15.90 16.00 16.10 16.20
x
2020/12/16
2020/12/16
h
11
y
P
0.40
0.30
0.20
½a
0.10
0.00
-3 -2 -1
86.6%
0
1
u
½a
2
3
2020/12/16
h
12
1-
1/2
-t,f
1/2 t,f
2020/12/16
h
13
三、 平均值的精密度与置信区间
(一)平均值的精密度
由统计学可得:
SX S/ n
例 若某样品经4次测定,标准偏差是 20.5ppm,平均值是144ppm。求平均值 的标准偏差。
2020/12/16
h
14
(二)置信区间
统计学 第3章 数据的整理与显示

3 - 11(71)
经济、管理类 基础课程
数据排序
(方法)
统计学
1. 分类数据的排序 字母型数据,排序有升序降序之分,但习惯上
用升序 汉字型数据,可按汉字的首位拼音字母排列, 也可按笔画排序,其中也有笔画多少的升序降 序之分
统计学
【例】在一项城 市住房问题的研 究中,研究人员 在甲乙两个城市 各抽样调查300户 ,其中的一个问 题是:“您对您 家庭目前的住房 状况是否满意? 1.非常不 满意;2.不满意 ;3.一般;4. 满意;5.非常满 意。
3 - 23(71)
非常不满意 不满意 一般 满意 非常满意 合计
经济、管理类 基础课程
3 - 13(71)
经济、管理类 基础课程
一、数据的整理与显示
(基本问题)
统计学
1. 要弄清所面对的数据类型,因为不同类型的 数据,所采取的处理方式和方法是不同的 2. 对分类数据和顺序数据主要是做分类整理 3. 对数值型数据则主要是做分组整理
4. 适合于低层次数据的整理和显示方法也适合 于高层次的数据;但适合于高层次数据的整 理和显示方法并不适合于低层次的数据
3 - 14(71)
经济、管理类 基础课程
分类数据的整理
(基本过程)
统计学
1. 列出各类别 2. 计算各类别的频数 3. 制作频数分布表 4. 用图形显示数据
分类 A B C D E 频数 比例 百分比 比率
3 - 15(71)
经济、管理类 基础课程
分类数据的整理
第三章 医学统计基本方法ppt课件

R=0.8
R=1.2
优点
极差(range)
1.表示变异范围,简单明了; 2.各种分布类型的资料均可用。
缺点
1. 不能全面反映资料的离散程度; 2. 不稳定,易受极端值的影响,抽样误差大。
2、四分位数间距
四分位数间距是上四分位数和下四分位 数之差,用Q表示 。下四分位数QL=P25, 上四分位数QU=P75,四分位数间距即QUQL。
4.8
2组 4.2 4.5 4.8 5.1 5.4
4.8
3组 4.4 4.7 4.8 4.9 5.2
4.8
全距表示一群变量值的最大值与最小值之差,
反映个体差异的范围,用R表示。全距大,说明
变异度大;反之,说明变异度小。
1组 4.4 4.6 4.8 5.0 5.2 3组 4.4 4.7 4.8 4.9 5.2 2组 4.2 4.5 4.8 5.1 5.4
等比资料
对数正态分布
位次居中的
偏态分布;分布不
观察值水平
明;分布末端无确定值
描述观察序列在某 可用于确定医学参考值
百分位置的水平, 范围,适用于任何分布。
例9-14 三组健康成年男性红细胞数(×1012/L) 的测得值如下,试分析其平均水平和离散趋 势。
x
1组 4.4 4.6 4.8 5.0 5.2
第三章 医学统计基本方法
第一节 医学统计基本步骤
统计学是研究数据资料搜集、整理与分 析、推断的科学,面对不确定性数据做出 科学的推断,是认识社会和自然现象数量 特征的重要工具。
一、统计学的若干基本概念
(一)同质与变异 同质:是指观察单位(研究个体)间被研究指标的影响因
素相同。 变异:由于生物个体的各种指标所受影响因素复杂,同质
统计学课件第三章统计数据的整理与显示
统计学概论
绿色
健康饮品
用Excel制作频数分布表
课件
22
中南大学
分类数据的图示—条形图
统计学概论
1. 用宽度相同的条形的高度或长短来表示各类别 数据的图形
2. 有单式条形图、复式条形图等形式
3. 主要用于反映分类数据的频数分布
4. 绘制时,各类别可以放在纵轴,称为条形图, 也可以放在横轴,称为柱形图
不满意 (a)向上累积
满意
不满意 (b)向上累积
满意
甲城市家庭对住房状况评价的累积频数分布
课件
31
中南大学
环形图
统计学概论
1. 环形图中间有一个“空洞”,总体中的每一部 分数据用环中的一段表示
2. 环形图与圆形图类似,但又有区别
– 圆形图只能显示一个总体各部分所占的比 例
– 环形图则可以同时绘制多个总体的数据系 列,每一个总体的数据系列为一个环
课件
3
中南大学
数据整理的目的
统计学概论
数据整理的目的在于将个别单位的标志值转化 为说明总体数量特征的指标值,使统计资料系统化, 从而得出反映现象总体性和规律性的综合资料,为统 计分析提供基础和前提条件。数据根据其标志的类型, 将数据分为分类数据、定序数据和数值型数据.
课件
4
中南大学
数据整理与显示的基本问题 统 计 学 概 论
一般
93 31 225 75.0 168 56
满意
45
15 270 90.0 75
25
非常满意 30
10 300 100.0 30
10
合计
300 100.0 —
—
—
—
课件
29
统计学第三章
• 第一节 统计整理的意义和方法 • 第二节 统计分组 • 第三节 频数分布 • 第四节 数据显示
第一节 统计整理的意义和方法
• 一、统计整理的意义 • 二、统计整理的内容与程序
一、统计整理的意义
统计整理是统计工作的中间环节,是 统计调查的继续和发展,是统计分析的前 提和条件,在整个统计工作过程中起承上 启下的作用。
(5)归类汇总计算各组次数
• 所谓归类汇总,是指按照各个总体单位的 具体标志值,将其划归某一具体组之中, 在归类汇总时,要遵循“不重复不遗漏” 的基本原则。
• 对于恰好是组限的标志值的总体单位之归 类问题,一般应按“上限不在内”原则, 即本组下限的次数属于本组,本组上限的 次数归于邻近的较大组。
例:某工业企业100名工人按每周工资额分组
410 420 420 420 420 420 430 430 430 440
440 440 440 450 450 450 460 460 460
(2)确定全距(计为R), 即:
R xmax xmin
x 式 中, max :原数列的最大值
xmin :原数列的最小值
此例中,R=650-200=450(元)
变量数列又有单项式数列和组距式数列, 分别由单项式分组和组距式分组形成。
品质数列示例
例: 某企业职工按性别分组表
性别 人数(人) 比重(%)
男
240
40
女
360
60
合计
600
100
变量数列示例——组距式数列
例: 某小学四(1)班学生分组表
身 高(cm) 120以下 120~130 130~140 140~150 150以上
✓ 下限,上限:组距式分组的每一组变量值中,其最小值为下限, 最大值为上限。
统计学第三章统计数据的整理与显幻灯片PPT
统计学概论
▪ 用Excel进行数据筛选
▪ 8名学生的考试成绩数据
课件
15
中南大学
数据排序
统计学概论
1. 按一定顺序将数据排列,以发现一些明显的特征 或趋势,找到解决问题的线索
2. 排序有助于对数据检查纠错,以及为重新归类或 分组等提供依据
3. 在某些场合,排序本身就是分析的目的之一
4. 排序可借助于计算机完成
课件
17
中南大学
§3.2 分类和顺序数据的整理与显示 统 计 学 概 论
一. 分类数据的整理与显示 二. 顺序数据的整理与显示
课件
18
中南大学
数据整理的几个概念
统计学概论
1. 频数(frequency) :落在各类别中或各组中的 数据个数
2. 频率(比例)(proportion) :某一类(组)别数据 个数占全部数据的比值
频数
比例
百分比 比率
☺☺☺ ☺☺
课件
21
中南大学
分类数据整理—频数分布表 (例题分析)
【例】一家市场调查公司
为研究不同品牌饮料的市场 占有率,对随机抽取的一家 超市进行了调查。调查员在 某 天 对 50 名 顾 客 购 买 饮 料 的品牌进行了记录,如果一 个顾客购买某一品牌的饮料 ,就将这一饮料的品牌名字 记录一次 。右边就是记录 的原始数据
数据整理的步骤: 1.数据的预处理 2.数据的分类和分组 3.编制统计表和统计图 4.统计资料的积累和保管
统计学概论
课件
6
中南大学
§3.1 数据的预处理
一. 数据审核 二. 数据筛选 三. 数据排序
统计学概论
课件
7
中南大学