社会统计学讲义
社会统计学第五讲

体与已知总体在参数值上有差别。 ➢ 假设一与二必居其一; ➢ 假设一被称为原假设或虚无假设(Null Hypothesis) ➢ 假设二被称为备择假设(Alternative Hypothesis)
可编辑ppt
5
假设检验的原理与方法
社会统计学
2006年4月28日
主要内容
➢ 假设检验的原理与方法 ➢ 单总体假设检验 ➢ 两类错误 ➢ 二总体假设检验 ➢ 课本映射:第七章、第八章、第九章(第一、
二节、第三节第一条)
可编辑ppt
2
假设检验的原理与方法
➢ 抽样误差(sampling error):
➢ 抽样(sampling):通过一定的方法从总体中 随机抽取一定量的个体的过程。
➢ 这种检验方法被称为双边检验(Two-Tailed Test)
可编辑ppt
11
假设检验的原理与方法
➢ 如果备择假设明确假定样本对应总体的参数值 大于或小于已知总体参数值,则可以直接确定 拒绝域为α及所对应的临界值。
➢ 这种检验方法称为单边检验(One-Tailed Test)
可编辑ppt
12
假设检验的原理与方法
➢ 第四步:比较观测值与临界值。如果观测值的绝对值 大于临界值的绝对值,则拒绝原假设,接受备择假设; 反之,则接受原假设。
➢ 第五步:做结论。
可编辑ppt
14
单样本假设检验
➢ 单总体假设检验:总体的参数值已知的条件下, 对总体进行随机抽样调查得出样本的统计值。 通过样本统计值构建统计量检验总体参数值是 否与先前已知的总体参数不同。
α
单边│Zα│
(完整word版)卢淑华 《社会统计学》讲义

社会统计学讲义第一章导论一、社会统计学1、社会统计学是运用统计的一般原理,对社会各种静态结构与动态趋势进行定量描述或推断的一种专门方法和技术。
研究对象:概括而言是指社会现象的数量方面。
2、选择统计分析方法的原则是根据研究目的和资料本身的特点选择。
3、统计分析的作用:(1)可对资料进行简化和描述;(2)可对变量间的关系进行描述和深入地分析(统计分析通过事后解释使得探讨变量间复杂的因果联系成为可能);(3)可通过样本资料推断总体(通过参数估计和假设检验,将样本推论到总体并指出这种推论的误差及做出这种推论的把握有多大)。
4、社会统计的基本程序(1)制定计划;(2)统计调查;(3)统计整理;(4)统计分析;(5)统计报告。
5、几个基本概念(1)总体与单位总体又称母体,是作为统计研究对象的、由许多具有共性的单位构成的整体。
构成总体的每一个个体称为总体单位,简称单位或个体。
3个基本特征:大量性、同质性和变异性。
(2)标志与变量总体的每个单位都具有许多属性和特性,说明总体单位属性或数量特征的名称在统计上称为标志,分为数量标志和品质标志。
可变的品质标志无法用数值表示,我们称之为变项;可变的数量标志能够用数值表示,我们称之为变量。
(3)指标与指标体系统计指标是反映总体(或样本总体)的数量特征的概念或范畴。
一个完整的统计指标由两部分构成:指标名称和指标数值。
在社会统计中,如要全面把握对象总体情况,就不能单凭一个指标,而要靠一组相互联系的并与之相适应的指标来完整地反映对象总体。
指标体系就是一系列有内在联系的统计指标的集合体。
二、社会调查研究的程序社会学研究之阶段与步骤(1)确定课题:来源与社会学理论、当前社会现实和要解决的实际问题;具有强烈的时代感、为国家现代化服务;(2)了解情况:查阅文献和向有经验、有知识的人了解,运用个案调查、典型调查进行探索性研究;(3)提出一定的想法和建立假设:差异式、函数式;(4)建立概念和测量方法:采用适当的术语和概念;操作化定义;概念的表现形式往往具有多值性;(5)设计问卷:内容包括事实、态度与看法、行为趋向、理由;方式有固定答题式和自由答题式;(6)试填问卷:发现不周或遗漏之处在试填阶段予以纠正;(7)调查实施(抽样调查):从局部推论到全体(8)校核与登录(9)统计分析与命题的检验:检验最初研究阶段的命题或假设是否得到证实或部分证实,在此基础上对研究内容提出建议和确定进一步的研究方案。
社会统计学讲义

社会统计学讲义(卢淑华)第一章社会学研究与统计分析一、社会调查资料的特点(随时掌握)随机性、统计规律性;二、统计学的作用:为社会研究提供数据分析和推论的方法三、统计分析的作用及其前提。
四、统计分析方法的选择1 、全面调查和抽样调查的分析方法2 、单变量和多变量的统计分析方法五、不同变量层次的比较;定类、定序、定距、定比定义、数学特征、运算特性、涵盖关系、等第二章单变量统计描述分析一、统计图表,熟悉不同层次变量对应的分析图表,不能混淆。
尤其是直方图的意义。
二、标明组限与真实组限的换算,重要。
三、集中趋势测量法1 、定义、优缺点、注意事项;2 、众值:定义、计算公式、解释、运用,注意事项;3 、中位值:定义、计算公式(频数和比例两种公式)、解释、运用,注意事项;4 、均值:定义、计算公式(分组与加权)、解释、运用,注意事项;5 、众值、中位值和均值的关系及其相互比较,会用众值和中位值估算均值;四、离散趋势测量法1 、定义、优缺点、注意事项,与集中趋势的关系;2 、异众比例:定义、计算公式、解释、运用,注意事项;3 、质异指数:定义、计算公式、解释、运用,注意事项;4 、四分位差:定义、计算公式(频数和比例两种公式)、解释、运用,注意事项;要会举一反三,如求十分位差、以及根据数据求其在总体中的位置。
5 、方差及标准差:定义、计算公式(分组与加权)、解释、运用,注意事项;第三章概率一、概率:就是指随机现象发生的可能性大小。
随机现象具有不确定性和随机性。
二、概率的性质:1 、不可能事件的概率为O ;2 、必然事件的概率为1 ;3 、随机事件的概率在O 一1 之间;三、概率的计算方法:1 、古典法:计算等概率事件,P 一有效样本点数/样本空间数;2 、频率法:求随机事件在多次试验后的极限频率。
3 、概率是理论值,只有一个,频率是试验值,不同的试验有不同的频率。
四、概率的运算:会画文氏图1 、加法公式:两个或多个随机事件的求和概率‘2 、乘法公式:两个或多个随机时间共同发生的概率。
社会统计学(卢淑华),第五章

卡方分布性质
性质1 如果随机变量 1 , 2 ,…… k 相互独立,
2
量:
x
2
1
2
i
k 2 i 1
仍然服从自由度为k的 X2 的平方分布。
性质2:
如果随机变量 和 独立,并且分别服 从自由度为K1与K2的X2 分布,则其和 服从自由度为K1 + K2的X2分布。
,求
2)P 1.3 3)P1.3 2.3
2、ξ 满足N 0,1 ,P 0.05 ,求λ 值。 3、ξ 满足 N 50,52 ,求 P 61
第四节 常用统计分布
一、X2分布(卡方分布) 1、设随机变量 1,2, k 相互独立,且都服
三、切贝谢夫大数定理
1、定义:设随机变量 , …是相互独立服 从 同 一 分 布 , 并 且 有 数 学 期 望 E i 差 Di 2 ,那么对于任何一个正数 ,
1
2
有: n 为 1 , 2 …n个随即变量的平均值 2、含义:当实验次数n足够大时,n个随机变 量的平均值 与单个随机变量的数学期望 的 差可以任意的小,这个事实以接近于1的很大 概率来说是正确的,即 趋近于数学期望 3、实际:意义可以用抽样的均值 做为总体均
P 2 z 2 0.9546
P 3 z 3 0.9973
例:
例1:σ相同而µ 不同。学习成绩:甲位于一班, 乙位于二班。一班平均成绩80分,二班平均成绩 60分,甲成绩80分,乙成绩80分。σ相同,为 10,比较二者在班上的成绩。 例二: µ 相同而σ不同:如果 1 2 60
社会统计学重点章节讲义

30%
25.8% 25.8%
25%
20%
19.2% 17.1%
15%
10%
8.8%
5%
0%
保健品 功能饮料 健身场所 减肥产品 体育用品 健身器材
第四页,编辑于星期日:二十点 三十八分。
• 原始数据
2.2 样本分布
第五页,编辑于星期日:二十点 三十八分。
2.2 样本分布
• 频数表
职业 公司职员 公务员 个体户/自营职业者 专业技术人员(医生/律师等) 专职家庭主妇 学生 其他 合计
– 差异性检验的基本方法 – 方差分析
• 变量间的关联性分析
第三十三页,编辑于星期日:二十点 三十八分。
4.1 差异性检验的基本方法
• 单一样本检验:
–置信区间
–t检验概值
• 两个独立/配对样本检验:
–置信区间 –t检验概值
• 多个样本:
t 估计标 值 原 准假 误设 差的值
–方差分析:F检验概值
t
用了多少 桶水
2.6
检验值=6
差值的95%置
df
双侧概 平均差
值
异
信区间
下限 上限
65 0.012 3.08 0.71 5.44
概值小于0.05,可以在95%置信度下拒绝原假设。
第三十七页,编辑于星期日:二十点 三十八分。
案例:过去三月平均每户用水量
• 两个独立样本t检验
– 全家平均月收入2000以下者:9.49桶 – 全家平均月收入2000以上者:8.19桶
• 抽样调查的原理和方法 • 描述性统计 • 推断性统计
–抽样分布 –参数估计 –假设检验
• 群体间的差异性检验 • 变量间的关联性分析
社会统计学(第一讲)

子代偏重
开始学习社会统计学之前的知识储备
什么是变量? 变量有哪些层次? 不同类型变量的统计表制作方法?
总体与单位
所谓总体,就是作为统计研究对象的、由许多具有共性的单位 构成的整体。总体也有人称之为母体。 构成总体的每一个个体 称为总体单位,简称单位,也称为个体。
有限总体与无限总体
可加总体与不可加总体
广东
广东 广东 广东 广东
综合
师范 农林 医药 综合
8.20
6.64 6.15 4.36 3.94
6.94
4.03 6.17 3.78 4.21
7.03
7.74 5.85 4.54 2.80
18.79
13.34 6.03 5.46 7.26
128
173
广州中医药大学
广州大学
广东
广东
医药
综合
3.16
1.84
样本
样本是从总体中抽取的一部分个体所组成的集合,也称子样。 样本容量是指样本所包含的个体数。当样本容量大于30时,为大样本。 样本个数是指从总体中最多可以抽取的不同样本的套数。样本容量用
n表示。样本个数用m表示。
总体与样本的关系 1、总体是所要研究的对象,而样本则是所要观测的对象。 2、样本是用来推断总体的。 3、总体和样本的角色是可以改变的。 4、总体与样本都有大量性,同质性和差异性的特征。样本容量用n表示。样本 个数用m表示。
社会科学研究的一般过程
二、统计学的运用 介绍有关社会调查资料收集、整理、分析和 推论的统计方法。 社会统计学的特点: 抽象概念向操作化定义,设计好调查问卷; 被测量对象是人,主观意识影响资料收集; 低层次变量占较大比重。
确定课题、了解情况 建立研究假设 概念的操作化 设计问卷、抽样调查
《社会统计学》PPT课件(110页)

《社会统计学》PPT课件(110页)一、引言社会统计学是研究社会现象数量特征及其规律的学科,是社会学的重要组成部分。
本课件将带领大家深入了解社会统计学的定义、研究方法、数据来源以及在社会各个领域的应用。
二、社会统计学的定义社会统计学是一门应用统计学原理和方法,对社会现象进行数量分析和描述的学科。
它通过收集、整理、分析和解释社会数据,揭示社会现象的数量特征、变化规律和相互关系,为社会决策提供科学依据。
三、社会统计学的研究方法1. 调查研究法:通过问卷调查、访谈等方式,收集社会数据,了解社会现象的实际情况。
2. 实验研究法:在控制条件下,对研究对象进行实验,观察和记录实验结果,分析社会现象的因果关系。
3. 文献研究法:通过查阅相关文献,了解社会现象的历史、现状和发展趋势。
4. 案例研究法:选取具有代表性的社会现象,进行深入分析,揭示其内在规律。
5. 统计模型法:运用统计模型,对社会现象进行定量分析,预测社会现象的未来发展趋势。
四、社会统计学数据来源1. 政府统计部门:提供国家、地区和行业的社会经济数据。
2. 学术研究机构:发布学术研究报告,提供社会现象的定量分析结果。
3. 社会调查机构:开展社会调查,收集社会数据,为政府、企业和社会组织提供决策依据。
4. 新闻媒体:报道社会现象,提供社会数据的实时更新。
5. 公共图书馆和档案馆:保存历史文献,为研究社会现象提供数据支持。
五、社会统计学在社会领域的应用1. 社会经济领域:分析经济增长、就业、收入分配等社会经济现象,为国家制定经济发展政策提供依据。
3. 社会问题领域:分析社会问题,如贫困、犯罪、环境污染等,为解决社会问题提供科学依据。
4. 社会发展领域:研究社会发展规律,为推动社会进步提供理论支持。
5. 社会管理领域:分析社会管理现状,为提高社会管理水平提供数据支持。
社会统计学作为一门研究社会现象数量特征及其规律的学科,具有广泛的应用价值。
通过掌握社会统计学的定义、研究方法、数据来源及其在社会领域的应用,我们可以更好地了解社会现象,为政府、企业和社会组织提供决策依据,推动社会进步。
社会统计学2

第一节分布、统计表和统计图
• 一、变量及其测量划分 • 变量是所研究问题的特征或性质,也称作指标。在自然科学中,
变量是可以通过仪器进行测量的。在社会学研究中,变量往往通 过向被访者问问题来进行测量。落实在变量的设计上,就需要根 据调查研究的问题的不同,设计出不同层次的变量,具体划分为 定类变量、定序变量、定距变量、定比变量。
• 1、定类变量
• 定类变量是最低的变量层次,它的取值只有类别属性之分,而无 大小程度之别,如民族、婚姻、职业等变量。
• 2、定序变量
• 定序变量的取值除了有类别属性之外,还有等级次序的差别,其 层次高于定类变量,常见的定序变量,如受教育程度、满意度、 幸福感、社会经济地位等。在使用量表测量时,往往是基于定序 变量。
如贫困问题,需要对低收入段分得细一些。研究老龄化问题,则 需要对老年群体分得细一些。这些都会带来非等距分组。
• 3、组限
• 组限是指每组的范围,即每组的上限和下限。对于离散型变量一 般采取相邻组限不重叠的原则,而对于连续型变量,可能出现相 邻组限重叠的情况,这时采取的原则就是“上组限不在内”原则。 对于开口组求组中值,是依据相邻组的组距加减其一半求得。
• 箱体图反映数据的集中程度,也反映出均值的代表性程度。
• 图2-8显示,流动人口中,女性的平均年龄略低于男性,女性的年 龄更加集中。
第二节 集中趋势测量法
• 集中趋势测量法是找出一个数值来代表该变量数据集结情况的方 法。该方法的优劣在于,由于是根据一个代表值来估计或预测每 个研究对象的数值,因此运用该方法要舍去变量的某些信息,但 由于该数据是最有代表性的数值,以该数值做代表所产生的误差 最小。
• 1、点线图
• 线代表变量,线上标明的是变量的取值,线上方的每一个点代表 一个观测值。点线图的优点是直接,能够看到哪些地方观测值密 集,哪些地方观测值稀少,不丢失任何信息。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《社会统计学》讲义教学目的和要求:通过本课程的学习,使学生熟悉常用的统计方法,并且学会如何将统计分析知识应用于社会调查研究之中,掌握统计方法的灵活运用。
本课程偏重统计方法的实际应用,而非其数理基础。
在教学过程中,注重对于不同统计分析方法适用条件的说明,统计公式的讲解,以及对于统计值意义的说明。
教学重点和难点:本课程的教学重点是不同统计分析方法所适用的条件以及统计值意义的解释。
难点是统计公式的讲解以及不同统计分析方法在实际社会调查研究中的应用。
教法特点说明:课堂讲授为主,注重对实例的讲解。
教材和参考书目:1、卢淑华著:《社会统计学(第三版)》,北京大学出版社,2007年。
2、李沛良著:《社会研究的统计应用》,社会科学文献出版社,2002年。
3、柯惠新等著:《调查研究中的统计分析法》,北京广播学院出版社,1992年。
4、风笑天著:《现代社会调查方法》,华中科技大学出版社,2001年。
5、袁方主编:《社会研究方法教程》,北京大学出版社,1997年。
第一章统计学简史教学目的和要求:通过本章的学习使学生了解统计学的产生、发展历程有初步的认识。
教学重点和难点:重点是国势学派与政治算数学派的差异,难点是文字记述与数字记述各自的特点。
教学方法:课堂讲授教学内容:一、统计学的起源统计技术:古埃及、古中国(大禹治水)统计学:17世纪中叶Status(拉丁词汇,国家、状态)——Statistics 研究国家的宏观状态①国势学②政治算术二、国势学(17世纪的德国)德国大学学派:H·Coring 用文字记录一个国家的状况和制度G·Achenwall 第一个定义——把国家的显著事项全部记录下来的学科三、政治算术(17世纪的英国)英国的经验主义者:用数量或数字的方法说明国家的特征J·Graunt 《关于伦敦死亡表的观察》用数量分析社会、政治问题William Petty 《政治算术》四、概率论(数理特征更加明显)1.J Bernoulli(贝努里)瑞士大数法则借助大数法则可以从社会现象复杂不定的偶然性中寻找规律,它说明了社会现象的稳定性2.Gauss(高斯)德国正态分布(中心极限定理的基础)五、数理统计学Adolphe Quetelet(阿道夫·凯特勒)法籍比利时人数理统计学派的创始人“经验社会学之父”《社会物理学》“平均人”六、描述统计高尔顿(F Galton)回归现象根据对1078对父、子身高的散布图发现,虽然身材高的父母比身材矮的父母倾向于有高的孩子。
但平均而言,身材高大的其子要矮些,而身材矮小的其子要高些。
或者说,无论高个子或矮个子的后代,都有向均值方向拉回的倾向。
这种遗传上身高趋于一般,“退化到平庸”的现象,即是回归现象。
卡·皮尔逊(K Pearson)分布、相关、频数、皮尔逊系数七、推论统计部分→整体T检验、F检验第二章社会调查研究与统计分析教学目的和要求:通过本章的学习使学生了解社会调查研究的历程,明确统计分析在社会调查研究中所处的位置和作用。
熟悉统计分析的具体内容,牢记统计分析方法的选择标准,能够熟练地判断应用。
教学重点和难点:重点是社会调查研究的历程,难点是统计分析方法的选择标准,尤其是变量的测量层次。
教学方法:课堂讲授,结合实例讲解教学内容:第一节社会调查研究历程一、概念二、社会调查研究的历程1.确定课题课题的选择应具有一定的理论意义或应用价值,应当是社会迫切解决理论问题或实际问题就要有一定的迫切性,另外还要注意课题的可行性,以及研究者的主客观条件是否具备等。
2.初步探索通过查阅文献和向有经验的,有知识的人请教或者自己进行探索性调查,搜集获取第一手资料。
3.建立假设差异式(如果A越高,则B也(如果A越高,则B 也越高)函数式(A不同则B不同)4.理论解释和澄清概念概念的操作化:把那些通常只存在于我们头脑中的抽象概念,转化为我们看得见、摸得着,可以观察的具体指标社会地位——个人在社会中的位置——收入、职业、受教育程度5.设计问卷封闭式问题、开放式问题6.试填问卷7.调查实施8.资料整理:问卷的核对、登录9.统计分析与命题检验二、社会学研究的两个层次1.抽象层:包括概念命题理论2.经验层:包括观察量度测定分析等两者的关系紧密相联系遵循着:理论来源于实践,而又必须受到实践的检验第二节社会调查资料的特点和统计分析的内容一、社会调查资料的特点1.随机性大部分社会现象都具有非确定性,即在某种条件下可能发生也可能不发生。
2.统计规律性在表面上是偶然性在起作用的地方,这种偶然性始终是受内部的隐蔽着的规律支配的,而问题就在于发现这些规律。
二、统计分析的内容描述性统计:主要介绍资料的整理,分类和简化或特征研究推论性统计:主要介绍参数估计、假设检验、回归、列联、方差、等级相关等统计技术。
第三节怎样选用统计分析方法一、调查的方式全面调查——描述性统计抽样调查——推论性统计二、变量因素1.变量个数单变量双变量多变量2.变量层次定类:最低的变量层次,取值只有类别属性之分,而无大小程度之分。
数学运算符表示(=、≠)定序:取值除了有类别属性之外,还有登记次序的差别。
数学运算符表示(=、≠、>、<)定距:取值除了有类别、次序属性之外,取值之间的距离可用标准化的距离去测量。
数学运算符表示(=、≠、>、<、+、-)定比:除具有以上三种属性外,还可构成一个有意义的比率。
数学运算符表示(=、≠、>、<、+、-、*、/)(在社会学研究中,只满足定距而不满足定比的变量很少,因而研究中不再区分定比定距,而合为一类,称作定距变量)①高层次变量具有低层次变量的特性,反之不成立②一个变量他的层次并不是唯一的,③变量的层次与社会实际衡量之间存在着差距或不一致④变量类型的划分也不是唯一的,可根据自己领域的需要来划分。
第三章单变量描述性统计分析教学目的和要求:通过本章的学习使学生能够根据变量的测量层次,选择适当的表格、图形对数据资料进行初步简化,熟练地应用集中趋势和离散趋势测量法,对调查资料进行简化分析。
教学重点和难点:重点是集中趋势测量法、离散趋势测量法,难点是不同类型的统计图,尤其是直方图。
教学方法:课堂讲授,辅之以实例讲解教学内容:第一节最基本的单变量描述统计技术一、定类变量1、频次分布文字法、集合法、统计表法、统计图法2、频率分布文字法、集合法、统计表法、统计图法3、统计图——条形图、圆瓣图二、定序变量累加频次、累加频率三、定距变量1、连续型变量的分组问题组数;等距分组or非等距分组;决定分点的精度(组限、组距、组中点);2、统计图矩形图or直方图;折线图3、曲线类型四、统计表的制作1、统计表必须具备的内容表号、表头、标识行、主体行、表尾 2、制表过程收集数据;找出极差R=最大值L-最小值S ;确定组数;计算组距;实际分组;取中心值;统计频次,制表第二节 集中趋势测量法一、定类变量——众值Mo ——出现次数最多的值某班男生15人,女生30人。
Mo=女生 二、定序变量——中位值Md ——在一个序列的中央位置之值。
高于此值的有50%的个案,低于此值的也有50%的个案。
(一)未分组数据 1、原始资料首先要对个案按照从低到高的顺序排列;其次计算中位值所在的位置Md 位置==n+1/2;最后查找对应的数值 2、频次分布(频次分布表必须是按照由低到高的顺序排列的,而且列出了向上累加频次)首先计算中位值所在的位置Md 位置==n+1/2;其次按照累加频次找出中位值。
(二)分组数据 Md 位置==n/2Md=L+ 2n cf w f ⎛⎫-↑ ⎪⎪ ⎪⎝⎭L=中位值组之真实下限 f=中位值组之次数 w=中位值组之组距 cf ↑=低于中位值组真实下限之累加次数 n=全部个案数目三、定距变量——均值X ——将变量的各个数值相加起来,求取一个平均的数值(一)未分组数据 1、原始资料x X n=∑ n 是全部个案数目x ∑表示各个个案数值之和2、频次分布fxX n∑= x 是变量的各个取值,f 是每个变量值对应的次数,n 个案数目(二)分组数据mfxX n=∑ x m 是组中心值 2m U Lx +=小结:①三值设计的共同目的,都是希望通过一个数值来描述整体特征,以便简化资料,它们都反映了变量的集中趋势。
一般说:众值:适用于定类、定序和定距变量; 中位值:适用于定序和定距变量; 均值:适用于定距变量。
它们三者的代表性决定了它们具有估计和预测的作用。
②众值仅使用了资料中最大频次这一信息,因而资料使用不完全。
中位值,考虑了变量的顺序和居中位置,因此和总体频次分布有关,但因为只考虑居中位置,因而其他变量值的变化很难影响中位值,它也是三个集中值中最不敏感的。
均值,既考虑频次又考虑变量值的大小,因而更灵敏。
它的解释力最强,具有较高的统计价值。
③均值虽然灵敏,但对严重偏态的分布容易失去代表性。
即存在非常极端的分布值时,代表性不足。
例如,一个国家会因某些少数富翁的存在,使平均收入变得很高。
且在分组资料中的极端组没有组限时,不能求出均值,只能用中位值。
④偏态图形和三值的关系。
对于正态分布的图形来说,三值是合一的。
当图形正偏或负偏时,均值变化最快,中位值次之,众值不变。
第三节 离散趋势测量法一、定类变量——异众比率γ——非众值的次数与全部个案数目的比率。
公式为:n fmonγ-=n 是全部个案数目 fmo 是众值的次数二、定序变量——极差、四分位差(一)极差 R=最大值-最小值 (二)四分位差1、未分组数据 (1)原始资料 114n Q +=位置 3314n Q +=位置。
Q =3Q —1Q (2)频次分布 2、分组资料14n Q =位置 334n Q =位置 111114n cf Q L w f ⎛⎫-↑ ⎪=+ ⎪ ⎪⎝⎭ 3333334n cf Q L w f ⎛⎫-↑ ⎪=+ ⎪ ⎪⎝⎭Q =3Q —1Q1L =1Q 属组之真实下限 3L =3Q 属组之真实下限 1f =1Q 属组之次数 3f =3Q 属组之次数1cf ↑=低于1Q 属组下限之累加次数 3cf ↑=低于3Q 属组下限之累加次数1w =1Q 属组之组距 3w =3Q 属组之组距 三、定距变量——标准差、方差 (一)标准差、方差离均差x x -→离均差之和()x x -∑→离均差绝对值之和x x-∑→()2x x -∑→()22x x S n-=∑/S ==频次分布S ==分组资料S ==(二)变异系数/离散系数 1、使用离散系数的原因 2、S CV x =四、小结异众比率最适合于分析定类变项,也可分析定序、定距变项。
它仅考虑频次 极差、四分位差(十分位差)最适合用来分析定序变项,也可分析定距变项。