社会研究方法:统计分析-1

合集下载

《社会研究方法》课程笔记

《社会研究方法》课程笔记

《社会研究方法》课程笔记第一章:导论一、定量研究与定性研究1. 定量研究定义:定量研究是一种基于数学和统计学的社会科学研究方法,它通过量化的方式来收集和分析数据,以便对社会现象进行描述、解释和预测。

特点:- 数据量化:定量研究依赖数字数据,这些数据可以通过问卷调查、实验等方式收集。

- 可操作性:定量研究通常具有较高的可操作性,可以通过标准化流程进行重复。

- 统计分析:定量研究使用统计学方法来分析数据,从而得出普遍性结论。

分类:- 描述性统计:涉及数据的收集、整理、描述和展示,如频数分布、平均数、中位数等。

- 推断性统计:从样本数据推断总体特征,包括假设检验、置信区间、相关分析和回归分析等。

2. 定性研究定义:定性研究是一种探索性的研究方法,它通过非数字化的手段来理解社会现象的深层含义和背景。

特点:- 数据非量化:定性研究侧重于文字、图像、声音等非数字数据。

- 灵活性:定性研究方法更加灵活,可以根据研究进展进行调整。

- 深入理解:定性研究旨在深入理解个体的经验、观点和行为的背景。

分类:- 田野调查:研究者深入到研究对象的生活环境中,进行长期的观察和记录。

- 访谈法:通过与研究对象进行深入对话,收集他们的看法和经验。

- 内容分析:对文本、图像、视频等资料进行系统分析,以揭示其中的主题和模式。

二、社会研究的方法体系1. 研究方法论研究方法论是对研究方法和过程的哲学思考,它包括:- 研究范式:指导研究的基本信念和假设,如实证主义、建构主义等。

- 研究逻辑:研究推理的逻辑结构,如归纳推理和演绎推理。

- 研究伦理:研究过程中应遵循的伦理原则,如知情同意、隐私保护等。

2. 研究方法研究方法是实现研究目的的具体手段,包括:- 数据收集方法:如问卷调查、访谈、观察、实验等。

- 数据处理方法:如数据编码、数据清洗、数据转换等。

- 数据分析方法:如统计分析、主题分析、案例研究等。

3. 研究技术研究技术是指研究过程中使用的工具和技巧,例如:- 问卷设计技巧:如何设计有效、可靠的问题。

社会研究方法第一章ppt课件

社会研究方法第一章ppt课件
与经验去发现更多的“真实”。
精品课件
Part 2
第一章:人类研究与科学
“传统”
• 知识是积累的,继承已有的信息和知识体系,正 是发展更多知识的起点。
• 如果在已知的事物寻求新的观点和不同的知识, 往往会被认为是“傻子”,甚至,人可能根本不 想对已知的事物去做不同的认识。
• 我们的迷茫:大多数传统都建立在更早的传统上 ,若想要推翻传统就需要颠覆传统的传统,这样 的逻辑与实证往往是我们难以做到的。
精品课件
Part 2
第一章:人类研究与科学
一般的人类研究
反例(男女收入)
• 社会规律代表的是概率模式,通则性的模式并不 需要百分之百地反映所有的观察个案。
人为干扰
• 已有的社会规律会被某些人有意识的颠覆,但对 社会科学并不是很大的挑战,虽然自然科学厘似 乎找不到类似的情形。
精品课件
Part 2
第一章:人类研究与科学
精品课件
Part 2
第一章:人类研究与科学
个案式和通则式解释模式
个案 式
顾名思义,局限于一个个案的解释模式
通则式
即试图解释某一类的情形或事物,而不是某个个案 个案式和通则式都可以对你们在日常生活中的理解有所帮助。通则模 式为你们建立学习习惯提供很好的指南,但个案模式却比较能够说服上司。
精品课件
Part 2
精品课件
Part 2
第一章:人类研究与科学
一般变的量人语类言研究
• 社会研究包含了对变量以及变量之间的相互关系的研究 。社会理论是用变量语言写成的,而个体之所以涉及研 究,只因为他们是变量的介质。变量包含了社会研究者 所谓的属性(值)
• 在进行解释和接近科学理论的变量语言核心时,属性和 变量之间的关系变得更为复杂。(教育和偏见)

浅谈四种社会研究方法

浅谈四种社会研究方法

浅谈四种研究方法一、研究方法简述(一)统计调查。

统计调查有两个显着特征,一是使用结构式的调查方法收集资料,一是在对大量个案作分类比较的基础上进行统计分析。

由于资料的格式是统一的,将所有被调查到的个案资料汇总就能得到一些统计数字,因此统计调查得来的资料一般都可以进行定量分析。

这种分析可描述调查样本的一般状况,也可以进行分类描述。

在分类比较的基础上,研究者还可以探求变量之间的因果关系。

统计调查法可用于描述性研究和解释性研究,也可用于探索性研究。

这种方法与抽样调查相结合,成为理论检验研究的最主要的方法。

(二)实地研究。

实地研究是不带假设直接到社会生活中去收集资料,然后依靠研究者本人的理解和抽象概括从经验资料中得出一般性的结论。

实地研究得到的资料通常是无法统计汇总的文字资料,如观察、访问记录,除此之外同时还包括未形成文字的感性材料,如现场的体验和感性认识。

实地研究与单纯的调查区别在于,它不仅仅是收集资料的活动,还需要对资料进行整理和思维加工,从中概括出理性认识。

实地研究主要运用归纳法,研究从观察开始,然后得出暂时性的结论。

这种结论又知道研究者进一步观察,获取新的资料,再得出新的结论或完善原有的结论。

实地研究是一个较长期的过程,通常集中关注于某一个案,主要采用无结构的观察和访问来进行资料收集。

(三)实验。

通过实验法收集到的资料与统计调查很相似,都可以分类汇总和统计。

两者的主要区别是:(1)统计调查是在自然环境中,而实验是在人为控制的环境中观测或询问;(2)统计调查所得到的不同的变量值是调查对象本身固有的,而实验则是人为施加某种刺激,使调查对象的属性和特征发生某种程度的变化。

实验的设计方法很多,最典型的实验设计是将调查对象分为实验组和控制组,分别观测他们在实验前后的变化。

由实验法收集的数据资料是精确量度的,以便能反映出调查对象的细微差异。

数据资料的分析主要使用统计方法。

在社会研究中,实验法主要用于社会心理学和小群体的研究。

社会研究方法 优缺点统计

社会研究方法 优缺点统计
横向研究的优缺点: 横向研究的优点是调查面广,多数采用统计调查的方式,资料的格式比较统一,标准化程度较高,而且资料来源于同一时间,未受到时间变化的影响, 因而可对各种类型的研究对象进行描述和比较。 缺陷:例如,在进行关于社会变迁的研究中,横向研究的资料只能对变迁进行间接的推测,而不能直接的论证。
问卷调查的优缺点: 优点: 1.问卷调查可以面向众多的调查对象收集信息。 2.如果面向同样规模的调查对象收集信息,采用问卷调查方法,要比采用访谈法,观察法或实验法等节省资源,包括节省人力、物力、财力和时间, 这也是很多研究者偏爱使用问卷调查法的重要原因。 3.问卷调查通常具有较好的隐蔽性,可以减轻研究对象的思想顾虑,有助于获得一些相对真实的研究信息。 4.问卷调查获得的信息通常要比其他一些方法获得的信息更为标准化,规范化。
实验法的优缺点: 优点: 1.可检验因果关系 2.较为经济 3.易于重复 4.控制能力较强 缺点:
1.人为干涉 2.样本选取的缺陷 3.实验人员的影响 4.道德和法律的限制
文献研究的优缺点:是一种通过收集与研究现象有关的各种文献材料,并通过对这些文献材料的分析和研究,来获得对所研究现象的认识的社会研究方法。 优点: 1.可研究那些不可能接近的研究对象 2.具有非介入性和无反应性的优点 3.适于作纵贯研究和趋势研究 4.费用较低 缺点: 1.文献内容无法控制 2.缺乏统一格式,资料间难以对比 3.编成困难,难以数量化 4.研究所需要的部分文献不易获得
定量方法的优点: 1.它能够快速地进行大规模的社会调查,因此能较好地适应当代社会需要随时把握社会发展变化趋势的要求。 2.定量方法能过运用统计和数学分析而大大提高了社会研究的标准化和精确化程度,并且讲求严密的逻辑推理,因而其结论更准确、更科学。 3.定量方法还能大大提高理论的抽象化和概括性程度,并能够对社会现象之间的因果关系进行精确的分析。 定量方法在社会研究中也有局限性: 1.由于定量方法是对大量样本的少数特征作精确的计量,因而它在每个个案那里获得的数据往往较少,并且是比较表面的,很难获得深入、广泛的信息, 容易忽略被调查者深层的动机和具体社会过程中的一些复杂因素。 2.其次,由于社会现象是错综复杂的,一种社会现象的产生往往有众多难以控制的影响因素,因此,很难客观、准确的确立两个变量之间的因果关系。

《社会研究方法》练习题库

《社会研究方法》练习题库

《社会研究方法》练习题库一、单选题(共40题,每题1分,共40分)1、定性研究的分析方法是( )。

A、文字描述与阐释B、统计分析C、归纳推理D、演绎推理正确答案:A2、()不是封面信所要说明的内容。

A、说明调查的主要目的B、说明调查者的身份C、说明调查的大致内容D、说明调查的方法正确答案:D3、描述性研究是指( ) 。

A、通过了解事物的过去预测未来B、探求社会状况之间的逻辑关系C、对社会事实的状况、外部特征、发展过程进行客观描述D、推断社会某一现象的发展趋势正确答案:C4、()测量所包含的信息更(),且()测量的结果,很容易转化为()测量的结果,反之则不行。

A、高层次,多,高层次,低层次B、低层次,多,低层次,高层次C、高层次,少,低层次,高层次D、低层次,少,高层次,低层次正确答案:A5、()定义了三种定性资料的编码类型,同时指出“对于无经验的研究者来说,要理解和掌握编码是一项困难的工作”。

A、巴比B、斯特劳斯C、韦伯D、罗伯逊正确答案:B6、在社会研究中,按照科学的标准来衡量,最科学,最严格的方式是()。

A、理论研究B、参与研究C、定性研究D、实验研究正确答案:D7、应用范围最广的定性研究方式是()。

A、叙事研究B、现象学C、民族志D、个案研究正确答案:D8、量表是一种具有( )的复合测量。

A、程度强弱顺序B、结构强度顺序C、结构顺序D、程度顺序正确答案:B9、( )是一种有关变量间关系的尝试性陈述,或者说是一种可以用经验事实检验的命题。

A、假设B、现有调查资料C、现有理论D、常识正确答案:A10、一般情况下,一个抽象概念往往具有多个不同的( ),其中每一个( )代表着概念内涵中的一个特定的侧面。

A、角度B、方面C、思考方式D、维度正确答案:D11、测量层次分为四种,定类测量、定序测量、定距测量和定比测量,四种测量层次( )。

A、由低到高B、由高到低C、由深到浅D、由浅到深正确答案:A12、以下()不是调查研究的主要特征。

社会研究方法,讲义第十二章 研究资料的审核、整理与统计分析

社会研究方法,讲义第十二章  研究资料的审核、整理与统计分析

第十二章研究资料的审核、整理与统计分析第一节资料的审核与整理研究资料的审核与整理是分析资料的基础,它是研究阶段后期的第一项工作,是保证调查资料客观性、准确性、条理性、完整性不可缺少的重要环节。

一、资料审核的概念和原则资料审核是指在着手整理调查资料之前,对原始资料进行审查与核实的工作过程,目的是保证资料的客观性、准确性和完整性,为资料的整理打下坚实的基础。

资料审核和资料收集工作同步进行,叫做实地审核或收集审核。

在收集资料后集中时间进行审核叫做系统审核。

对重要资料进行反复的各种形式的审核,叫做多次审核。

2.资料审核的原则资料审核工作一般应按照以下一些原则进行:(1)真实性原则。

对收集到的资料要根据实践经验和常识进行辨别,看其是否真实可靠地反映了调查对象的客观情况。

(2)标准性原则。

在较大规模的调查中,对于需要相互比较的材料要审核其所涉及的事实是不是具有可比性。

(3)准确性原则。

要对资料进行逻辑检查,检查资料中有无不合理和相互矛盾的地方。

(4)完整性原则。

要检查调查资料是不是按照提纲或统计表格的要求收集齐全。

二、资料的整理1.资料整理的概念和原则资料的整理是根据研究目的将经过审核的资料进行分类汇总,使资料更加条理化和系统化,为进一步深入分析提供条件。

它是从调查阶段过渡到研究阶段,由感性认识上升到理性认识的一个必经的中间环节。

资料整理应遵循三条原则:(1)条理化。

条理化是指对资料进行分类从而为进一步的分析创造条件。

分类系统实际上是资料存取系统,它便于资料的保存、检索和利用。

科学的分类系统不仅是资料的存取系统,还是对客观规律的认识系统,分类反映着研究者对研究对象的认识。

(2)系统化。

系统化是指从整体上考察现有资料满足研究目的的程度如何,有没有必要吸收补充其他资料。

条理化原则是从对事物分类归纳着手,而系统化是从整体综合的角度考虑问题。

(3)统计汇总。

统计汇总是指将调查得到的各种数据进行初步的统计整理,以把握其总体上的数量特征。

2024年秋10月高教自考《社会研究方法》试题含解析

2024年秋10月高教自考《社会研究方法》试题一、单项选择题1、与个别访谈法相比,小组访谈法的最大特点是______A.可以在多名被访者之间形成对所访谈问题的讨论B.比较费时C.成本高D.容易了解个人性、隐私性的问题2、某一研究方式主要是通过观察、深入访谈获取第一手研究资料,最大的优点在于获得资料的真实性和深入性,这种研究方式是______A.调查研究B.实地研究C.实验研究D.文献研究3、相关系数表明变量之间关系的密切程度及方向,通常用r表示,其取值范围为-1到+1之间。

如果r的绝对值为0.8,则表明变量之间______A.中度正相关B.一般相关C.高度正相关D.低度正相关4、问卷设计的灵魂是______A.题型选择B.问卷内容C.研究主题D.统计方法5、根据作用和功能的不同,研究报告可分为______A.普通研究报告和学术性研究报告B.描述性研究报告和解释性研究报告C.定性研究报告和定量研究报告D.综合性研究报告和专题性研究报告6、对离婚问题的研究中,研究者通过全面的社会调查把握当前社会中离婚现象存在的状况及其对家庭和社会的影响,这属于______A.态度调查B.现状调查C.因果分析D.对策分析7、单变量实验设计中,有一种设计是理想的实验方案,但其使用的实验对象、实验经费较多,一般不轻易使用,这种实验方案是()。

A.后测设计B.前测后测设计C.拉丁方设计D.四组设计8、已知研究总体规模为2000人,采用系统抽样方法从中抽取一个400人的样本,如果第1个人被简单随机抽中的编号为20,则第20个被抽中的人的编号为______A.80B.115C.200D.4009、实验调查的群体或个人是______A.实验对象B.实验变量C.实验者D.实验检测10、在定量研究资料的统计分析中,一组数据中出现次数最多的标识值是______A.中位数B.平均数C.众数D.异众数11、考古学家通过发掘古人的遗留物可以研究人类的历史发展和生活变迁,这种观察法属于______A.磨损测量B.行为标志测量C.积累物测量D.直接观察测量12、“组织”、“社区”、“国家”等概念属于______A.单一概念B.集合概念C.类别概念D.操作性概念13、下列属于间接观察的是______A.实验室观察B.物质痕迹观察C.非结构式观察D.实地观察14、某项社会研究针对的是现实社会问题,旨在提出解决问题的方法和对策,该项研究属于()。

社会研究方法试题及答案

社会研究方法试题及答案### 社会研究方法试题及答案一、单项选择题1. 社会研究方法中,最常用的数据收集方式是什么?- A. 实验- B. 观察- C. 调查- D. 文献分析答案:C2. 以下哪项不是社会研究的基本步骤?- A. 确定研究问题- B. 选择研究方法- C. 收集数据- D. 进行数据分析答案:D3. 在社会研究中,定性研究和定量研究的主要区别是什么? - A. 研究目的- B. 数据收集方法- C. 数据分析方法- D. 研究结果的呈现方式答案:B二、多项选择题1. 以下哪些是社会研究中常用的数据收集工具?- A. 问卷- B. 访谈- C. 观察记录- D. 计算机模拟答案:A, B, C2. 社会研究中,对数据进行分析时,以下哪些方法可能被采用?- A. 描述性统计分析- B. 相关性分析- C. 回归分析- D. 内容分析答案:A, B, C, D三、简答题1. 简述社会研究中的抽样调查方法。

答案:抽样调查是一种非全面调查方法,它通过从研究总体中随机抽取一部分样本进行研究,以推断总体的特征。

常用的抽样方法包括简单随机抽样、分层抽样、系统抽样和整群抽样等。

抽样调查的优点是节省资源、提高效率,但可能存在抽样误差。

2. 描述性研究和解释性研究有何不同?答案:描述性研究主要关注“是什么”,即描述现象或行为的基本情况和特征。

而解释性研究则关注“为什么”,即探究现象背后的原因和机制。

描述性研究通常使用定量方法,而解释性研究则可能采用定性或混合方法。

四、论述题1. 论述社会研究中伦理问题的重要性及其处理方法。

答案:社会研究中的伦理问题至关重要,它涉及到研究对象的隐私保护、知情同意、数据保密和研究结果的公正性等。

处理伦理问题的方法包括:确保研究设计符合伦理标准,获取研究对象的知情同意,保护个人隐私,公正地报告研究结果,以及在必要时对数据进行匿名化处理。

五、案例分析题1. 假设你是一名社会研究者,正在研究城市化进程中农民工的生活状况。

自学考试《社会研究方法》试卷及解析

自学考试《社会研究方法》试卷及解析第Ⅰ部分选择题(40分)一、单项选择题(本大题共30小题,每小题1分,共30分。

在每小题列出的四个备选项中只有一个是符合题目要求的,请将其代码填写在题后的括号内。

错选、多选或未选均无分。

)1.具有隐蔽性好、真实性和实用性较高的特点的实验类型是()。

A.研究性实验B.应用性实验C.实验室实验D.现场实验2.属于较少控制的现场实验是()。

A.霍桑实验B.“啤酒偷窃案”实验C.监狱行为模式研究D.权威服从研究3.从研究的性质上看,那些以发展有关社会的基本知识为基本目标的社会研究,是指()。

A.理论性研究B.应用性研究C.探索性研究D.描述性研究4.一般是试验中加以控制或者主动施加的可观测变量,是指()。

A.因变量B.可控变量C.倚变量D.自变量5.观察记录最好在什么时候进行()。

A.观察的同时B.观察每一段落结束之后C.观察全部结束之后D.什么时候都可以6.在社会研究的选题方式中,完全由研究者自己选定研究题目,不受任何组织和个人的影响,这是()。

A.申报研究课题B.纯自主选题C.上级定题D.委托研究课题自学考试《社会研究方法》试卷及解析7.如果两个变量间的相关系数的绝对值位于0.3~0.7之间,可以认为它们之间的相关是()。

A.无相关B.低度相关C.中度相关D.高度相关8.社会研究者在一次研究中抓住社会现象的一种特征,并且在考虑这一特征时暂时忽略其他特征,这是()。

A.理论假设B.理论建构C.理论抽象D.理论概括9.在社会研究中,属于非介入式社会研究方法的是()。

A.观察法B.实验法C.文献法D.访谈法10.被认为“是研究报告的骨架”,是指()。

A.组织材料B.撰写正文C.写作提纲D.确定主题11.普通研究报告主要有以下哪种形式存在()。

A.工作报告B.学术报告C.学术论文D.内参12.研究报告的灵魂是()。

A.材料B.提纲C.正文D.主题13.在研究政党制度时,分为一党制、一党独大制、两党制、多党制四类,这违反了分类的()。

社会研究方法-名词解释

社会学研究方法名词解释1、社会研究:一种以经验的方式,对社会世界中人们的行为、态度、关系,以及由此所形成的的各种社会现象社会产物进行科学的探究活动。

进而理解我们周围的社会世界,预测社会发展,变迁的趋势,其方法体系包括:方法论、研究方式、具体研究方法与技术。

2、方法论:方法论所涉及的是规范一门科学学科的原理、原则和方法体系。

社会研究中的方法论所涉及的主要是社会研究过程的逻辑和研究的哲学基础。

包括两种基本的,同时又相互对立的方法论:实证主义方法论和人文主义方法论,其中实证主义方法论一直占主流位置。

3、实证主义方法论:认为社会研究应向自然科学看齐,将社会现象当做纯粹客观的想象来测量分析,通过对社会想象进行具体可观的观察,对经验事实做客观的研究结论。

在研究方式上,定量分析是其最典型的特征。

4、人文主义方法论:充分考虑人的特殊性,要发挥研究者在研究过程中的主观性,深入人的内心世界去理解其行为及社会后果。

人文主义者结合人类主题对社会世界的认识能力和能动特性、思维和意志等来描述或建构研究对象的经验世界。

在研究方式上,定性研究是其典型特征。

5、研究方式:指研究所采取的具体形式或研究的具体类型,包括贯穿社会学研究的全过程的程序、策略、方法等。

通常有四种类型:调查研究,实验研究,文献研究,实验研究。

心理学者通常采用实验研究;社会学者采用调查研究;人类学者采用实地研究;传播学者采用文献研究。

6、(社会)理论:是以一套加以系统陈述的,以可靠地经验资料为基础并在逻辑上相互联系的命题。

其基本要素包括:概念、变量、命题与假设。

/理论是一种系统化的方式将经验世界中某些被挑选的方面概念化并组织起来的一组内在相关的命题。

在世纪社会研究中,理论通常指的是“一组具有逻辑关系的假设或命题”。

在社会研究中,研究者通常将之划分为三个层次:宏观理论、中管理论(中层理论)、微观理论。

(袁方)7、概念:它是研究范围内同一类现象的概括性表述。

8、自变量:在一组变量中能够影响其他变量发生变化,而又不受其他变量影响的变量。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第十讲 统计分析的基本概念与方法(1)
一、描述性统计分析 二、样本分布 三、推断性统计的基本概念 四、假设检验 五、相关分析 六、回归分析
一、描述性统计(Descriptive Statistics)
(一)百分比、相对比与图表
1. 百分比(Percentage) 表1.某单位职工婚姻状况分布 婚姻状况 单身 已婚 离婚 人数 1000 700 200 百分比(%) 50 35 10
A
B
◆基尼系数值总是介于0,1之间,数值越
大,表明分配越不均等。
基尼系数的计算--洛论茨曲线法: X轴——人口百分比, Y轴——收入百分比。 收入等级 占家庭总收 入的百分比 累计占家庭 收入百分比
最低20%
次低20% 中间20% 次高20% 最高20%
6
12 17 24 41
6
18 35 59 100
一、描述性统计(Descriptive Statistics)
按S计算例1的结果:
次数 1
2 12
3 7 11
4 3 13
5 10 14
6 5 15
7 30 14
8 15 13
9 24 14
10 6 14
A B
8
12 10
A公司的平均值:12分钟 B公司的平均值:13分钟 SA=8.74 SB =1.56 故B公司比A公司的送餐速度稳定的多(即你估计B 公司送餐到你家的时间的误差比A公司小的多)
方差:即把每个离散值先平方,计算总和,再除以样 本总数.
1 ( - )2 S = Xi X N
2
一、描述性统计(Descriptive Statistics)
标准差:
标准差即方差的平方根。
1 S= Xi - X N
(
)
2
即以平均数来估计变量中每一个值所犯的错误平均 是S.该值越大,变量的分布面就越大.它显示变量分 布的离散程度.
正态分布曲线的数学表达式为
1 Y= e 2
2. 二项分布
将某随机试验重复进行n次,若各次试验 结果互不影响, 即每次试验结果出现的概率 都不依赖于其它各次试验的结果,则称这n次 试验是独立的。 对于n次独立的试验,如果每次试验结果出 现且只出现对立事件A与(-A)之一,在每 次试验中出现A的概率是常数p(0<p<1),因而出 现对立事件(-A)的概率是1-p=q,则称这 一串重复的独立试验为n重贝努利试验,简称 贝努利试验(Bernoulli trials )。
=
k=0,1,2…,n
若把上式与二项展开式
(q p) n =
k Cn p k q n-k k =0 n
相比较就可以发现,在n重贝努利试验中, 事件A发生k次的概率恰好等于展开式中 的第k+1项,所以也把它称作二项概率公 式。
二项分布的意义及性质 二项分布定义如下: 设随机变量x所有可能取的值为零和正整 数:0,1,2,…,n,且有
在社会科学研究中,我们经常碰到的 一类离散型随机变量,如n个人参加投票 的人数等,可用贝努利试验来概括。 在n重贝努利试验中,事件A可能发生 0,1,2,…,n次,现在我们来求事件A 恰好发生k(0≤k≤n)次的概率Pn(k)。
先取n=4,k=2来讨论。在4次试验中,事件A发 生2次的方式有以下种:
◆二项分布的平均值和标准差
μ=np
σ= npq
二.概率分布
3.正态分布 ◆正态分布(normal distribution )是一种很重要的连续 型随机变量的概率分布。社会现象中有许多变量是 服从或近似服从正态分布的,如人的身高、体重、 学习成绩、收入分布等。许多统计分析方法都是以 正态分布为基础的。此外,还有不少随机变量的概 率分布在一定条件下以正态分布为其极限分布。因 此在统计学中,正态分布无论在理论研究上还是实 际应用中,均占有重要的地位。 ◆正态分布对于描述统计有一定重要性,对推断统计则 极为重要
◆基尼系数计算公式
对收入分配X=( x1, x2,… xn )而言, 用每一对xi ,xj的差的绝对值的合计除以 收入,来反映不平等的程度。 1
G(x)= 2n2 μ
xi -xj |
◆联合国有关组织规定:
若低于0.2表示收入绝对平均;0.2-0.3 表示比较平均;0.3-0.4表示相对合理; 0.4-0.5表示收入差距较大;0.6以上表示 收入差距悬殊。
A1 A2 -A3 -A4 A1 -A2 A3 -A4 A1 -A2 -A3 A4 -A1 A2 A3 -A4 -A1 A2 -A3 A4 -A1 -A2 A3 A4
其中Ak(k=1,2,3,4)表示事件A在第k次试验发生; - Ak(k=1,2,3,4)表示事件A在第k次试验不发生。由于 试验是独立的,按概率的乘法法则,于是有 P(A1A2-A3-A4)=P(A1-A2A3-A4)=… = P(A1)·(A2)·(-A3)·(-A4)= p 2 q 4 -2 P P P
一、描述性统计(Descriptive Statistics)
◆基尼系数
是描述一组数据的分散程度的另一个 相对指标。常用于作为描述不平等的指标。
20世纪初意大利经济学家基尼(C.Gini),根 据洛伦茨曲线找出了判断分配平等程度的指标 (如下图),设实际收入分配曲线和收入分配绝 对平等曲线之间的面积为A,实际收入分配曲线 右下方的面积为B。并以A除以A+B的商表示不 平等程度。这个数值被称为基尼系数或称洛伦茨 系数。
一、描述性统计(Descriptive Statistics)
(二)变量的集中/中心趋势(Central tendency) 的测量 1.众数(mode) 2.中位数(median) 3.平均数(mean)
一、描述性统计(Descriptive Statistics)
1.众数 在一个变量分布中出现频率最高的变量值
寡居 合计
100 2000
5 100
寡居 5% 离婚 10% 单身 50% 已婚 35% 单身 已婚 离婚 寡居
图1.某单位职工婚姻状况分布
60 50 40 30 20 10 0 单身 已婚 离婚 寡居 10 5 50 35 百分比
图1.某单位职工婚姻状况分布
120 100 80 60 40 20 0
例1:前面“婚姻状况”例子中,单身人数最多 ,众数是单身者。 例2:变量值分布为 2、3、3、3、3、4、4、6、7 众数是3 ▲众数可以有两个: 2、3、3、3、3、4、4、5、5、5、5、6、7
一、描述性统计(Descriptive Statistics)
2.中位数 指一个变量分布的中间点 例1:变量值分布为 2、3、3、3、4、6、7 例2:变量值分布为 2、4、4、4、6、7、8、9 中位数为: (4+6)/ 2=5
=> 还需对变量的离散趋势(Dispersion)进行测量
一、描述性统计(Descriptive Statistics)
(三)变量的离散趋势(Dispersion)的测量 1.极差/全距(Range) 极差=变量最高值 – 最低值 例1: RA=30 – 3 =27 RB=15 – 10 =5 ▲但极差仅反映了变量最高值和最低值的差异, 对变量分布中的其他值未加以考虑(浪费了许 多信息) => 变量的平均离散值/平均偏差(Average Deviation)
二项分布的特征
二项分布由n和p两个参数决定: 1、当p值较小且n不大时,分布是偏倚的。但随 着n的增大 ,分布逐渐趋于对称,如图所示;
n值不同的二项分布的比较
2、当p值趋于0.5时,分布趋于对称,如图所示;
P值不同的二项分布的比较
3、对于固定的n及p,当k增加时,Pn(k)先随之增 加并达到其极大值,以后又下降。 此外,在n较大,p、q 较接近时,二项分 布接近于正态分布;当n→∞时,二项分布的极 限分布是正态分布。
二、概率分布
1.随机变量 ◆离散型随机变量 如果变量x,其可能取值至多为可列出的若干个, 且以各种确定的概率取这些不同的值,则称x为离 散型随机变量 (discrete random variable)。 ◆连续型随机变量 如果变量x,其可能取值为某范围内的任何数值, 且x在其取值范围内的任一区间中取值时,其概率 是确定的,则称x为连续型随机变量(continuous random variable)。
一、描述性统计(Descriptive Statistics)
▲虽然变量的集中趋势提供了变量分布的描述,但 仅知其集中趋势是不够的. 例1:清华附近2家送快餐公司的送餐速度: A:平均送到家的时间为12分钟,但最快3分钟到,最 慢30分钟到; B:平均送到家的时间为13分钟,但最快10分钟到, 最慢15分钟到. Q:你愿意选哪家?
基尼系数的计算-----洛论茨曲线法: X轴——人口百分比, Y轴——收入百分比。
◆基尼系数与洛伦茨曲线
当将收入分配X=(x1, x2,… xn),按照 x1≦ x2≦… ≦xn 排列时,基尼系数是洛伦 茨曲线与完全平等曲线所围的面积的两倍。 ∵ G(x) =A/(A+B)= A/(1/2) =2A
1910 1920 1930 1940 1950 1960 1970 1980 1990 2000
学龄 儿童 入学 率
图2. 各年代学龄儿童入学率
一、描述性统计(Descriptive Statistics)
◆百分比、相对比与图表仅仅给出了变量分
布的直观信息,若想对变量分布的特征有 更进一步的把握,还需对其分布的结构做 进一步处理。
Pn (k ) Cnk p k q n-k
=
其中p > 0 , q > 0 , p+q=1,则称随机变 量x服从参数为n和p的二项分布 (binomial distribution),记为 x~B(n,p)。
相关文档
最新文档