高级社会统计学 复习资料
社会统计学复习题

社会统计学复习题一、概念题1、什么是社会统计学?请简要描述其定义和应用领域。
2、描述统计和推断统计在社会统计学中的角色是什么?它们之间有何区别?3、什么是总体和样本?它们在社会统计学中的重要性是什么?4、解释下列名词:变量、数据、数据类型、定类变量、定距变量、定比变量。
5、描述下列统计方法的用途和优缺点:描述性统计、推论性统计、因子分析、聚类分析。
二、论述题1、请阐述在社会统计学中,如何进行数据收集?并举例说明几种常见的数据收集方法。
2、请描述在社会统计学中,定量数据和定性数据各自的特点及分析方法。
3、试述假设检验的基本原理,并举例说明其在实际研究中的应用。
4、描述方差分析(ANOVA)的基本原理及其在社会科学研究中的应用。
5、请阐述协方差分析的概念和用途,并说明它与相关分析的区别。
6、什么是结构方程模型(SEM)?它如何应用于社会研究?请举例说明其应用过程。
7、试述时间序列分析的基本原理及其在社会预测中的应用。
8、请说明如何运用社会统计学中的统计方法解决实际社会问题,举例说明并评价其优劣。
9、在社会统计学中,如何处理缺失数据和异常值?请分别说明其处理方法和原因。
10、试述在社会统计学中,如何进行模型的拟合度和显著性检验?它们在模型构建中的重要性是什么?1、以下哪个选项不是统计学的研究范畴?A.研究对象的数量特征B.研究对象的分类特征C.研究对象的分布特征D.研究对象的因果关系2、下列哪个统计量是用来衡量数据集中趋势的?A.平均数B.标准差C.方差D.众数3、如果一组数据的分布呈现出“钟形曲线”,那么这组数据是?A.离散型随机变量B.连续型随机变量C.自变量D.因变量二、填空题1、统计学是研究____的科学。
2、数据的基本收集方法有____和____。
3、参数估计分为____和____。
4、方差分析是一种____方法,用于检验两个或多个样本均值是否存在显著差异。
5、回归分析是研究____之间的关系。
社会统计学-复习资料

社会统计学第一章导论一.社会统计学的产生与发展1。
国势学派:(又称记录学派或历史学派)对国家显著事迹的记录和比较。
“有名无实”代表人物:阿享瓦尔(1719—1772)“统计学之父"、康令(1606—1681)2.政治算术学派:对国家事项首创数字对比、分析。
“有实无名”代表人物:威廉 配第(1623-1687)“政治经济学之父”、格朗特(1620—1674)3。
数理统计学派:将法国古典概率论引入统计学,用纯数学的方法对社会现象进行研究。
代表人物:凯特勒(1796—1874)“现代统计学之父”4。
社会统计学派:研究社会现象代表人物:克尼斯(1821—1898)、梅尔(1841—1925)、恩格尔(1821—1896)二.社会统计学的对象和特点社会统计学:用于统计的一般原理,对社会各种静态结构和动态趋势进行定量描述或推断的一种方法与技术。
研究对象概括而言是指社会现象的数量方面。
社会统计学特点:就研究对象而言,社会统计学主要是从研究和反映一定经济基础之上的上层建筑方面去认识社会;就研究内容而言,社会统计需要对人们的态度、观念、行为进行度量,测量这些社会现象目前还没有一个精确而统一的尺度,只能以近似估算或词语表达等方式来代替;就调查方法而言,社会统计中,由于其研究对象所具有的特征,抽样调查更为常用。
三.社会统计学的方法1.大量观察法:就总体中足够多的单位进行调查和综合分析,用以反映社会总体的数量特征.2.大数定理:是随机现象出现的基本规律,一般意义为:观察过程中每次取得的结果可能不同(因为具有偶然性),但大量重复观察结果的平均值却几乎接近某个确定的数值。
3。
综合指标法4.统计推断法四.社会统计学的几个基本概念1.总体与单位总体:作为统计研究对象的,由许多具有共性的单位构成的整体。
单位:构成整体的每一个个体。
2.标志与变量,标志:总体的每个单位都具有许多属性和特性,说明总体单位属性或数量特征的名称在统计上称为标志。
社会统计学期末复习提纲

《社会统计学》课程期末复习提纲·考试题型:一、填空题(10×1分=10分)二、判断题(10×1分=10分)三、单项选择题(20×1分=20分)四、简答题(2×6分=12分)五、计算题(4题共48分)·各章复习要点第一章总论P.2 统计的含义:统计工作·统计资料·统计学。
其中:统计工作和统计资料是活动过程和成果的关系;统计学和统计工作是理论和实践的关系。
“统计”一词包含三种涵义,并且具有密切的联系。
其中:统计工作和统计资料之间是工作与成果的关系;统计学和统计工作之间是理论和实践的关系。
(y )P.11—P.13 定类尺度;定序尺度;定距尺度;定比尺度(结合课件相关内容)量化尺度特征功能举例1、定类尺度确定类别分类民族的测量2、定序尺度确定类别排列顺序分类排序考试成绩等级的测量3、定距尺度确定类别排列顺序测数量差别和间隔距离无绝对零点分类排序加减智商的测量4、定比尺度确定类别有序排序测数量差别和间隔距离有绝对零点分类排序加减乘除体重的测量何谓定类尺度和定序尺度?两者有何区别?1定类尺度是确定事物类别的计量尺度---高一个层次2定类只能区分不同性质的现象并予以归类---可将所区分的类别按高低,大小,好坏,强弱,优劣等顺序做有序排列。
3定类不能进行数的比较和数学运算--能进行大小比较。
何谓定距尺度和定比尺度?两者区别定距尺度是确定研究对象之间某些数值相差的距离的尺度---最高的数据计量尺度缺乏绝对零点---有,0 2. 0只表示一个值,即0值---0是绝对零点,表示没有3.只能加减,不能乘除---加减乘除,高层次的各种统计分析。
P.13—P.14 总体和总体单位一、总体和总体单位(一)总体1、概念总体(也称为统计总体)是指客观存在的、在同一性质基础上结合起来的许多个别单位的整体(同质个体的集团)。
2、特点·客观性·大量性同质性·差异性1、总体单位除了必须具备同质性外,还必须具备1、差异性(或变异性)性,否则就没有必要对总体进行统计分析研究了,即该性质是对总体进行统计研究的前提条件。
社会统计学复习整理

社会统计学复习整理一、变量的测量层次二、判断变量层次的技巧1.首先所有的变量都是定类变量。
2.其次看变量的取值能否比较大小,不能这个变量只能是定类变量。
3.最后如果这个变量能够比较大小,那么就看变量取值加减乘除是否有意义,如果有意义就是定距变量,如果没有意义就只能是定序变量。
三、变量层次的比较定类变量、定序变量和定比变量的数层次是从低到高排列的,高层次的变量同时具有低层次变量的功能。
四、相关分析方法第二节简化一个变项的分布一、定类变量1.统计表:用表格的形式来表示变量频次(或频率)分布的一种工具。
2.统计表必备的容:(1)表号、标题(2)标识行:变量名、对应数据说明(频次、频率)(3)主题行:变量取值的统计数据(4)表尾:如果是引用必须说明资料来源二、定序变量1.适合定序变量的简化资料的方法(1)累加次数:把次数逐渐相加起来,分为向上累加次数(cf↑)和向下累加次数(cf↓)。
(2)累加频率:把各级的百分率逐渐相加。
也分为向下累加百分率和向下累加百分率。
2.cf↑的计算方法就是按照变量取值的等级从低往高逐层相加。
3.cf↓计算方法就是按照变量取值的等级从高往低逐层相加。
➢cf↑表示低于某个等级的频数有多少➢cf↓表示高于某个等级的频数有多少三、定距变量1.定距变量的简化工具是:分组、直方图和折线图。
2.连续型定距变量的分组统计(1)组数:分组的数量,一般5到7组合适,分为等距分组和非等距分组。
(2)组限:包括上限(up)和下限(low)(3)标识下限和标识上限,例500—699(4)真实下限:标识下限—0.5;真实上限:标识上限+0.5.(5)组距:真实上限与真实下限之差。
(6)组中值:真实上限与真实下限的平均值。
第三节集中趋势测量法1.集中趋势:用一个典型的变量值或特征值来代表全体变量的问题,用这个数值来代表变项的资料分布,以反映资料的集结情况。
2.集中趋势测量的意义就是可以根据这个代表值来估计或预测每个研究对象的数值。
社会统计学复习整理

社会统计学复习整理一、变量的测量层次二、判断变量层次的技巧1.首先所有的变量都是定类变量。
2.其次看变量的取值能否比较大小,不能这个变量只能是定类变量。
3.最后如果这个变量能够比较大小,那么就看变量取值加减乘除是否有意义,如果有意义就是定距变量,如果没有意义就只能是定序变量。
三、变量层次的比较定类变量、定序变量和定比变量的数层次是从低到高排列的,高层次的变量同时具有低层次变量的功能。
第二节简化一个变项的分布一、定类变量1.统计表:用表格的形式来表示变量频次(或频率)分布的一种工具。
2.统计表必备的内容:(1)表号、标题(2)标识行:变量名、对应数据说明(频次、频率)(3)主题行:变量取值的统计数据(4)表尾:如果是引用必须说明资料来源二、定序变量1.适合定序变量的简化资料的方法(1)累加次数:把次数逐渐相加起来,分为向上累加次数(cf↑)和向下累加次数(cf↓)。
(2)累加频率:把各级的百分率逐渐相加。
也分为向下累加百分率和向下累加百分率。
2.cf↑的计算方法就是按照变量取值的等级从低往高逐层相加。
3.cf↓计算方法就是按照变量取值的等级从高往低逐层相加。
➢cf↑表示低于某个等级的频数有多少➢cf↓表示高于某个等级的频数有多少三、定距变量1.定距变量的简化工具是:分组、直方图和折线图。
2.连续型定距变量的分组统计(1)组数:分组的数量,一般5到7组合适,分为等距分组和非等距分组。
(2)组限:包括上限(up)和下限(low)(3)标识下限和标识上限,例500—699(4)真实下限:标识下限—0.5;真实上限:标识上限+0.5.(5)组距:真实上限与真实下限之差。
(6)组中值:真实上限与真实下限的平均值。
第三节集中趋势测量法1.集中趋势:用一个典型的变量值或特征值来代表全体变量的问题,用这个数值来代表变项的资料分布,以反映资料的集结情况。
2.集中趋势测量的意义就是可以根据这个代表值来估计或预测每个研究对象的数值。
社会统计学重点归纳

社会统计学重点归纳
社会统计学是研究人口、经济、社会、文化等方面的统计数据的科学。
以下是社会统计学的重点归纳:
1. 人口统计学:主要研究人口的数量、分布、组成和变动等方面的统计数据,包括人口普查、人口出生率、死亡率、迁移率等指标。
2. 经济统计学:主要研究经济活动的统计数据,包括国内生产总值(GDP)、劳动力参与率、失业率、消费指数、投资指数等指标。
3. 社会统计学:主要研究社会现象的统计数据,包括教育水平、就业率、犯罪率、健康状况、贫困率等指标。
4. 文化统计学:主要研究文化领域的统计数据,包括文化产业的规模、文化消费的情况、文化活动的参与度等指标。
5. 社会调查方法:研究如何设计和实施社会调查,包括问卷设计、样本选择、数据收集和分析等方法和技巧。
6. 数据分析方法:研究如何对收集到的统计数据进行分析和解释,包括描述统计分析、推断统计分析、多元统计分析等方法。
7. 统计模型和预测:研究如何建立和应用统计模型来预测社会现象的变化趋势,包括时间序列分析、回归分析、因子分析等方法。
8. 社会统计学的应用:研究如何将社会统计学的方法和理论应用到
实际问题中,包括政策制定、社会规划、市场调研等领域。
这些是社会统计学的重点内容,通过对社会现象的统计数据进行研究和分析,可以揭示社会规律和趋势,为社会发展和政策决策提供科学依据。
社会统计学基本公式及社会统计学复习整理及社会统计学复习题(有答案)

12231 3.322log 4×6i i i i i i i i i i i i u l u l u l u ll Rh N h R N AA B =-+-==+=+=====+第三章、组距 h (上限 下限)2、组中值 m 或 m 、斯特奇斯公式 (:组距 :全距 :总体单位)频数频率、频数密度 频率密度组距组距标准组距5、折合系数实际组距标准组距频数实际频数折合系数、基尼系数 G 111111n n i i i ii i PI P I --++===-∑∑ 或 G(i i P 是横轴上的累积百分数;I 是纵轴上的累计百分数)洛仑兹曲线P iI iAB1(2))(1)1221222d d X X X N fXX fN NN NN F L ==++-=+∑∑∑第四章1、算术平均数()()未分组资料 分组资料 注:对于单项数列分组,X即为变量值,若为组距式分组,则X为组中值 f:各组频数2、中位数(M 未分组资料 若N为奇数,则取第位上的变量值为中位数,若为偶数,则取第 位和第位上的两个变量值的平均数作为中位数()分组资料 M 112h h L : 2m m d m m m m m N F U f f f F F N---⨯=-⨯或 M 中位数所在组的下限: 中位数所在组的频数: 小于中位数所在组的各组频数之和(向上累计) h : 中位数所在组的组距 U: 中位数所在组的上限: 包括中位数所在组的各组频数之和(向上累计) 注: 中位数所在组由确定11111111133333334h :h 34h :N F l f F l f NF l f F l -=+⨯-=+⨯3、四分位数(1)第一四分位数 Q :小于第一四分位数所在组的各组累计频数(向上累计) 第一四分位数所在组的下限 :第一四分位数所在组的组距 :第一四分位数所在组的组距(2)第三四分位数 Q :小于第三四分位数所在组的各组累计频数(向上累计) 第三四分位数所在组的3311212h 1h :h 5o o o oo o f L L ∆=+⨯∆+∆∆∆下限 :第三四分位数所在组的组距 :第三四分位数所在组的组距4、众数(M )()未分组资料 先将所有数据顺序排列,观察某些变量值出现的次数最多,这些变量值就 是众数(2)分组资料 M 众数所在组的下限:众数所在组频数与前一组频数之差 :众数所在组频数与后一组频数之差 :众数所在组的组距、几何平均数11lg lg anti(lg )(2)1lg lg anti(lg )g g g g g gg g g X Nf X NX ========∑∑(M )()简单几何平均数 M 或 M M M 加权几何平均数M 或 M M M 注:若为组距式分组,则为组中值3112316)(1)111111...(2):312=23h h N h d o g h N Q Q NX X X X XNNf XX f X X -==++++==-≥≥-⋅∑∑、调和平均数(M 简单调和平均数(未分组) M 加权调和平均数(分组)M 注:若为组距式分组,为组中值 各组频数7、各种平均数的关系2M M M M 第五章、全距 R=X X 、四分位差 Q D、平均差=2=::X X Nf X XfX f X f -⋅-⋅∑∑(1)未分组资料 A D ()分组资料 A D 注:若为组距式分组,为组中值 各组频数4、标准差(S)(1)未分组资料(2)分组资料 注:若为组距式分组,为组中值 各组X X S-频数5、标准分 Z=社会统计学复习整理一、变量的测量层次61(2)37=1:83(o o oR R M M M o d o R X X SXN f f NNf X M X M X M S Sαα⋅⋅=-⋅=----==A D 、变异系数()全距系数 V =A D平均差系数 V =()标准差系数 V 、异众比率(非众数的频数与总体单位数的比值) V R 众数的频数、偏态系数())偏态=二、判断变量层次的技巧1.首先所有的变量都是定类变量。
社会统计学复习大纲 .doc

社会统计学复习大纲
一、量度层次
1、定类尺度
2、定序测度
3、定距测度
4、定比测度
二、单变量描述性统计学
1、基本技术
2、集中趋势测量法
3、离散趋势测量法
4、正态分布
三、简化两个变项的分布
1、统计相关的性质
2、交互分类与百分表
3、简化相关与消减误差
四、关测量法与测量层次
1、两个定类变项相关测量
2、两个定序变量相关测量
3、两个定距变量的分析
4、定类变项与定距变项
五、抽样与统计推论
1、抽样调查简介
2、抽样分布
3、二项抽样分布
六、参数估计
1、参数的点值估计
2、正态总体的区间估计
3、大样本区间估计
4、必要抽样数目的确定
七、假设检验的基本概念
1、统计假设
2、两类误差和假设检验的步骤
八、单总体假设检验
1、大样本假设检验
2、小样本假设检验
九、二总体假设检验
1、大样本二总体假设检验
2、小样本二总体假设检验
3、配对样本的比较
十、假设的检定:两个变项的相关
1、两个定类变项
2、两个定序变量
3、两个定距变量
4、定类与定距变量。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
高统期末考试资料整理1、参数:是一个变量。
我们在研究当前问题的时候,关心某几个变量的变化以及它们之间的相互关系,用自变量和因变量来表示。
如果我们引入一个或一些另外的变量来描述自变量与因变量的变化,引入的变量本来并不是当前问题必须研究的变量,我们把这样的变量叫做参变量或参数。
2、列联表:又称交互列表,是一种专门用来测量两个变量关系的方法,将研究所得的数据按两个变量进行交叉分类的频次分配表。
3、备择假设:又称研究假设,是我们在社会学研究中事先安排的假设。
通过抽样调查有充分根据否定原假设,是与原假设相反的假设,用H1表示,是当原假设被推翻时需要接受的假设。
备择假设有三种形式,以H0为=Z0为例,当H0被否定,可能被采用的H1为>Z0, <Z0或≠Z04、非参数检验:也称自由检定法,指对分布类型已知总体进行参数检验之外,所有检验方法的总称,这类方法的使用不需要对总体分布作任何事先的假定,例如:正态分布等,同时从检验内容来说,也不是检验总体分布的某些参数,例如均值等,而是检验总体某些有关的性质。
5、非参数检验与参数检验的区别①非参数检验的限制比参数检验少,无需任何假定,无需限制变量类型,且计算量小,简单易行②但非参数检验与参数检验相比,效率较差,不精确,检验相同的问题,需要比参数检验更大的样本量③非参数检验显著,参数检验不一定显著,但参数检验显著,非参数检验必定显著6、选择相关系数的标准看两个变量的变量层次看两个变量是否对称7、假设检验与区间估计的逻辑有哪些不同不同①假设检验从总体到样本,即事先对总体参数值或分布形式作出某种假设,然后利用样本来判断这个原假设是否成立②区间估计从样本到总体,即根据样本计算出一个范围来对未知参数进行估计相同:区间估计与假设检验的统计处理时相通的,实际上假设检验的接受域也正是区间估计的置信区间8、相关关系的特点:①现象之间确实存在着数量上的依存关系。
就是说,一个现象发生数量上的变化,另一个现象也会相应地发生数量上的变化。
②现象间的数量依存关系值是不确定的。
就是说,一个现象发生数量上的变化,另一个现象会有几个可能值与之对应,而不是唯一确定的值。
9、相关系数:指线性相关系数,对两个变量之间线性相关程度的度量。
相关程度有强弱之分,一般是在-1到1之间,相关系数越趋于0,关系越弱,相关系数与趋于绝对值1时,关系越强。
10、参数估计:即根据抽样结果合理地、科学地猜测总体参数的具体值或其范围。
参数估计包括参数的点估计和区间估计两种11、统计值:关于调查样本中某一变量的综合描述,是样本特征值,如样本均值,成数及方差12、置信水平:指总体位置参数落在置信区间内的概率。
用(1- )表示,常用的置信水平有99%,95%,90%13、变量分为哪几个层次?定类变量与定序变量之间的相关系数是什么?变量分为四个层次,即定类变量、定序变量、定距变量和定比变量。
相关系数是eat214、我们通常根据哪些原则确定原假设与备择假设?推荐答案:原假设是关于总体间参数值相等或总体分布符合某种分布的假设,是待否定的假定,与之相对立,备择假设是指总体间参数值不相等或总体分布不符合某种分布的假设,是待选择的假设原则二:原假设往往是研究者不愿接受而期待拒绝的假设,备择假设往往是研究者希望去证实并且期待接受的假设,研究中的假设一般是备择假设,通常先设立备择假设,再对立的设定原假设原则三:如果研究的目的只在于分析事物间是否有差异,不强调哪个比哪个好,这种情况下的假设比较容易,可以根据原则去理解和假设,这时进行的是双侧检验的情形,原假设设定为H0:U=U0等,备择假设随即设定为其对立面原则四:如果研究的目的在于分析事物哪个比哪个好,这时可以根据原则二去理解和假设,如题目中问“是否更长,大……”,即进行右侧检验,原假设设定为:H0:U≦U0等,反之,则进行左侧检验,原假设为H0:U≧U0等。
15、何为列联表?制作列联表的原则有哪些?1)列联表:又称交互列表,是一种专门用来测量两个变量关系的方法,将研究所得的数据按两个变量进行交叉分类的频次分配表。
2)制作原则:第一行是自变量的取值,第二行是因变量的取值16、接受域:接受H0的区间,抽样所获数据计算的统计量值小于临界值,则接受H0。
17、临界值:把拒绝原假设的小概率事件定在分布的右尾,则右尾面积总和所代表的概率即为显著水平α,φ(Zα)=1-α,Zα称作临界值。
(详见教材p232)18、推断统计:主要用于抽样调查,以抽样调查获得的信息材料通过推断统计进行简化处理,以便从样本的统计值推断总体的参数值。
19、抽样分布:指统计量的分布。
抽样分布是在同一总体反复不断抽取不同样本时,各个样本可能出现的样本统计值的分布情况20、假设检验中选择统计量的一般原则是什么?假设检验是通过样本计算某个统计量进行的,选择统计量的一般原则首先是确定是大样本还是小样本,然后根据总体方差是一直还是未知选择统计量21、试比较相关系数与回归系数的关系相关系数r表示的是两变量之间的疏密程度,回归系数b是回归直线的斜率,说明回归直线的陡度。
相关关系r表现了真实数据与回归直线靠拢的程度22、总体均值检验时,哪些情况下可以使用Z检验答:总体均值检验使用Z检验时的假定条件如下:○1连个样本都是独立的随机样本○2两个总体都服从正态分布○3如总体不服从正态分布,可以用正态分布来近似23、小概率原则:它是假设检验的基本思想,包括两个部分,一是指概率很小的随机事件在一次观察中不可能出现;二是如果小概率事件在一次观察中出现了,那么假设就是错误的。
(小概率原理:在日常生活中,人们习惯于把概率很小的事件,当做在一次观察中不可能出现的事件。
)24、散点图:散点图是相关关系的图形表示,数据点在直角坐系平面上的分布图。
散点图表示因变量随自变量而变化的大致趋势,据此可以选择合适的回归方程对数据点进行拟合。
25、回归方程:是研究自变量x不同取值时,因变量y平均值的变化。
当因变量y的平均值与自变量x呈线性规律时,称做线性回归方程。
26、拒绝域:是在显著性水平α下,小概率事件发生后,拒绝原假设H0的区间。
27、简述点估计与区间估计的含义。
他们之间的区别与联系有哪些1)点估计:指用样本计算出来的一个数来估计未知参数,由于它只是一个点值所以称为参数的点估计。
2)区间估计:是通过样本计算出一个范围来对位置参数进行估计3)区别4)联系28、简述置信度和置信区间的含义,并说明他们之间的关系是什么1)含义:用Q(X1,X2,X3…..X n)作为未知参数Q的估计值,那么包含未知参数估计值的区间就为置信区间;用置信度1-α来测量置信区间估计的可靠性2)关系:在样本容量一定的情况下,置信区间和置信度是相互制约的,置信度越大,即估计的可靠性愈大,则相应的置信区间也愈宽,估计的愈不精确,例如,某班的考试成绩,如果估计区间为0-100分,显然这样的估计永远可靠,因为任何考试的结果,平均成绩都不会超出估计的范围总之,置信度与置信区间的关系表达式:相互制约,置信度越大,置信区间越宽。
29、中心极限定理对社会调查的意义有哪些?中心极限定理在社会调查中有着重要的意义。
因为在抽样调查中被研究对象的总体分布往往是未知的。
在这种情况下,中心极限定理告诉我们,只要样本容量足够大,样本均值的分布都是已知的,且都接近正态分布。
这样就给未知分布总体的研究奠定了理论基础,对社会调查有着很实用的理论意义。
30、PRE:指消减误差比例,就是表示用一个现象来解释另一个现象时,能够减除百分之几的错误。
在测量变量的相关程度时,假定现象x与现象y有关,用x去测量y的误差的相对差值与不知y与x有关时预测y的全部误差之比:即PRE=(E1-E2)/E131、独立样本:从两个总体中分别独立的随机抽取一个样本进行比较研究32、相关样本:又称配对样本。
它只有一个样本,但样本中每个个体要先后测量两次,这样所有个体先观测的值看做是来自第一个总体的样本值,所有个体先后观测的值看作是来自另一个总体的样本值,以此来比较研究连个总体之间的不同。
33、非对称关系:数学中,若R为集合A到B上的关系,对集合中任意元素a与b(a∈A,b∈B),下述语句保持有效,则A到B上的二元关系R是非对称的:若aRb,且bRa ,那么,a = b 。
其数学表述为:任取a∈A,b∈B, aRb且bRa→a=b。
34、为什么要进行假设检验,简述假设检验的步骤。
1)原因:○1社会现象具有随机性或非确定性,同时也有规律性○2一切具有随机性质的社会现象进行局部推论总体时难免有误会○3当总体很大时,一般都采用抽样调查来检验命题假设○4假设检验实际上就是人们来意常识性地进行盘顿和决策的小概率原理2)步骤:①根据实际问题作出假设,假设包括原假设H0和备择假设H1两部分,原假设必须写出,备择假设在双边检验的情况下可不写②根据样本确定合适的检验统计量③根据问题的需要给出显著性水平的大小④搜集数据,计算检验统计量的值⑤作出统计决策,若样本统计量的值落入拒绝域,则拒绝H0接受备择假设H1,否则接受H035、假设检验会犯哪两类错误,犯第一类错误的概率是什么。
(1)弃真错误:原假设为真时拒绝原假设,在统计中称第一类错误,犯第一类错误的大小就是显著性水平α(2)纳伪错误:接受了未知的不真实状态,把假当成了真,它是在接受原假设时出现的错误,称作第二类错误,犯第二类错误的概率用β表示36、假设检验和区间估计逻辑有何不同。