电大社会 统计学考试
国家开放大学电大本科《社会统计学》形考任务4试题及答案精选全文

可编辑修改精选全文完整版国家开放大学电大本科《社会统计学》形考任务4试题及答案形考任务4一、单项选择题(每题2分,共20分)题目1以下关于因变量与自变量的表述不正确的是()选择一项:A. 自变量的变化是以因变量的变化为前提B. 因变量是由于其他变量的变化而导致自身发生变化的变量C. 自变量是引起其他变量变化的变量D. 因变量的变化不以自变量的变化为前提题目2某班级学生平均每天上网时间可以分为以下六组:1)1小时及以下;2)1-2小时;3)2-3小时;4)3-4小时;5)4-5小时;6)5小时及以上,则5小时及以上这一组的组中值近似为()选择一项:A. 6小时B. 5小时C. 5.5小时D. 6.5小时题目3以下关于条形图的表述,不正确的是()选择一项:A. 条形图中条形的长度(或高度)表示各类别频数的多少B. 条形图通常是适用于所有类型数C. 条形图的矩形通常是紧密排列的D. 条形图中条形的宽度是固定的题目4下表是某单位工作人员年龄分布表,该组数据的中位数出现在第()组组别选择一项:A. 第3组B. 第4组C. 第6组D. 第5组题目5某校期末考试,全校语文平均成绩为80分,标准差为3分,数学平均成绩为87分,标准差为5分。
某学生语文得了83分,数学得了97分,从相对名次的角度看,该生()的成绩考得更好。
选择一项:A. 语文B. 数学C. 无法判断散D. 两门课程一样题目6在假设检验中,不拒绝虚无假设意味着()选择一项:A. 没有证据证明虚无假设是正确的B. 没有证据证明虚无假设是错误的C. 虚无假设肯定是错误的D. 虚无假设是肯定正确的题目7根据一个样本均值求出的90%的置信区间表明()选择一项:B. 总体均值一定落入该区间内C. 总体均值有10%的概率会落入该区间内D. 总体均值有90%的概率会落入该区间内题目8在回归方程中,若回归系数等于0,这表明()选择一项:A. 自变量x对因变量y的影响是不显著的B. 因变量y对自变量x的影响是显著的C. 因变量y对自变量x的影响是不显著的D. 自变量x对因变量y的影响是显著的题目9中心极限定理认为不论总体分布是否服从正态分布,从均值为μ、方差为σ2的总体中,抽取容量为n的随机样本,当n充分大时(通常要求n≥30),样本均值的抽样分布近似服从均值为()、方差为()的正态分布。
2021国家开放大学电大本科《社会统计学》期末试题及答案(试卷号:1318)

2021国家开放大学电大本科《社会统计学》期末试题及答案(试卷号:1318)一、单项选择题(每题只有一个正确答案,请将正确答案的字母填写在括号内。
每题2分,共20分)1.先将总体按某标志分为不同的类别或层次,然后在各个类别中采用简单随机抽样或系统抽样的方式抽取子样本,最后将所有子样本合起来作为总样本,这样的抽样方式称为()。
A.简单随机抽样B.系统抽样C.整群抽样D.分层抽样2.对于右偏分布,平均数、中位数和众数之间的关系是()。
A.平均数>中位数〉众数B.中位数>平均数〉众数.C.众数〉中位数〉平均数D.众数〉平均数〉中位数3.中心极限定理认为不论总体分布是否服从正态分布,从均值为□.方差为〃的总体中,抽取容量为n 的随机样本,当n充分大时(通常要求nN30),样本均值的抽样分布近似抓以均值为()方差为()的正态分布。
A.p oB.p /ncr ' /nC.p o2/nD.p /n o24.有甲、乙两人同时打靶,各打10靶,甲平均每靶为8环,标准差为2;乙平均每靶9环,标准差为3, 以下甲.乙两人打靶的稳定性水平表述正确的是()A.甲的离散程度小,稳定性水平低B.甲的离散程度小,稳定性水平高C.乙的离散程度小,稳定性水平低D.乙的离散程度大,稳定性水平高5.在标准正态分布中,b值越小,则()。
A.离散趋势越大B.离散趋势越小C.曲线越低平D.变量值越分散6.对于线性回归,在因变量的总离差平方和中,如果回归平方和所占比例越大,那么两个变量之间(A.相关程度越大B.相关程度越小C.完全相关D.完全不相关7.从两个总体中共选取了8个观察值,得到组间平方和为432,组内平方和为426,则组间均方和组内均方分别为()。
A.432 ,426B.216, 71C.432, 71D.216, 4268.某单位对该厂第--加工车间残品率估计高于13%,而该车间主任认为该比例偏高。
如果要检验该说法是否正确,则假设形式应该为0。
社会统计学试题及答案

社会统计学试题及答案一、单项选择题(每题2分,共20分)1. 社会统计学中,用来描述一组数据集中趋势的指标是()。
A. 众数B. 中位数C. 均值D. 方差答案:C2. 以下哪个选项不属于描述统计学的内容?()A. 数据收集B. 数据整理C. 数据分析D. 数据预测答案:D3. 在统计学中,用来衡量数据离散程度的指标是()。
A. 标准差B. 均值C. 众数D. 中位数答案:A4. 以下哪个概念不是社会统计学的研究对象?()A. 人口数量B. 收入水平C. 股票价格D. 家庭结构答案:C5. 社会统计学中,用来衡量两个变量之间相关关系的强度的指标是()。
A. 相关系数B. 回归系数C. 标准差D. 方差答案:A6. 以下哪个选项不是社会统计学中常用的数据收集方法?()A. 问卷调查B. 观察法C. 实验法D. 文献分析答案:C7. 在统计学中,用来衡量数据集中程度的指标是()。
A. 标准差B. 均值C. 众数D. 中位数答案:B8. 以下哪个选项是社会统计学中常用的数据整理方法?()A. 频数分布表B. 回归分析C. 假设检验D. 相关分析答案:A9. 社会统计学中,用来描述一组数据分布形态的指标是()。
A. 偏度B. 峰度C. 均值D. 方差答案:A10. 以下哪个概念是社会统计学中用来描述数据的离散程度的?()A. 标准差B. 均值C. 众数D. 中位数答案:A二、多项选择题(每题3分,共15分)1. 社会统计学中,用来描述一组数据的指标包括()。
A. 均值B. 众数C. 方差D. 标准差E. 中位数答案:ABDE2. 以下哪些是社会统计学中常用的数据分析方法?()A. 描述性分析B. 推断性分析C. 回归分析D. 假设检验E. 相关分析答案:ABCDE3. 社会统计学中,用来衡量数据离散程度的指标包括()。
A. 标准差B. 方差C. 偏度D. 峰度E. 极差答案:ABE4. 以下哪些是社会统计学中常用的数据收集方法?()A. 问卷调查B. 观察法C. 实验法D. 文献分析E. 访谈法答案:ABDE5. 社会统计学中,用来描述一组数据分布形态的指标包括()。
电大《社会统计学》考题题库及答案-社会统计学试题及答案

《社会统计学》形成性考核作业形成性考核作业一表1是某大学二年级135个同学的《社会统计学》课程的期末考试成绩,请将数据输入SPSS软件,并(1)对考试成绩进行排序和分组(40分),(2)制作频数分布表(30分)并绘制频数分析统计图(30分)。
请注意分组时按照下列标准:表1某专业二年级同学社会统计学期末考试成绩(百分制)答案如下:1、按成绩低至高排序如下表:2、成绩分组表如下:3、制作频数分布表如下:4、频数分析统计图如下:形成性考核作业二表1为某大学对100个学生进行了一周的上网时间调查,请用SPSS 软件:(1)计算学生上网时间的中心趋势测量各指标(20分)和离散趋势测量各指标(30分)。
(2)计算学生上网时间的标准分(Z值)及其均值和标准差。
(20分)(3)假设学生上网时间服从正态分布,请计算一周上网时间超过20小时的学生所占比例。
(30分)表1某专业一年级同学一周上网时间(小时)答案如下:形成性考核作业三一、单项选择题(在各题的备选答案中,只有1项是正确的,请将正确答案的序号,填写在题中的括号内。
每小题2分,共20分)1.学校后勤集团想了解学校22000学生的每月生活费用,从中抽取2200名学生进行调查,以推断所有学生的每月生活费用水平。
这项研究的总体是(C)A.22000名学生B.2200名学生C.22000名学生的每月生活费用D.2200名学生的每月生活费用2.从变量分类看,下列变量属于定序变量的是(C)A.专业B.性别C.产品等级D.收入3.在频数分布表中,比率是指(D)A.各组频数与上一组频数之比B.各组频数与下一组频数之比C.各组频数与总频数之比D.不同小组的频数之比4.某地区2001-2010年人口总量(单位:万人)分别为98,102,103,106,108,109,110,111,114,115,下列哪种图形最适合描述这些数据(D)A.茎叶图B.环形图C.饼图D.线图5.根据一个样本均值求出的90%的置信区间表明(C)A.总体均值一定落入该区间内B.总体均值有90%的概率不会落入该区间内C.总体均值有90%的概率会落入该区间内D.总体均值有10%的概率会落入该区间内6.判断下列哪一个不可能是相关系数(C)A.-0.89B.0.34C.1.32D.07.期中考试中,某班级学生统计学平均成绩为80分,标准差为4分。
最新国家开放大学电大本科《社会统计学》名词解释题简答题题库及答案(试卷号:1318)

最新国家开放大学电大本科《社会统计学》名词解释题简答题题库及答案(试卷号:1318)最新国家开放大学电大本科《社会统计学》名词解释题简答题题库及答案(试卷号:1318)一、名词解释题1.非概率抽样:根据主观意愿、实际情况等进行抽样,而不依据随机原则进行抽样,这些不符合概率抽样要求的抽样都称为非概率抽样。
2.二维表:二维表就是行列交叉的表格,将两个变量一个分行排放,一个分列排放,行列交叉处就是同属于两个变量的不同类的数据,也称为列联表。
3.置信水平:置信水平就是将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例。
4.卡方检验:卡方检验是对样本的频数分布所来自的总体分布是否服从某种理论分布或某种假设分布所作的假设检验,即根据样本的频数分布来推断总体的分布。
5.非概率抽样:根据主观意愿、实际情况等进行抽样,而不依据随机原则进行抽样,这些不符合概率抽样要求的抽样都称为非概率抽样。
6.二维表:二维表就是行列交叉的表格,(1分)将两个变量一个分行排放,一个分列排放,(1分)行列交叉处就是同属于两个变量的不同类的数据,也称为列联表。
7.置信水平:置信水平就是将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例。
8.卡方检验:卡方检验是对样本的频数分布所来自的总体分布是否服从某种理论分布或某种假设分布所作的假设检验,即根据样本的频数分布来推断总体的分布。
9.整群抽样:先将总体按照某种标志或特征划分为一些子群体,然后从总体中随机抽取一些子群体,再将这些抽出的若干小群体内的所有元素构成总体样本的方法。
10.Z值:Z值:Z值又称为标准分数,它是以平均数为参照点,以标准差为单位的描述原始数据在总体中相对位置的量数,通过计算Z值将一般正态分布转换为标准正态分布,Z值的计算公式为:Z=(X-μ)/σ11.二维表:二维表就是行列交叉的表格,(1分)将两个变量一个分行排放,一个分列排放,(1分)行列交叉处就是同属于两个变量的不同类的数据,也称为列联表。
国家开放大学电大本科《社会统计学》形考任务3试题及答案

国家开放大学电大本科《社会统计学》形考任务3试题及答案形考任务3一、单项选择题(每题2分,共20分)题目1某班级有100名学生,为了了解学生消费水平,将所有学生按照学习成绩排序后,在前十名学生中随机抽出成绩为第3名的学生,后面依次选出第13、23、33、43、53、63、73、83、93九名同学进行调查。
这种调查方法属于()。
选择一项:A. 整群抽样B. 简单随机抽样C. 分层抽样D. 系统抽样题目2以下关于因变量与自变量的表述不正确的是()选择一项:A. 自变量是引起其他变量变化的变量B. 自变量的变化是以因变量的变化为前提C. 因变量的变化不以自变量的变化为前提D. 因变量是由于其他变量的变化而导致自身发生变化的变量题目3某地区2001-2010年人口总量(单位:万人)分别为98,102,103,106,108,109,110,111,114,115,下列哪种图形最适合描述这些数据()。
选择一项:A. 环形图B. 饼图C. 茎叶图D. 线图题目4以下关于条形图的表述,不正确的是()选择一项:A. 条形图中条形的长度(或高度)表示各类别频数的多少B. 条形图的矩形通常是紧密排列的C. 条形图中条形的宽度是固定的D. 条形图通常是适用于所有类型数据题目5某校期末考试,全校语文平均成绩为80分,标准差为3分,数学平均成绩为87分,标准差为5分。
某学生语文得了83分,数学得了97分,从相对名次的角度看,该生()的成绩考得更好。
选择一项:A. 语文B. 无法判断C. 数学D. 两门课程一样题目6有甲、乙两人同时打靶,各打10靶,甲平均每靶为8环,标准差为2;乙平均每靶9环,标准差为3,以下甲、乙两人打靶的稳定性水平表述正确的是()选择一项:A. 甲的离散程度小,稳定性水平高B. 甲的离散程度小,稳定性水平低C. 乙的离散程度大,稳定性水平高D. 乙的离散程度小,稳定性水平低题目7选择一项:A. 第3组B. 第6组C. 第5组D. 第4组题目8对于线性回归,在因变量的总离差平方和中,如果残差平方和所占比例越大,那么两个变量之间()选择一项:A. 相关程度越小B. 完全不相关C. 相关程度越大D. 完全相关题目9回归平方和(SSR)反映了y的总变差中()选择一项:A. 由于x与y之间的非线性关系引起的y的变化部分B. 由于x与y之间的线性关系引起的y的变化部分C. 除了x对y的现有影响之外的其他因素对y变差的影响D. 由于x与y之间的函数关系引起的y的变化部分题目10下列哪种情况不适合用方差分析()选择一项:A. 行业对收入的影响6B. 年龄对收入的影响C. 性别对收入的影响D. 专业对收入的影响二、名词解释(每题5分,共20分)题目11非概率抽样:根据主观意愿、实际情况等进行抽样,而不依据随机原则进行抽样,这些不符合概率抽样要求的抽样都称为非概率抽样。
社会统计学试题及答案
社会统计学试题及答案社会统计学是一门研究社会现象数量特征和规律性的科学,它在社会科学领域中占有重要的地位。
以下是一套社会统计学的模拟试题及答案,供学生参考和练习。
社会统计学模拟试题一、选择题(每题2分,共20分)1. 社会统计学研究的主要对象是:A. 个体行为B. 社会现象的数量特征C. 社会现象的质的属性D. 社会现象的因果关系答案:B2. 下列哪一项不是统计数据的类型?A. 定类数据B. 定序数据C. 定距数据D. 定性数据答案:D3. 在统计分析中,中位数是:A. 数据集中的最小值B. 数据集中的中间值C. 数据集中的平均值D. 数据集中的最大值答案:B4. 标准差是衡量数据:A. 中心趋势的指标B. 离散程度的指标C. 相关程度的指标D. 偏态的指标答案:B5. 以下哪个是参数估计的步骤?A. 收集数据B. 计算样本统计量C. 确定置信区间D. 所有以上答案:D二、简答题(每题10分,共30分)6. 简述社会统计学与数理统计学的区别。
答案:社会统计学与数理统计学的主要区别在于研究对象和应用领域。
数理统计学主要研究的是概率论在统计推断中的应用,它更侧重于数学理论和方法。
而社会统计学则侧重于社会现象的量化分析,它将数理统计的方法应用于社会科学研究中,以揭示社会现象的数量特征和规律。
7. 解释什么是抽样误差,并举例说明。
答案:抽样误差是指由于从总体中随机抽取样本进行研究,而导致样本统计量与总体参数之间存在差异的情况。
例如,在一项关于城市居民收入水平的研究中,如果只抽取了高收入区域的居民作为样本,那么得到的样本均值可能会高于整个城市居民的实际平均收入,这就是抽样误差的一个例子。
8. 描述相关系数的计算方法及其意义。
答案:相关系数是用来衡量两个变量之间线性关系强度和方向的统计量。
最常用的相关系数是皮尔逊相关系数,其计算公式为:\[ r =\frac{\sum (X_i - \overline{X})(Y_i -\overline{Y})}{\sqrt{\sum (X_i - \overline{X})^2 \sum (Y_i - \overline{Y})^2}} \] 其中,\( X_i \) 和 \( Y_i \) 分别是变量X 和Y的观测值,\( \overline{X} \) 和 \( \overline{Y} \) 是它们的平均值。
最新国家开放大学电大本科《社会统计学》名词解释题简答题题库及答案(试卷号:1318)
最新国家开放大学电大本科《社会统计学》名词解释题简答题题库及答案(试卷号:1318)一、名词解释题1.非概率抽样:根据主观意愿、实际情况等进行抽样,而不依据随机原则进行抽样,这些不符合概率抽样要求的抽样都称为非概率抽样。
2.二维表:二维表就是行列交叉的表格,将两个变量一个分行排放,一个分列排放,行列交叉处就是同属于两个变量的不同类的数据,也称为列联表。
3.置信水平:置信水平就是将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例。
4.卡方检验:卡方检验是对样本的频数分布所来自的总体分布是否服从某种理论分布或某种假设分布所作的假设检验,即根据样本的频数分布来推断总体的分布。
5.非概率抽样:根据主观意愿、实际情况等进行抽样,而不依据随机原则进行抽样,这些不符合概率抽样要求的抽样都称为非概率抽样。
6.二维表:二维表就是行列交叉的表格,(1分)将两个变量一个分行排放,一个分列排放,(1分)行列交叉处就是同属于两个变量的不同类的数据,也称为列联表。
7.置信水平:置信水平就是将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例。
8.卡方检验:卡方检验是对样本的频数分布所来自的总体分布是否服从某种理论分布或某种假设分布所作的假设检验,即根据样本的频数分布来推断总体的分布。
9.整群抽样:先将总体按照某种标志或特征划分为一些子群体,然后从总体中随机抽取一些子群体,再将这些抽出的若干小群体内的所有元素构成总体样本的方法。
10.Z值:Z值:Z值又称为标准分数,它是以平均数为参照点,以标准差为单位的描述原始数据在总体中相对位置的量数,通过计算Z值将一般正态分布转换为标准正态分布,Z值的计算公式为:Z=(X-μ)/σ11.二维表:二维表就是行列交叉的表格,(1分)将两个变量一个分行排放,一个分列排放,(1分)行列交叉处就是同属于两个变量的不同类的数据,也称为列联表。
12.误差减少比例:在预测变量Y的值时,知道变量x的值时所减少的误差(E.- Ez)与总误差E,的比值称为误差减少比例,简称PRE。
电大社会统计学期末试卷2020年7月
王士Za/2霜 5一200士’·96x愿50言 ? 200士4 . 62(4分)
即(195 . 38 , 204 . 62)(2分)
(2)样本比例:p一180=0 . 4(2分) 450
户主为女性的家庭比例的95%的置信区间为:
_4)
p厂 士Z一 。/一 2人勺 {一n=- 0 .· 4士一 1 .’ 96X一 人/勺 三二4一5云0=一二’ =0 一 . 4’ 士0 一 . 045(3分)
(1)在对数据进行分组时,如果各组组距相等,则称为等距分组。(Z分)例如,分析某班同
学期末统计课成绩时,假如最低分为73分,最高分为98分,以5分为组距进行分组,分
为71一75分,76一80分,81一85分,86一90分,91一95分,96一100分。(3分)
(2)如果各组组距不相等,则称为不等距分组。(2分)例如,在分析人口时,往往将人口分
? 2中(1)一1(3分)
由题得,中(l)? 0 . 8413,所以2中(1)一l=0 . 6826,即68%的男生体重在55千克一65千克
之间。(1分)
(3)P(55 < X < 65)=。仁(60一50)/5]一中[(40一50)/5]
=中(2)一中(一2)一中(2)一[1一中(一2)〕
? 2小(2)一l(3分)
由题得,中(2)一0 . 9772,所以2中(2)一1一0 . 9544 , 95%的女生体重在40千克一60千克之
间。(1分)
767
A . H。:究)0 . 13 ; Hl:二<0 . 13
B . H。:我簇0 . 13 ; Hl:双>0 . 13
C . H。:二=0 . 13 ; H ,:二笋0 . 13
D . H。:二>0 . 13 ; H ,:二镇0 . 13
社会统计学期末考试试卷
(3)P(55<X<65)=ф[(60-50)/5]-ф[(40-50)/5]
=ф(2)-ф(-2)=ф(2)- [1-ф(-2)]
=2ф(2)-1 (3分)
由题得,ф(2)=0.9772,所以2ф(2)-1=0.9544,95%的女生体重在40千克-60千克之间。(1 分 )
19.(1)已知:β0= 363 (2分)β1=1.42
17. 简述按照测量水平区分的四类变量,并举例说明。
(1)定 类 变 量 :当 变 量 值 的 含 义 仅 表 示 个 体 的 不 同 类 别 ,而 不 能 说 明 个 体 的 大 小 、程 度 等 其 它 特
征 时 ,这 种 变 量 称 为 定 类 变 量 。 (2 分 )例 如 :性 别 。 (0.5 分 )
11. 概率抽样:按照随机原则进行 的 抽 样,总 体 中 每 个 个 体 都 是 有 一 定 的、非 零 的 概 率 入 选 样
本 ,并 且 入 选 样 本 的 概 率 都 是 已 知 的 或 可 以 计 算 的 。
12. 中心趋势:中心趋势也叫集中 趋 势,反 映 一 组 数 据 中 各 个 数 值 向 中 心 值 集 中 的 程 度,是 指 一组数据向某一个中心值靠拢的趋势。
之 间 的 数 量 差 别 和 间 隔 差 距 时 ,这 样 的 变 量 称 为 定 距 变 量 。 (2 分 )例 如 :智 商 。 (0.5 分 )
(4)定 比 变 量 :除 了 上 述 三 种 变 量 的 全 部 特 征 外 ,还 可 以 计 算 两 个 变 量 值 之 间 的 比 值 时 ,这 样 的
(2)P(55<X<65)=ф[(65-60)/5]-ф[(55-60)/5]
=ф(1)-ф(-1)=ф(1)- [1-ф(-1)]
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
电大社会统计学名词解释资料小抄
1.社会统计学
社会统计学是运用统计学的一般原理,对社会各种静态结构和动态趋势进行定量描述或推断的一种专门方法与技术。
人们既用它来分析已经发生和正在发生的现象,也用它来估计预测未来可能发生的现象。
2.国势学派
产生于德国,其创始人为康令和阿亨瓦尔。
该学派一直以统计学为名,但只用文字记述,不用数字计量,历史上人们将该学派称为“有名无实”学派。
3.政治算术学派
该学派的创始人为英国人格朗特和威廉·配第。
该学派“用数字、重量、尺度来表达自己想说的问题”,虽然没有使用统计学这一名词,但所使用的社会宏观数量对比和分析方法揭示了统计学所要研究的内容,因此历史上人们将这一学派称为“有实无名”学派。
马克思对配第评价很高,誉他为“政治经济学之父,在某种程度上也可以说是统计学的创始人”。
4.数理统计学派
该学派的创始人未比利时人凯特勒,其最大的贡献就是将法国的古典概率论引入统计学,用纯数学的方法对社会现象进行研究。
由于把概率论引进统计学,使社会随机现象数量方面的研究提高了准确性。
因此,一门兼有数学和统计学双重意义的学科被命名为“数理统计学”。
凯特勒也被人称为“现代统计学之父”。
5.大量观察法
大量观察法,就是就总体中足够多的单位进行调查和综合分析,用以反映社会总体的数量特征。
大量观察法是统计调查阶段的重要方法
6.大数规律
大数规律是随机现象出现的基本规律,它的一般意义是:观察过程中每次取得的结果可能不同(因为具有偶然性),但大量重复观察结果的平均值却几乎接近某个确定的数值。
7.描述性统计
描述性统计,就是讨论范围仅以搜索的资料本身为限,而不予以扩大。
早期的统计都是描述统计。
8.推论性统计
推论性统计,主要是依据概率论,研究如何依据有限资料对总体性质作推断,从而使统计的功能大为扩充。
是在树立统计学派之后发展起来的,属于比较现代的统计分析方法。
9.样本和(或)样本总体
样本或样本总体,是通过抽样得到的用以推断总体特征的那个“部分”。
10.标志
标志是说名总体单位属性或数量特征的名称。
11.虚拟变量
当品质标志的变异性用离散变量来表达时,这个变量可称虚拟变量。
12.指标体系
指标体系就是一系列有内在联系得统计指标集合体。
13.总体和总体单位
总体,就是作为统计研究对象的、由许多具有共性的单位构成的整体。
也有人称之为母体。
构成总体的每一个个体称为总体单位,简称单位,也称为个体。
14.中位数
把总体单位某一数量标志的各个数值,按大小顺序排列,位于正中处的变量值即为中位数。
15.众数
在一组资料中,出现次数(或频数)呈现“峰”值的那些变量值。
16.调和平均数
N个变量值倒数算术平均数的倒数,也称倒数平均数。
17.几何平均数:
N个变量值连乘积的N次方根。
18.平均指标:
就是表明同质总体在一定条件下某一数量标志所达到的一般水平。
19.显著水平
能允许犯第一类错误的概率叫做检验的显著性水平,它决定了否定域的大小。
20.总体参数
已知一总体分布,可求得它的特征值。
根据总体分布计算的特征值,即根据总体各个单位标志值计算的统计指标,在推论统计中称为总体参数。
总体均值和总体标准差(或方差)是反映总体分布特征最重要的两个总体参数,习惯上分别记作μ和σ(或σ2)。
21.检验统计量
检验统计量是关于样本的一个综合指标,但与参数估计中讨论的统计量有所不同,它不用作估测,而只用作检验。
22.中心极限定理
如果从一个具有均值μ和方差2
σ
的总体(可以具有任何形式)中重复抽取容量为n 的随机样本,那么
当n 变得很大时,样本均值的抽样分布接近正态,并具有均值μ和方差2
σ/n 。
23.超几何分布
超几何分布以样本内的成功事件的个数x 为随机变量。
若总体单位数为N ,其中成功类共有K 个,设从中抽取n 个为一样本,则样本中成功类个数x 的超几何概率分布为
P (x )=H (x :N ,n ,K )=n
N
x n K
N x K C C C -- 式中:x ≤K ,0≤x ≤n ,0≤K ≤N 。
超几何分布的数学期望μ=
N
nK ,方差σ2
=)1())((---N N K K N n N n
24.泊松分布
泊松分布为离散型随机变量的概率分布,随机变量为样本内成功事件的次数。
若μ为成功次数的期望值,假定它为已知。
而且在某一时空中成功的次数很少,超过5次的成功概率可忽不计,那么稀有事件出现的次数x 的泊松概率分布为
P (x )=P (x ;λ)=
λ
λ-e x x
!
泊松分布的期望值和方差均等于它的唯一参数λ。
25.卡方分布
设随机变量X 1,X 2,…X k ,相互独立,且都服从同一的正态分布N (μ,σ2
)。
那么,我们可以先把它们变为标准正态变量Z 1,Z 2,…Z k ,k 个独立标准正态变量的平方和被定义为卡方分布(2
χ分布)的随机变量2
χ
2χ(k )=(
σ
μ
-1X )2
+(
σ
μ
-2X )2
+…+(
σ
μ
-k X )
2
=
∑=-k
i i
X
1
2
2
)(1
μσ
=∑=k
i i Z 1
2
其中k 为卡方分布的自由度,它表示定义式中独立变量的个数。
2χ分布的期望值是自由度k ,方差值为自由度的2倍。
26.F 分布
F 分布是连续型随机变量的另一种重要的小样本分布。
设2χ(1k )和2χ(2k )相互独立,那么随机变量
F (1k ,2k )=2
221
12/)(/)(k k k k χχ
服从自由度为(1k ,2k )的F 分布。
其中,分子上的自由度1k 叫做第一自由度,分母上的自由度2k 叫做第二自由度。
27.点估计
所谓点估计,就是根据样本数据算出一个单一的估计值,用它来估计总体的参数值。
28.区间估计
所谓区间估计,就是计算抽样平均误差,指出估计的可信程度,进而在点估计的基础上,确定总体参数的所在范围或区间。
29.置信区间
置信区间就是我们为了增加参数被估计到的信心而在点估计两边设置的估计区间。
。
30.独立双样本
所谓独立样本,指双样本是在两个总体中相互独立地抽取的 31.配对样本
所谓配对样本,指只有一个总体,双样本是由于样本中的个体两两匹配成对而产生的。
32.单一试验组的试验
: 单一实验组实验是对同一对象在某种措施实行前后进行观察比较的一种简单实验,它只有实验组而没有控制组。
或者说,同一个组在实施实验刺激之前是实验中的“控制组”,在实施实验刺激之后就成了“实验组”。
33.一试验组与一控制组的试验
配对样本的一实验组与一控制组之假设检验,要设法把实验变量的作用和额外变量的作用区分开来,然后就像对待单一实验组实验一样,把问题转化为零假设μd =0的单样本检验来处理。
34.拟和优度检验:是有关检定总体是否具有正态或其他分布形式的非参数统计检验。
35.列联表:是按品质标志把两个变量的频数进行交互分类的统计表格。
36.理论频数:是按照理论分布计算出的样本各组频数。
37.方差分析:研究多个总体均值是否存在差异的统计检验方法。
38.方差分析表:用于表达方差分析结果的标准形式的表格。
其基本形式如下:
项目 SS 自由度 MS 检验统计量 临界值
显著性
组间 SS B (c ―1)MS B MS B / MS W F α(c ―1,n ―c)(待定) 组内 SS W (n ―c ) MS W —————— 总 SS T (n ―1) ————————
39.总变差:记作SS T ,它表示ij Y 对于总均值Y 的偏差之平方和,即
SS T =
211
)(∑∑==-c i n j ij
i
Y Y
40.组内变差:记作SS W ,它是各观测值ij Y 对其所属类别均值i Y 的偏差的平方和,即
∑∑==-c
i n j i ij
i
Y Y
11
2)(
41.组间平方和:记作SS B ,是自变量因素所没有解释的ij Y 的变异,即
21
)(Y Y
n c
i i
i -∑=
42.相关比率:方差分析中把已解释的变差对总变差的比值称为相关比率,用符号2η表示。
2
η=1―
T
W
SS SS 43.估计标准误差:为回归剩余方差MS W 的平方根,即S Y/X =
2
2
--∑n Y Y c
)(
44.零假设
概率分布的具体形式是由假设决定的,假设肯定不止一个。
在统计检验中,通常把被检验的那个假设称为零假设(或称原假设,用符号H 0表示),并用它和其他备择假设(用符号H 1表示)相对比。
45.第一类错误
零假设Ho 实际上是正确的,却被否定了。
46.第二类错误
零假设Ho 实际上是错误的,却没有被否定。