社会统计学期末复习题与答案整理
社会统计学试题及答案

社会统计学试题及答案一、单项选择题(每题2分,共20分)1. 社会统计学中,用来描述一组数据集中趋势的指标是()。
A. 众数B. 中位数C. 均值D. 方差答案:C2. 以下哪个选项不属于描述统计学的内容?()A. 数据收集B. 数据整理C. 数据分析D. 数据预测答案:D3. 在统计学中,用来衡量数据离散程度的指标是()。
A. 标准差B. 均值C. 众数D. 中位数答案:A4. 以下哪个概念不是社会统计学的研究对象?()A. 人口数量B. 收入水平C. 股票价格D. 家庭结构答案:C5. 社会统计学中,用来衡量两个变量之间相关关系的强度的指标是()。
A. 相关系数B. 回归系数C. 标准差D. 方差答案:A6. 以下哪个选项不是社会统计学中常用的数据收集方法?()A. 问卷调查B. 观察法C. 实验法D. 文献分析答案:C7. 在统计学中,用来衡量数据集中程度的指标是()。
A. 标准差B. 均值C. 众数D. 中位数答案:B8. 以下哪个选项是社会统计学中常用的数据整理方法?()A. 频数分布表B. 回归分析C. 假设检验D. 相关分析答案:A9. 社会统计学中,用来描述一组数据分布形态的指标是()。
A. 偏度B. 峰度C. 均值D. 方差答案:A10. 以下哪个概念是社会统计学中用来描述数据的离散程度的?()A. 标准差B. 均值C. 众数D. 中位数答案:A二、多项选择题(每题3分,共15分)1. 社会统计学中,用来描述一组数据的指标包括()。
A. 均值B. 众数C. 方差D. 标准差E. 中位数答案:ABDE2. 以下哪些是社会统计学中常用的数据分析方法?()A. 描述性分析B. 推断性分析C. 回归分析D. 假设检验E. 相关分析答案:ABCDE3. 社会统计学中,用来衡量数据离散程度的指标包括()。
A. 标准差B. 方差C. 偏度D. 峰度E. 极差答案:ABE4. 以下哪些是社会统计学中常用的数据收集方法?()A. 问卷调查B. 观察法C. 实验法D. 文献分析E. 访谈法答案:ABDE5. 社会统计学中,用来描述一组数据分布形态的指标包括()。
统计学期末考试试题和答案解析

统计学期末综合测试一、单项选择题 (每小题 1 分,共 20分) 1、社会经济统计的数量特点表现在它是( )。
A 一种纯数量的研究B 从事物量的研究开始来认识事物的质C 从定性认识开始以定量认识为最终目的D 在质与量的联系中,观察并研究社会经济现象的数量方面2、欲使数量指标算术平均法指数的计算结果、经济内容与数量指标综合法指数相同,权数应 是( )。
A q 0p 0Bq 1p 1Cq 1p 0Dq 0p 13、如果你的业务是销售运动衫,哪一种运动衫号码的度量对你更为有用( )。
A 均值 B 中位数 C 众数 D 四分位数4、某年末某地区城市人均居住面积为 20 平方米,标准差为 8.4 平方米,乡村人均居住面积 为 30 平方米,标准差为 11.6 平方米,则该地区城市和乡村居民居住面积的离散程度( )A 乡村较大B 城市较大C 城市和乡村一样D 不能比较5、某厂某种产品生产有很强的季节性,各月计划任务有很大差异,今年 1 月超额完成计划3%,2 月刚好完成计划, 3 月超额完成 12%,则该厂该年一季度超额完成计划( )。
A 3% B 4% C 5% D 无法计算6、基期甲、乙两组工人的平均日产量分别为 70 件和 50 件,若报告期两组工人的平均日产量 不变,乙组工人数占两组工人总数的比重上升,则报告期两组工人总平均日产量( )。
A 上升B 下降C 不变D 可能上升也可能下降7、同一数量货币,报告期只能购买基期商品量的 90%,是因为物价( )。
A 上涨 10.0% B 上涨 11.1% C 下跌 11.1% D 下跌 10.0% 8、为消除季节变动的影响而计算的发展速度指标为( )A 环比发展速度B 年距发展速度C 定基发展速度D 平均发展速度 9、计算无关标志排队等距抽样的抽样误差,一般采用( )A 简单随机抽样的误差公式BC 等距抽样的误差公式 D10、我国统计调查方法体系改革的目标模式是以( A 抽样调查 B 普查 C11、设总体分布形式和总体方差都未知,对总体均值进行假设检验时,若抽取一个容量为 100的样本,则可采用( )。
社会统计学基本公式及社会统计学复习整理及社会统计学复习题(有答案)

12231 3.322log 4×6i i i i i i i i i i i i u l u l u l u ll Rh N h R N AA B =-+-==+=+=====+第三章、组距 h (上限 下限)2、组中值 m 或 m 、斯特奇斯公式 (:组距 :全距 :总体单位)频数频率、频数密度 频率密度组距组距标准组距5、折合系数实际组距标准组距频数实际频数折合系数、基尼系数 G 111111n n i i i ii i PI P I --++===-∑∑ 或 G(i i P 是横轴上的累积百分数;I 是纵轴上的累计百分数)洛仑兹曲线P iI iAB1(2))(1)1221222d d X X X N fXX fN NN NN F L ==++-=+∑∑∑第四章1、算术平均数()()未分组资料 分组资料 注:对于单项数列分组,X即为变量值,若为组距式分组,则X为组中值 f:各组频数2、中位数(M 未分组资料 若N为奇数,则取第位上的变量值为中位数,若为偶数,则取第 位和第位上的两个变量值的平均数作为中位数()分组资料 M 112h h L : 2m m d m m m m m N F U f f f F F N---⨯=-⨯或 M 中位数所在组的下限: 中位数所在组的频数: 小于中位数所在组的各组频数之和(向上累计) h : 中位数所在组的组距 U: 中位数所在组的上限: 包括中位数所在组的各组频数之和(向上累计) 注: 中位数所在组由确定11111111133333334h :h 34h :N F l f F l f NF l f F l -=+⨯-=+⨯3、四分位数(1)第一四分位数 Q :小于第一四分位数所在组的各组累计频数(向上累计) 第一四分位数所在组的下限 :第一四分位数所在组的组距 :第一四分位数所在组的组距(2)第三四分位数 Q :小于第三四分位数所在组的各组累计频数(向上累计) 第三四分位数所在组的3311212h 1h :h 5o o o oo o f L L ∆=+⨯∆+∆∆∆下限 :第三四分位数所在组的组距 :第三四分位数所在组的组距4、众数(M )()未分组资料 先将所有数据顺序排列,观察某些变量值出现的次数最多,这些变量值就 是众数(2)分组资料 M 众数所在组的下限:众数所在组频数与前一组频数之差 :众数所在组频数与后一组频数之差 :众数所在组的组距、几何平均数11lg lg anti(lg )(2)1lg lg anti(lg )g g g g g gg g g X Nf X NX ========∑∑(M )()简单几何平均数 M 或 M M M 加权几何平均数M 或 M M M 注:若为组距式分组,则为组中值3112316)(1)111111...(2):312=23h h N h d o g h N Q Q NX X X X XNNf XX f X X -==++++==-≥≥-⋅∑∑、调和平均数(M 简单调和平均数(未分组) M 加权调和平均数(分组)M 注:若为组距式分组,为组中值 各组频数7、各种平均数的关系2M M M M 第五章、全距 R=X X 、四分位差 Q D、平均差=2=::X X Nf X XfX f X f -⋅-⋅∑∑(1)未分组资料 A D ()分组资料 A D 注:若为组距式分组,为组中值 各组频数4、标准差(S)(1)未分组资料(2)分组资料 注:若为组距式分组,为组中值 各组X X S-频数5、标准分 Z=社会统计学复习整理一、变量的测量层次61(2)37=1:83(o o oR R M M M o d o R X X SXN f f NNf X M X M X M S Sαα⋅⋅=-⋅=----==A D 、变异系数()全距系数 V =A D平均差系数 V =()标准差系数 V 、异众比率(非众数的频数与总体单位数的比值) V R 众数的频数、偏态系数())偏态=二、判断变量层次的技巧1.首先所有的变量都是定类变量。
社会统计学试题及答案

社会统计学试题及答案一、选择题1. 社会统计学是研究和分析社会现象和社会问题的科学方法。
下列哪项不是社会统计学的研究对象?A. 人口B. 社会经济C. 政治D. 音乐答案:D2. 下列哪项是进行社会统计学研究时常用的数据收集方法?A. 实地调研B. 实验研究C. 文献研究D. 理论推导答案:A3. 下列哪项不是社会统计学常用的数据分析方法?A. 描述统计B. 回归分析C. 实证研究D. 主观评价答案:D二、简答题1. 什么是抽样调查?请简要描述抽样调查的步骤。
抽样调查是根据一定的抽样原则和抽样方法,从总体中选出少部分元素进行调查的方法。
抽样调查的步骤包括:定义研究目标和调查问题、确定研究对象和总体范围、选择适当的抽样方法、制定抽样方案、实施调查、数据收集和分析、得出结论并进行推断。
2. 什么是社会统计指标?请举例说明一个社会统计指标。
社会统计指标是用于衡量和描述社会现象、问题或变量的量化指标。
例如,人口增长率是一个常用的社会统计指标,用于表示某一地区或国家人口数量在某一时期内的增长速度。
三、论述题社会统计学在社会科学研究中的应用社会统计学作为一门综合性的学科,广泛应用于社会科学研究中。
它通过收集、分析和解释社会数据,提供了量化的研究工具和方法,对社会现象和问题进行客观的测量和评估。
首先,社会统计学在人口学研究中发挥了重要作用。
通过对人口数量、结构、分布等进行统计分析,可以揭示出不同地区、不同群体的人口变化趋势和特点。
人口统计数据还为制定人口政策、规划资源分配等提供了科学的依据。
其次,社会统计学在社会经济学研究中具有重要意义。
通过对收入分布、贫富差距、就业率等指标的统计分析,可以帮助我们了解社会经济现象和问题,并为政府和决策者提供制定经济政策的依据。
此外,社会统计学在社会学、教育学、卫生学等学科中也得到了广泛的应用。
它帮助研究者揭示社会结构、社会关系、社会变迁等方面的规律,为社会科学研究提供了重要的数据支持。
社会统计学复习题.(DOC)

《社会统计学》复习题考试题型:一、填空(1*20=20)二、单选(1*10=10)三、多选(2*5=10)四、判断(2*5=10)五、计算题(5*8=40)六、分析题(1*10=10)一、填空题1、大量观察法之所以称为统计上特有的方法,是与()的作用分不开的。
2、大数定律的一般意义是:在综合大量社会现象的数量特征时,个别单位偶然的数量差异会(),使大量社会现象的数量特征借助于()形式,接近用确定的数值显示出必然的规律性。
3、要了解有个班级学生的学习情况,则总体是(),总体单位是()。
4、凡是相邻的两个变量值之间可以连续不断分割的变量,称为()。
凡是各变量值之间是以整数断开的变量,称为()。
5、统计按其内容主要包括两个方面:描述统计和()。
6、推论统计有两个基本内容:参数估计和()。
7、通过抽样得到的用以推断总体特征的那个“部分”,在统计学上称为()。
样本中所含的单位数,在统计学上称为样本大小,也叫做()。
8、()是指由调查者直接搜集的、未经加工整理而保持其原本状态的资料。
()是指经他人加工整理,可以在一定程度上被引用来说明总体特征的资料。
9、()误差,是指在调查和统计过程中由于各种主客观因素而引起的技术性、操作性误差以及由于责任心缘故而造成的误差等。
()误差,是指由调查方式本身所决定的统计指标和总体指标之间存在的差数。
10、统计调查从调查范围上分,可分为()和()。
11.()误差是在遵守随机原则的条件下,用样本指标代表总体指标不可避免存在的误差,它表示抽样估计的精度。
12基尼系数为(),表示收入绝对不平均;基尼系数为(),表示收入绝对平均。
13、统计表通常有一定格式,统计表各部位的名称分别是()、横行标题、纵栏标题、()。
14、实际收入分配情况则由洛仑兹曲线表示,一般表现为一条下凹的弧线,下凹程度愈大,收入分配(),反之,则收入分配()。
相关:洛仑兹曲线是一种用来反映社会收入分配平均程度的累计百分数曲线。
社会统计学复习题答案

社会统计学复习题答案社会统计学是一门应用广泛的学科,它涉及到数据的收集、处理、分析和解释,以帮助我们更好地理解社会现象。
以下是一些社会统计学的复习题及其答案,供参考:一、选择题1. 社会统计学的主要研究对象是什么?A. 个体行为B. 社会现象C. 经济活动D. 政治事件答案:B2. 以下哪个是描述性统计的主要内容?A. 推断总体参数B. 描述数据分布C. 预测未来趋势D. 建立因果关系答案:B3. 抽样调查与普查的主要区别是什么?A. 抽样调查成本高B. 普查不具有代表性C. 抽样调查结果不可靠D. 普查可以得到全面数据答案:D二、填空题4. 社会统计学中,________是用来衡量数据集中趋势的指标。
答案:均值5. 标准差是衡量数据________的指标。
答案:离散程度6. 相关系数的取值范围在________之间。
答案:-1到1三、简答题7. 简述抽样误差和非抽样误差的区别。
答案:抽样误差是指由于样本不能完美代表总体而产生的误差,它可以通过增大样本量来减少。
非抽样误差则包括测量误差、非响应误差等,这些误差与抽样方法无关,通常与数据收集和处理过程中的偏差有关。
8. 描述统计与推断统计的区别。
答案:描述统计主要关注对数据集的描述,如计算均值、中位数、方差等,它不涉及对总体的推断。
推断统计则是基于样本数据来推断总体特征,如估计总体均值、进行假设检验等。
四、计算题9. 给定一组数据:10, 12, 14, 16, 18, 20,计算其均值和标准差。
答案:均值 = (10+12+14+16+18+20)/6 = 15;标准差 =√[(Σ(xi - 均值)^2) / (n-1)] = √[(10+4+0+4+0+5)/5] ≈ 3.0310. 如果一个总体的均值为50,标准差为10,样本均值为55,样本量为100,进行单样本t检验,假设总体方差未知,计算t值。
答案:首先计算样本标准差,然后使用t检验公式:t = (样本均值 - 总体均值) / (样本标准差/ √样本量)。
最新社会统计学期末复习题与答案整理

社会统计学期末复习训练一、单项选择题(20=2×10)1.为了解IT行业从业者收入水平,某研究机构从全市IT行业从业者随机抽取800人作为样本进行调查,其中44%回答他们的月收入在6000元以上,30%回答他们每月用于娱乐消费在1000元以上。
此处800人是.样本2.某地区政府想了解全市332.1万户家庭年均收入水平,从中抽取3000户家庭进行调查,以推断所有家庭的年均收入水平。
这项研究的总体是 332.1户家庭的年均收入3.学校后勤集团想了解学校22000学生的每月生活费用,从中抽取2200名学生进行调查,以推断所有学生的每月生活费用水平。
这项研究的总体是 22000名学生的每月生活费用4.为了解地区的消费,从该地区随机抽取5000户进行调查,其中30%回答他们的月消费在5000元以上,40%回答他们每月用于通讯、网络的费用在300元以上。
此处5000户是样本5.从变量分类看,下列变量属于定序变量的是产品等级6.下列变量属于数值型变量的是工资收入7.从含有N个元素的总体中,抽取n个元素作为样本,同时保证总体中每个元素都有相同的机会入选样本,这样的抽样方式称为.简单随机抽样8.某班级有60名男生,40名女生,为了了解学生购书支出,从男生中抽取12名学生,从女生中抽取8名学生进行调查。
这种调查方法属于分层抽样9.先将总体按某标志分为不同的类别或层次,然后在各个类别中采用简单随机抽样或系统抽样的方式抽取子样本,这样的抽样方式称为分层抽样10.某班级有100名学生,为了了解学生消费水平,将所有学生按照学习成绩排序后,在前十名学生中随机抽出成绩为第3名的学生,后面依次选出第13、23、33、43、53、63、73、83、93九名同学进行调查。
这种调查方法属于系统抽样11.在频数分布表中,某一小组中数据个数占总数据个数的比例称为频率12.在频数分布表中,将各个有序类别或组的百分比逐级累加起来称为累积频率13.在频数分布表中,频率是指各组频数与总频数之比14.在频数分布表中,比率是指不同小组的频数之比15.如果用一个图形描述比较两个或多个样本或总体的结构性问题时,适合选用环形图16.某地区2001-2010年人口总量(单位:万人)分别为98,102,103,106,108,109,110,111,114,115,下列哪种图形最适合描述这些数据线图17.当我们用图形描述甲乙两地区的人口年龄结构时,适合选用哪种图形环形图18.在某市随机抽取10家企业,7月份利润额(单位:万元)分别为72.0、63.1、20.0、23.0、54.7、54.3、23.9、25.0、26.9、29.0,那么这10家企业7月份利润额均值为 39.19 19.某班级10名同学期末统计课考试分数分别为76、93、95、80、92、83、88、90、92、72,那么该班考试成绩的中位数是 8920.某企业职工的月收入水平分为五组:1)1500元及以下;2)1500-2000元;3)2000-2500元;4)2500-3000元;5)3000元及以上,则3000元及以上这一组的组中值为 3250元21.为了解某行业12月份利润状况,随机抽取5家企业,12月份利润额(单位:万元)分别为65、23、54、45、39,那么这5家企业12月份利润额均值为 45.222.某专业共8名同学,他们的统计课成绩分别为86、77、97、94、82、90、83、92,那么该班考试成绩的中位数是8823.某班级学生平均每天上网时间可以分为以下六组:1)1小时及以下;2)1-2小时;3)2-3小时;4)3-4小时;5)4-5小时;6)5小时及以上,则5小时及以上这一组的组中值近似为5.5小时24.对于左偏分布,平均数、中位数和众数之间的关系是众数>中位数>平均数25.对于右偏分布,平均数、中位数和众数之间的关系是平均数>中位数>众数26.离散系数的主要目的是比较多组数据的离散程度27.两组数据的平均数不相等,但是标准差相等。
社会统计学复习题

社会统计学复习题1.定类变量是指取值只有属性之分,没有大小程度之分。
定序变量是指除类别属性之外,还有等级次序的差别、大小之分。
定距变量是指区别它是连续型变量还是离散型变量。
定比变量是指其取值还可构成一个比率。
2.分布是指概率分布或频次分布。
在一个分布中,变量的取值应注意(1)变量取值必须完备;(2)变量取值必须互斥。
3.根据变量的不同层次,统计图的选择是不同的,定类变量选择圆瓣图和图;定序变量选择条形图;定距变量选择直方图和折线图。
4.圆瓣图是指将资料展示在一个圆平面上,通常用圆形代表现象的总体;条形图是指用长条的高度来表示资料类别的次数或百分数;直方图是指由紧挨着的长度所组成,以长条的面积来表示频次或相对频次;折线图是指用直线连接直方图中条形顶端的中点。
5.频次密度是指直方图的长条面积=频次/组距;相对频次密度是指条形的长度,即纵轴的高度。
6.累计图或累计表是指大于某个变量值的频次是多少或小于某个变量值的频次是多少。
7.左偏态是指偏态图形左边尾巴拖得较长的图形;右偏态是指。
8.反映分布集中值或集中趋势的指标有众值、中位值、均值。
众值适用于定类、定序、定距变量;中位值适用于定距、定序变量;均值适用于定距变量。
9.对于众值、中位值和均值三者的大小关系,对称图形表现为众值、中位值、均值三者位置重叠;右偏态表现为均值变化较快,中位值次之,众值不变;左偏态表现为。
10.反映分布离散趋势的指标有异众比率、极差、四分互差、方差或标准差。
适用于定类变量的有异众比率;适用于定序变量的有异众比率、极差、四分互差;适用于定距变量的有异众比率、极差、四分互差,方差或标准差。
11.当变量值较大而次数较多时,平均数接近于变量值较大的一方,当变量值较小而次数较多时,平均数靠近于变量值较小的一方。
12.某班70%的同学平均成绩为85分,另30%的同学平均成绩为70分,则全班总平均成绩为 80.5 分。
13.统计中的变量数列是以均值为中心而左右波动,所以这个指标反映了总体分布的集中趋势。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
社会统计学期末复习训练一、单项选择题(20=2×10)1.为了解IT行业从业者收入水平,某研究机构从全市IT行业从业者随机抽取800人作为样本进行调查,其中44%回答他们的月收入在6000元以上,30%回答他们每月用于娱乐消费在1000元以上。
此处800人是.样本2.某地区政府想了解全市332.1万户家庭年均收入水平,从中抽取3000户家庭进行调查,以推断所有家庭的年均收入水平。
这项研究的总体是 332.1户家庭的年均收入3.学校后勤集团想了解学校22000学生的每月生活费用,从中抽取2200名学生进行调查,以推断所有学生的每月生活费用水平。
这项研究的总体是 22000名学生的每月生活费用4.为了解地区的消费,从该地区随机抽取5000户进行调查,其中30%回答他们的月消费在5000元以上,40%回答他们每月用于通讯、网络的费用在300元以上。
此处5000户是样本5.从变量分类看,下列变量属于定序变量的是产品等级6.下列变量属于数值型变量的是工资收入7.从含有N个元素的总体中,抽取n个元素作为样本,同时保证总体中每个元素都有相同的机会入选样本,这样的抽样方式称为.简单随机抽样8.某班级有60名男生,40名女生,为了了解学生购书支出,从男生中抽取12名学生,从女生中抽取8名学生进行调查。
这种调查方法属于分层抽样9.先将总体按某标志分为不同的类别或层次,然后在各个类别中采用简单随机抽样或系统抽样的方式抽取子样本,这样的抽样方式称为分层抽样10.某班级有100名学生,为了了解学生消费水平,将所有学生按照学习成绩排序后,在前十名学生中随机抽出成绩为第3名的学生,后面依次选出第13、23、33、43、53、63、73、83、93九名同学进行调查。
这种调查方法属于系统抽样11.在频数分布表中,某一小组中数据个数占总数据个数的比例称为频率12.在频数分布表中,将各个有序类别或组的百分比逐级累加起来称为累积频率13.在频数分布表中,频率是指各组频数与总频数之比14.在频数分布表中,比率是指不同小组的频数之比15.如果用一个图形描述比较两个或多个样本或总体的结构性问题时,适合选用环形图16.某地区2001-2010年人口总量(单位:万人)分别为98,102,103,106,108,109,110,111,114,115,下列哪种图形最适合描述这些数据线图17.当我们用图形描述甲乙两地区的人口年龄结构时,适合选用哪种图形环形图18.在某市随机抽取10家企业,7月份利润额(单位:万元)分别为72.0、63.1、20.0、23.0、54.7、54.3、23.9、25.0、26.9、29.0,那么这10家企业7月份利润额均值为 39.19 19.某班级10名同学期末统计课考试分数分别为76、93、95、80、92、83、88、90、92、72,那么该班考试成绩的中位数是 8920.某企业职工的月收入水平分为五组:1)1500元及以下;2)1500-2000元;3)2000-2500元;4)2500-3000元;5)3000元及以上,则3000元及以上这一组的组中值为 3250元21.为了解某行业12月份利润状况,随机抽取5家企业,12月份利润额(单位:万元)分别为65、23、54、45、39,那么这5家企业12月份利润额均值为 45.222.某专业共8名同学,他们的统计课成绩分别为86、77、97、94、82、90、83、92,那么该班考试成绩的中位数是8823.某班级学生平均每天上网时间可以分为以下六组:1)1小时及以下;2)1-2小时;3)2-3小时;4)3-4小时;5)4-5小时;6)5小时及以上,则5小时及以上这一组的组中值近似为5.5小时24.对于左偏分布,平均数、中位数和众数之间的关系是众数>中位数>平均数25.对于右偏分布,平均数、中位数和众数之间的关系是平均数>中位数>众数26.离散系数的主要目的是比较多组数据的离散程度27.两组数据的平均数不相等,但是标准差相等。
那么 平均数大的,离散程度小28.已知某单位平均月收入为3500元,离散系数为0.2,那么他们月收入的标准差为70029.一班学生的平均体重均为55千克,二班学生的平均体重为52千克,两个班级学生体重的标准差均为5千克。
那么 二班学生体重的离散程度大30.已知某单位平均月收入标准差为700元,离散系数为0.2,那么他们月收入的均值为350031. 正态分布中,σ值越小,则 离散趋势越小32.已知某单位职工平均每月工资为3000元,标准差为500元。
如果职工的月收入是正态分布,可以判断月收入在2500元—3500元之间的职工人数大约占总体的68%33.如果一组数据中某一个数值的标准分值为-1.5,这表明该数值比平均数低1.5个标准差34.某班级学生期末英语考试平均成绩为75分,标准差为10分。
如果已知这个班学生的考试分数服从正态分布,可以判断成绩在65-85之间的学生大约占全班学生的68%35.经验法则表明,当一组数据正太分布时,在平均数加减2个标准差的范围之内大约有 95%的数据36.期中考试中,某班级学生统计学平均成绩为80分,标准差为4分。
如果学生的成绩是正太分布,可以判断成绩在72分-88分之间的学生大约占总体的95%37.如果一组数据中某个数值的标准分值为1.8,这表明该数值比平均数高出1.8个标准差38.某班级学生期末统计学考试平均成绩为82分,标准差为5分。
如果已知这个班学生的考试分数服从正态分布,可以判断成绩在77-87之间的学生大约占全班学生的68%39.经验法则表明,当一组数据正态分布时,在平均数加减1个标准差的范围之内大约有 68%的数据40.用样本统计量的值直接作为总体参数的估计值,这种方法称为点估计41.用样本统计量的值构造一个置信区间,作为总体参数的估计,这种方法称为区间估计42.某单位对该厂第一加工车间残品率的估计高达10%,而该车间主任认为该比例(π)偏高。
如果要检验该说法是否正确,则假设形式应该是0H :π≥0.1;错误!未找到引用源。
:π<0.143.某单位对该厂第一加工车间残品率估计高达13%,而该车间主任认为该比例(π)偏高。
如果要检验该说法是否正确,则假设形式应该为0H :π≥0.13;错误!未找到引用源。
:π<0.1344.在假设检验中,不拒绝虚无假设意味着没有证据证明虚无假设是错误的45.在假设检验中,虚无假设和备择假设有且只有一个成立46.在假设检验中,如果所计算出的P 值越大,那么检验的结果 越不显著47.在假设检验中,如果所计算出的P 值越小,那么检验的结果 越显著48.根据一个具体的样本求出的总体均值90%的置信区间以90%的概率包含总体均值49.根据一个样本均值求出的90%的置信区间表明总体均值有90%的概率会落入该区间内50.根据一个具体的样本求出的总体均值95%的置信区间以95%的概率包含总体均值51.用于说明回归方程中拟合优度的统计量主要是判定系数52.两个定类变量之间的相关分析可以使用λ系数53.判断下列哪一个不可能是相关系数1.254.判断下列哪一个不可能是相关系数1.3255.如果收入与支出之间的线性相关系数为0.92,那么二者之间存在着高度相关56.如果物价与销售量之间的线性相关系数为-0.87,而且二者之间具有统计显著性,那么二者之间存在着高度相关57. 某项研究中欲分析受教育年限每增长一年,收入如何变化,下列哪种方法最合适回归58.在回归方程中,若回归系数等于0,这表明自变量x对因变量y的影响是不显著的59.对消费的回归分析中,学历、年龄、户口、性别、收入都是因变量,其中收入的回归系数为0.8,这表明消费每增加1元,收入增加0.8元60.在因变量的总离差平方和中,如果回归和所占的比例越大,则两变量之间相关程度越高61.回归平方和(SSR)反映y的总变差中由于x与y之间的线性关系引起的y的变化部分62.对于线性回归,在因变量的总离差平方和中,如果残差平方和所占比例越大,那么两个变量之间相关程度越小63.对于线性回归,在因变量的总离差平方和中,如果回归平方和所占比例越大,那么两个变量之间相关程度越大64.在因变量的总离差平方和中,如果回归平方和所占的比例越小,则自变量和因变量之间相关程度越低65.方差分析的目的是研究各分类自变量对数值型因变量的影响是否显著66.下面哪一项不是方差分析中的假定各总体的方差等于067.下列哪种情况不适合用方差分析年龄对收入的影响68.从两个总体中各选取了6个观察值,得到组间平方和为234,组内平方和为484,则组间方差和组内方差分别为234,48.469.从两个总体中共选取了8个观察值,得到组间平方和为432,组内平方和为426,则组间均方和组内均方分别为432,7170.在方差分析中,某一水平下样本数据之间的误差称为组内误差二、名词解释1.离散变量与连续变量P10(1)离散变量如果一个变量的变量值是间断的,可以一一列举的,这种变量称为离散变量。
例如,某人兄弟姐妹数、结婚次数、工厂生产产品的数量等,其变量值的取值是0,1,2,3…。
离散变量的取值是有限个值,而且其取值都是以整数位断开的,是有最小计量单位的。
例如,某人的兄弟姐妹数,只能是1个、2个、3个等,而不能是1.3个、2.5个等。
(2)连续变量如果一个变量的变量值是连续不断的,即可以取无数多个数值,这种变量称为连续变量。
例如,年龄、温度、灯泡的寿命等,它们的取值是连续不断的。
连续变量可以取无数多个值,其取值是连续不断,不可以一一列举的,而且,它们没有最小计量单位。
例如,年龄可以是1岁整,也可以是1.2岁、1.45岁、2.544岁等。
2.总体与样本 P11总体是构成它的所有个体的集合,个体则是构成总体的最基本的单位。
样本就是从总体中按照一定方式抽取的一部分个体的集合。
例如,要从某省所有育龄妇女中抽取1000人进行调查进行调查,那么,该省所有育龄妇女就是研究总体,其中每一位育龄妇女就是个体,而抽取出的1000名育龄妇女就构成为了该总体的一个样本。
3.抽样单位与抽样框 P11抽样单位就是一次直接的抽样所使用的基本单位。
抽样单位有时与构成总体的个体是相同的,有时是不同的。
例如对育龄妇女的调查,当直接抽取育龄妇女时,两者是相同的;当我们从总体中一次直接抽取户时,以抽中的户中的育龄妇女作为样本时,抽样单位(户)与个体(育龄妇女)就不相同了。
抽样框是指一次直接抽样时样本中所有抽样单位的名单。
例如,从某校中抽取200名学生进行就业观的调查,那么这所学校的所有学生的名单就是这次抽样的抽样框。
但是,当我们先抽取班级,以抽中班级中的所有学生作为样本时,这所学校所有班级的名单就是这次抽样的抽样框。