社会统计学第二次作业

社会统计学第二次作业
社会统计学第二次作业

我国中老年人生活满意度及其影响因素研究

——基于2013年“中国健康与养老追踪调查”(CHARLS)全国数据的分析

摘要:

关键词:

一.研究背景和文献综述

生活满意度通常指个人生理、心理和社会的良好状态以及幸福感和满足感,是衡量生活质量的重要指标。生活满意度一方面受到客观状况的影响,同时也是主观评价的具体表现,是主客观条件相互作用的产物。随着我国经济政治与社会的快速发展,学界越来越重视对于社会各阶层、各年龄段的社会满意度研究。而近年来,我国人口老龄化进程不断加剧,老年人口的数量和比例日益提高,这对于社会发展提出了新的挑战。根据联合国的老龄化标准,60岁以上的人口占10%,65岁以上人口占7%即进入老龄化社会,我国早在2000年就已经成为老龄化国家。而2014年国家统计局公布的数据显示,我国60岁和65岁以上人口所占比例分别为15.5%和10.5%,已经进入严重的老龄化社会,而且这一趋势还将进一步扩大。在这样的社会背景下,对于中老年人口的关注对于整个社会至关重要,如何提高中老年人的生活质量,提高其生活满意度具有重要的意义与价值。

学界现有的关于生活满意度的研究涉及多个层次,关注多方面群体,已经取得了一系列的研究成果。(一)在试图全面考察影响老年人生活满意度影响因素方面:刘吉(2015)基于2011年CHARLS数据分析全国范围内老年人的生活满意度,证明人口学基本特征、健康状况、社会参与情况、代际支持以及豆乳等都会对老年人生活满意度产生重要影响;李德明等(2006)通过研究北京市老年人的生活满意度以及影响因素发现,北京市老年人的生活满意度居中上水平,而且一般人口学变量和客观因素对具体满意度的作用而对总体生活满意度产生影响;金岭(2010)在《老年人生活满意度的影响因素及其比较分析》一文中指出经济状况自评和健康状况自评两项内容是影响老年人选择生活是否满意的主要因素,而和谐的人际网络互动以及个人从事精神文化活动的丰富对老年人生活满意度也有重要影响;冯晓黎等(2005)考察吉林省老年人口相关数据,发现经济收入及

婚姻家庭对老年人生活满意度具有重要影响。

(二)在从单一具体视角切入进行分析方面,研究者主要关注了城乡差异、性别、社会参与、居住偏好、亲情感等变量:1.城乡方面:李建新等(2015)对于城乡老年人口生活满意度差异及变化的分析显示,在控制了影响生活满意度的主要因素之后城乡老年人口的生活满意度差异依然存在,而且老年人生活满意度的城乡差别主要来自于城乡老年人社会心理和城乡宏观政策环境差异;郑冰等(2015)对农村老年人生活满意度及其影响因素研究显示经济水平对农村老年人生活满意度的影响最显著,且参加社会活动的农村老年人生活满意度更高;2.代际支持方面:李树茁等(2011)通过对安徽省农村老年人生活状况进行跟踪研究来考察代际支持对农村老年人生活满意度的影响,结果发现老年人获得子女提供的经济支持、代际间双向的家务帮助和情感支持提升了老年人的生活满意度;

3.性别方面:陆杰华等(2013)对于我国城市老年妇女生活满意度的影响因素分析则表明心理自评健康良好的老年妇女生活满意度较好,此外,做家务和社区提供良好精神慰藉帮助也会明显提高老年妇女生活满意度;

4.主观自评方面:骆为祥等(2007)研究了社会、个体比较中的老年人生活满意度,发现老年人在评估自己的生活条件时,不仅以纵向的方式将自己的现状与过去和理想状况比较,更是从横向的角度将其与周围人相比,而且横向比较对老年人生活满意度的影响更大;

5.家庭亲情感方面:郭志刚等(2007)从“核心家人构成”这一视角探究中国老年人生活满意度及其需求满足方式,最后的结果显示由核心家人来提供老年人在居住、生病照顾和情感慰藉等方面的需求是最令老年人满意的;同钰莹(2000)研究亲情感对老年人生活满意度的影响,发现亲情感对老年人生活满意度极为重要,老年人的孤独很大程度上是可以通过亲情关怀来化解的;

6.个人心理品质方面:陈世平等(2001)通过对天津市城市居民生活满意度的研究发现,与生活满意度显著相关的因素主要有乐观、自尊、自由、满足等心理因素,表明在基本生活保障达到一定满足之后,乐观的情绪等心理品质在生活满意度上具有重要的意义;

7.社会参与方面:王萍(2012)对于长沙老年人社会参与的研究显示社会参与积极程度相对较高的老年人,其精神状态较好且人际交往满意度和情感交流满意度都相对较高;

8.居住意愿方面:曾宪新(2011)有关居住方式及其意愿对老年人生活满意度的影响的研究证明居住方式及居住意愿是老年人生活

满意度的边缘影响因素,只对单身老年人的生活满意度有显著影响。

二.研究问题和研究目的

本研究的主题为“我国中老年人生活满意度及其影响因素”,试图在已有文献研究的基础上通过分析相关数据对当前社会中我国中老年人的生活满意度状况进行描述,进而通过具体数据分析对影响生活满意度的变量及其影响程度和具体的变动状况进行研究,并结合相关社会学理论进行分析说明。

当前中国社会的老龄化程度不断加深,这对于整个社会来说都是一个巨大的挑战。中年群体处于向老年过渡阶段,既要面临老年时期的各种问题,同时也要面临当下较重的家庭和工作负担。在这样的状况下,如何为中老年人提供包括医疗、养老等社会保障、如何提高中老年人的生活质量并在主观上提高中老年人的生活满意度或幸福感具有至关重要的作用。了解当前社会中老年人生活满意度的现状使我们将视角转向中老年人主观感受的重要一步,表明在物质条件之外我们更加重视人的心理感受与主观评价,更加关注人本身的重要性,加强对中老年人的人文关怀。在此基础上研究我国中老年人生活满意度的影响因素并对其影响机制进行初步分析有助于我们采取相应的措施提高中老年人的生活满意度。三.数据来源与预处理

(一)数据介绍:

本文选择的数据是“中国健康与养老追踪调查”(China Health and Retirement Longitudinal Survey, CHARLS)2013年全国数据。CHARLS调查旨在收集一套代表中国45岁及以上中老年人家庭和个人高质量微观数据,用以分析我国人口老龄化问题,推动老龄化问题的跨学科研究。调查于2011年展开,覆盖150个县级单位450个村级单位约1万户家庭中的1.7万人。调查采用多阶段抽样,在县/区和村居抽样阶段均采取PPS抽样方法,即按规模大小成比例的概率抽样,这样的一种抽样方法符合随机抽样的要求,使得最后获取的数据具有较好的代表性,覆盖率中国多个地区具有不同特点的人群,减少了抽样。调查首创了电子绘图软件(CHARLS-GIS)技术,用地图法制作村级抽样框。问卷内容包括:个人基本信息,家庭结构和经济支持,健康状况和功能,医疗保健和保险,工作、退休和养老金,收入、支出与资产以及住房情况等。本文选择的2013年研究数据是在2011年基线调查的基础上全国追访数据的更新,首次发布了体检、

退出以及死因调查等文化和数据。

(二)数据预处理:本文的研究对象是中老年人,因此只保留了45岁及以上的观测数据,即将年龄作为控制变量。根据目前已有的文献资料对于中老年人生活满意度的研究,我们初步选择了人口学特征(包括性别、婚姻状况、健在子女数量、户口类型),社会学因素(包括最高教育程度、收入主观自评、养老保险和代际支持),行为及生活方式(包括吸烟、饮酒、居住偏好、与子女见面频率、居住地点和社交),生理健康状况(包括慢性病、抑郁等客观评价和自评健康状况)等19个潜在解释变量,试图在此基础上通过相关性分析以及缺失值处理等方式进一步确定最终能够进入模型的解释变量,同时,模型选择的因变量是生活满意度。

四.研究方法

(一)拟采用的方法

首先使用描述性统计的方法对预选择的中老年人生活满意度及其19个潜在解释变量进行简要分析,观测其缺失值的分布情况,适当删减缺失值严重影响之后模型分析的变量;同时使用卡方分析和方差分析的方式检验每个预选择的解释变量与因变量即生活满意度之间的相关关系,排除在统计意义上不具有显著相关关系的变量。

在确定了最终的自变量、因变量和控制变量之后,采用Logistic回归模型对数据进行拟合,构建因变量为生活满意度这一二分变量的Logistic回归模型,对影响生活满意度的变量进行进一步的讨论和分析,观察其影响程度和具体的影响状况。

(二)变量的编码说明:

1.预选择的有些解释变量所对应的问卷问题包含了多个分类的回答,不便于直接进行logistic回归分析,且各类回答之间分布差异较大,所以需要对这样的变量进行概括分类,即将实际意义相似、类别详尽以及取值频率较低的类别进行合并处理,将原有多分类变量结果通过合并的方法转化为二分变量。采取这一方式进行处理的解释变量主要有婚姻状况、户口类型、最高教育程度、吸烟、饮酒、居住偏好、居住地点类型、与子女见面频率、自评健康状况,同时因变量生活满意度也是采取这种编码方法;

2.预选择的有些解释变量所对应的问卷问题不是只有一个,有多个问卷问题共同反映选择的解释变量,因此需要对这些问题进行综合合并。在合并的过程中通常采用赋分的方式将这些问题的答案做定量化处理,例如将“极好、很好、好、一般、不好”分别赋5、4、3、2和1分,然后将所选择的问卷题目进行加总计算最终得分。采取这种方法进行处理的解释变量主要有收入主观自评、养老保险、社交、慢性病和抑郁情况。

表1:预选变量编码及解释

变量名编码具体解释

性别(gender)1=女;0=男

年龄(age)连续型变量

婚姻状况

(marital-status)1=已婚;0=非已婚

已婚包括与配偶一起居住和因工作原因暂时未

与配偶一起住;非已婚包括未婚、离异、丧偶、

分居、同居等

户口类型(residence)1=非农业;0=农业农业户口还包含统一居民户口和无户口

教育程度(education)0=小学;1=初高中;2=大学及以上小学包括未受过教育或为读完小学、私塾或小学毕业;初高中包括初中毕业或高中毕业或中专毕业;大学及以上包括本科毕业或大专毕业或硕士博士毕业

收入自评(income)连续型变量将与亲戚、同学、同事、邻居、同地区人比较的五道题得分加总,总分为25分

养老保险(insurance)1=有;0=无有养老保险指至少有一种养老保险

代际支持

(children-support)连续型变量

将每年从子女那里得来的钱和物均折合成钱进

行加总

吸烟(smoke)0=是,1=否

饮酒(drink)0=是,1=否是表示每月喝酒超过一次;否表示每月少于一次货什么都不喝

有配偶居住偏好

(living preference-Y)1=与子女住;0=不与子女住

与子女住包括与成年子女一起住或者住在同一

个社区;不与子女住包括不与其住在一个社区、

住养老院等

无配偶居住偏好

(living preference-X)1=与子女住;0=不与子女住

与子女住包括与成年子女一起住或者住在同一

个社区;不与子女住包括不与其住在一个社区、

住养老院等

与子女见面频率

(children contact)

1=频繁;0=不频繁1=至少每月见一次面;0=见面频率低于每月一次居住地点类型

(living type)

1=在家;0=在其他地方其他地方包括养老院或其他养老机构、医院等社交

(social activity)

1=参加社交;0=不参加社交参加社交表示至少参加一种社交活动

慢性病

(chronic-disease)

1=患有;2=未患有;患有慢性病表示至少患有一种慢性病

广东财经社会统计学期末考试试卷(A卷)

广东财经社会统计学期末考试试卷(A卷) 一、单项选择题(请将正确选项的序号填在答题纸相应的位置。) 1.社会统计中的变量一般分四个层次,其中最高层次的变量是 D 。 A、定类变量 B、定序变量 C、定距变量 D、定比变量 2.标准正态分布的均值一定 C 。 A、等于1 B、等于-1 C、等于0 D、不等于0 3.计算中位值时,对于未分组资料,先把原始资料按大小顺序排列成数列,然后用公式 D 确定中位值所在位置。 A、n/2 B、(n-1)/2 C、(n+2)/2 D、(n+1)/2 4.下列统计指标中,对极端值的变化最不敏感的是 A 。 A、众值 B、中位值 C、四分位差 D、均值 5.如果原假设是总体参数不小于某一数值,即大于和等于某一数值,应采用的检验是。 A、两端检验 B、右端检验 C、左端检验 D、无法判断 6.在一个右偏的分布中,大于均值的数据个数将。 A、不到一半 B、等于一半 C、超过一半 D、视情况而定 7.下列关于“回归分析和相关分析的关系”的说法中不正确的是。 A、回归分析可用于估计和预测 B、相关分析是研究变量之间的相互依存关系的密切程度 C、相关分析不需区分自变量和因变量 D、回归分析是相关分析的基础 8.假定男性总是与比自己年轻3岁的女性结婚,那么夫妻年龄之间的积距相关系数r为。 A、-1 < r< 0 B、0 < r< 1 C、r = 1 D、r = -1 9.“4、6、8、10、12、26”这组数据的集中趋势宜用测量。 A、众值 B、中位值 C、均值 D、平均差 10.某校期末考试,全校语文平均成绩为80分,标准差为4.5分,数学平均成绩为87分,标准差为9.5分。某学生语文得了83分,数学得了92分,从相对名次的角度看,该生的成绩考得更好。 A、数学 B、语文 C、两门课程一样 D、无法判断 三、判断题(请在答题纸相应位置打√或?。) 1.无论分布曲线是正偏还是负偏,中位值都居于均值和众值之间。 2.一组数据的均值代表了该组数据中大多数的数据。 3.对于连续型随机变量,讨论某一点取值的概率是没有意义的。 4.异众比率越大,各变量值相对于众值越离散,众值的代表性越好。 5.只要样本量足够大,则不论总体分布如何,样本均值的抽样分布都服从正态分布。 6.检验均值差异时,独立样本采用“差的均值”、关联样本采用“均值的差”进行检验。 7.在显著性水平既定的情况下,一端检验比两端检验更容易拒绝H0。 8.不管相关关系表现形式如何,当r=1时,变量X和变量Y都是完全相关;当r=0时,变量X 和变量Y都是完全不相关。 9.方差分析就其内容来说,是分析或检验总体间的均值是否存在差异。 10.纳伪的概率β可以根据原假设H0所设的分布计算出来。 1

社会统计学作业一.

社会统计学作业一 特别提示:1、作业提交截至时间:2005年10月11日中午12点; 2、不接收电子版,答案要求手填。 一、某城市有人口211732人,去年发生了47次银行抢劫案,13次谋杀案,23次汽车偷窃案,分别计算每10万人口中这三类案件的犯罪率。 二、

上面是社会学系某年级学生的总评学分绩点,按照这个原始数据,作出四个完整的分布统计表: (1)不分组的频次统计表; (2)利用计算法确定组距画出分组的频次统计表; (3)利用经验法分组的频次统计表,包括标示组限、频次、相对频次,频率,cf↑,cf↓,c%↑,c%↓; (4)利用经验法分组的频次统计表,包括每组的标示上下组限,真实上下组限,组距,组中值和频次。 三、下面的统计表有哪些问题,指出来。并画一个完整的频次和频率统计表,在 表中把真实组限、组距和组中值都列上。 某厂工人的月收入分布 四、下面的图是一个直方图,表示了在药物研究项目中所有14148位妇女的血压 分布。使用直方图回答下列问题:

a) 血压在130mm 以上的妇女的百分数大约是25%,50%,还是75%? b) 血压在90mm 与160mm 之间的妇女的百分数大约是1%,50%,还是99%? c) 在哪个区间有较多妇女:135-140mm 还是140-150mm ? d) 哪个区间更拥挤一些:是135—140mm 还是140—150mm ? e) 在区间125—130mm 内,直方图的高大约为每mm2.1%。多少百分数的妇女 具有这个小组区间里的血压? f) 哪个区间有较多妇女:是97-98mm ,还是102—103mm ? g) 所有的毫米中,哪里最拥挤? 五、三个人使用密度尺度对一项研究中的实验对象的体重绘制了直方图。只有一 个人是正确的。是哪一个,为什么? (1) 100 150 200 (2) (3) 100 150 200 100 150 200 六、下面给出非全日雇员月工资的直方图。没有人一个月挣1000美元以上。200 至500美元的小组区间上的块形不见了,它必定有多高? 每 mm 的百 分数 0 1 2 3 4 90 100 110 120 130 140 150 160 血压(mm )

(完整版)社会统计学试卷A及答案解析

级专业2010学年第 1 学期《社会统计学》试卷 A 姓名:学号: (□开卷□闭卷) 一、选择题:2*10=20分 1、要了解400个学生的学习情况,则总体单位是( B ) 。 A 400个学生 B 每一个学生 C 400个学生的成绩 D 每一个学生的成绩 2、只与一个自由度有关的是( A ) χ分布 B 超几何分布C 泊松分布 D F分布 A 2 3、将总体按与研究有关的标志进行分组,然后再随机地从各组中抽选单位组成样本。这种 抽样方式叫( B )。 A 简单随机抽样 B 类型抽样 C 等距抽样 D 整群抽样。 4、在方差分析中,自变量是(A )。 A 定类变量 B 定序变量 C 定距变量 D 定比变量 5、某城市男性青年27岁结婚的人最多,该城市男性青年结婚平均年龄为26.2岁,则该城 市男性青年结婚的年龄分布为(B)。 A.正偏B.负偏 C.对称D.不能作出结论 6、分析统计资料,可能不存在的平均指标是( A )。 A 众数 B 算术平均数 C 中位数 D 几何平均数 7、在一个左偏的分布中,小于平均数的数据个数将( C )。 A 超过一半 B 等于一半 C 不到一半 D 视情况而定 8、若P(A)=0.2,P(B)=0.6,P(A/B)=0.4,则) P I=( D )。 A (B A 0.8 B 0.08 C 0.12 D 0.24。 9、关于学生t分布,下面哪种说法不正确(B )。 A 要求随机样本 B 适用于任何形式的总体分布

C 可用于小样本 D 可用样本标准差S 代替总体标准差σ 10、对于大样本双侧检验,如果根据显著性水平查正态分布表得 Z α/2=1.96,则当零假 设被否定时,犯第一类错误的概率是( C )。 A 20% B 10% C 5% D .1% 二、判断题:2*10=20分 1、所有的统计指标都是变量。 ( 对 ) 2、统计所研究的对象就是社会经济现象的数量方面。 (错 ) 3、随机变量在相同的条件下进行观测,其可能实现的值不止一个。 (对 ) 4、在社会现象中,即使相同的意识作用也完全可能有不确定的结果,这就提供了概率论应用的可能性。 ( 对 ) 5、成功次数的期望值λ是决定泊松分布的关键因素。 ( 对 ) 6、进行区间估计,置信水平总是预先给定的。 ( 对 ) 7、可以对置信水平作如下解释:“总体参数落在置信区间的概率是(1-α)”。(错 ) 8、将收集到得的数据分组,组数越多,丧失的信息越多。 (错 ) 9、N 个变量值连乘积的平方根,即为几何平均数。 (错 ) 10、当样本容量n 无限增大时,样本均值与总体均值的绝对离差小于任意正数的概率趋于零。 (错 ) 三、简答题:5*7=35分 1、大数规律 大数规律是随机现象出现的基本规律,它的一般意义是:观察过程中每次取得的结果可能不同(因为具有偶然性),但大量重复观察结果的平均值却几乎接近某个确定的数值。 2、配对样本 所谓配对样本,指只有一个总体,双样本是由于样本中的个体两两匹配成对而产生的。 3、消减误差比例 变量间的相关程度,可以用不知Y 与X 有关系时预测Y 的误差0E ,减去知道Y 与X 有关 系时预测Y 的误差1E ,再将其化为比例来度量。将削减误差比例记为PRE 。 4、同分对 如果在X 序列中,我们观察到i j X =X (此时Y 序列中无i j Y =Y ),则这个配对仅是X 方向而非Y 方向的同分对;如果在Y 序列中,我们观察到i j Y =Y (此时X 序列中无i j X =X ),则这个配对仅是Y 方向而非X 方向的同分对;我们观察到i j X =X ,也观察到i j Y =Y ,则称这个配对为X 与Y 同分对。 5、什么是分层抽样? 分层抽样也叫类型抽样,就是先将总体按某种特征或属性分若干类别或层次,再按照一定比 例在各个子类别或层次中随机抽取,最后将各抽取的单位合并成样本。 6、简述回归分析和相关分析之间的密切联系。 一般说来,只有当两个变量之间存在着较高程度的相关关系时,回归分析才变得有意义和有价值。相关程度越高,回归预测越准确。因此,往往先进行相关分析,然后才选用有明显相关关系的变量作回归分析。与此同时,相关关系往往要通过回归分析才能阐释清楚,例如皮尔逊相关系数的PRE 性质。回归分析具有推理的性质,而相关分析从本质上讲只是对客观事物的一种描述,知其然而不知其所以然。因而从分析层次上讲,回归分析更深刻一些。 7、P 值决策与统计量的比较 P 值是被称为观察到的(或实测的)显著性水平。用P 值进行检验比根据统计量检验提供更多

社会统计学复习题(有答案)复习课程

社会统计学复习题(有 答案)

社会统计学课程期末复习题 一、填空题(计算结果一般保留两位小数) 1、第五次人口普查南京市和上海市的人口总数之比为 比较 相对指标;某企业男女职工人数之比为 比例 相对指标;某产品的废品率为 结构 相对指标;某地区福利机构网点密度为 强度 相对指标。 2、各变量值与其算术平均数离差之和为 零 ;各变量值与其算术平均数离差的平方和为 最小值 。 3、在回归分析中,各实际观测值y 与估计值y ?的离差平方和称为 剩余 变差。 4、平均增长速度= 平均发展速度 —1(或100%)。 5、 正J 形 反J 形 曲线的特征是变量值分布的次数随变量值的增大而逐步增多; 曲线的特征是变量值分布的次数随变量值的增大而逐步减少。 6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况,这种调查方式属于 重点 调查。 7、要了解某市大学多媒体教学设备情况,则总体是 该市大学中的全部多媒体教学设备 ;总体单位是 该市大学中的每一套多媒体教学设备; 。 8、若某厂计划规定A 产品单位成本较上年降低6%,实际降低了7%,则A 产品单位成本计划超额完成程度为 100%7% A 100% 1.06%100%6% -=- =-产品单位成本计划超额完成程度 ;若某厂计划规定B 产 品产量较上年增长5%,实际增长了10%,则B 产品产量计划超额完成程度为 100%10% 100% 4.76%100%5% += -=+B 产品产量计划超额完成程度 。 9、按照标志表现划分,学生的民族、性别、籍贯属于 品质 标志;学生的体重、年龄、成绩属于 数量 标志。

【精选】统计学第一次作业 答案

《统计学》第一次作业 一、单选题(共10个) 1.统计工作的成果是( C )。 A. 统计学 B. 统计工作 C. 统计资料 D. 统计分析和预测 2. 社会经济统计的研究对象是( C )。 A. 抽象的数量关系 B. 社会经济现象的规律性 C. 社会经济现象的数量特征和数量关系 D. 社会经济统计认识过程的规律和方法 3. 对某地区的全部产业依据产业构成分为第一产业、第二产业和第三产业,这里所使用的计量尺度是( A )。 A. 定类尺度 B. 定序尺度 C. 定距尺度 D. 定比尺度 4.某城市工业企业未安装设备普查,总体单位是( D )。 A. 工业企业全部未安装设备 B. 工业企业每一台未安装设备 C. 每个工业企业的未安装设备 D. 每一个工业企业 5.统计总体的同质性是指( B )。 A. 总体各单位具有某一共同的品质标志或数量标志 B. 总体各单位具有某一共同的品质标志属性或数量标志值 C. 总体各单位具有若干互不相同的品质标志或数量标志 D. 总体各单位具有若干互不相同的品质标志属性或数量标志值 6.下列调查中,调查单位与填报单位一致的是(D ) A. 企业设备调查 B. 人口普查 C. 农村耕地调查 D. 工业企业现状调查 7.某灯泡厂为了掌握该厂的产品质量,拟进行一次全厂的质量大检查,这种检查应当选择( D)

A. 统计报表 B. 重点调查 C. 全面调查 D. 抽样调查 8.重点调查中重点单位是指(A ) A. 标志总量在总体中占有很大比重的单位 B. 具有典型意义或代表性的单位 C. 那些具有反映事物属性差异的品质标志的单位 D. 能用以推算总体标志总量的单位 9.书籍某分组数列最后一组是500以上,该组频数为10,又知其相邻组为400-450,则最后一组的频数密度为( A) A. 0.2 B. 0.3 C. 0.4 D. 0.5 10.在组距分组中,确定组限时(B ) A. 第一组的下限应等于最小变量值 B. 第一组的下限应小于最小变量值 C. 第一组的下限应大于最小就量值 D. 最后一组的上限应小于最大变量值 二、多选题(共5个) 1. 按照统计数据的收集方法,可将统计数据分为( AC )。 A. 观测数据 B. 截面数据 C. 实验数据 D. 间数列数据 2. 定比尺度的特点是( ACDE) A. 它有一个绝对固定的零点 B. 它没有绝对零点 C. 它具有定类、定序、定距尺度的全部特性 D. 它所计量的结果不会出现“0”值 E. 它可以计算两个测度值之间的比值 3.下列标志中,属于品质标志的有( BD )。 A. 工资 B. 所有制 C. 耕地面积 D. 产品质量

社会统计学

社会统计学 第一章导论 一.社会统计学的产生与发展 1.国势学派:(又称记录学派或历史学派)对国家显著事迹的记录和比较。 “有名无实” 代表人物:阿享瓦尔(1719—1772)“统计学之父”、康令(1606—1681) 2.政治算术学派:对国家事项首创数字对比、分析。“有实无名” 代表人物:威廉 配第(1623—1687)“政治经济学之父”、格朗特(1620—1674)3.数理统计学派:将法国古典概率论引入统计学,用纯数学的方法对社会现象进 行研究。 代表人物:凯特勒(1796—1874)“现代统计学之父” 4.社会统计学派:研究社会现象 代表人物:克尼斯(1821—1898)、梅尔(1841—1925)、恩格尔(1821—1896)二.社会统计学的对象和特点 社会统计学:用于统计的一般原理,对社会各种静态结构和动态趋势进行定量描述或推断的一种方法与技术。研究对象概括而言是指社会现象的数 量方面。 社会统计学特点:就研究对象而言,社会统计学主要是从研究和反映一定经济基础之上的上层建筑方面去认识社会;就研究内容而言,社会统计需 要对人们的态度、观念、行为进行度量,测量这些社会现象目前还 没有一个精确而统一的尺度,只能以近似估算或词语表达等方式来 代替;就调查方法而言,社会统计中,由于其研究对象所具有的特 征,抽样调查更为常用。 三.社会统计学的方法 1.大量观察法:就总体中足够多的单位进行调查和综合分析,用以反映社会总体 的数量特征。 2.大数定理:是随机现象出现的基本规律,一般意义为:观察过程中每次取得的 结果可能不同(因为具有偶然性),但大量重复观察结果的平均值却几乎接近某个确定的数值。 3.综合指标法 4.统计推断法 四.社会统计学的几个基本概念 1.总体与单位 总体:作为统计研究对象的,由许多具有共性的单位构成的整体。 单位:构成整体的每一个个体。 2.标志与变量, 标志:总体的每个单位都具有许多属性和特性,说明总体单位属性或数量特征的名称在统计上称为标志。 数量标志:凡能用数量的多少来表示的标志,称为数量标志,如年龄,它们用以说明事物量的规定性。 品质标志:凡不能用数量的多少来表示而只能文字表述的标志称为品质标志,如性别,它们用以说明事物质的规定性。 变量:可变的数量标志能够用数值表示,我们称之为变量。

2013年9月份考试统计学第三次作业

2013年9月份考试统计学第三次作业 一、填空题(本大题共20分,共 10 小题,每小题 2 分) 1. ______ 若变量与y 之间为完全正相关,则相关系数r= ______ ;若x 与y 之间为完全负相关,则r = ______ ;若x 与y 之间不存在线性相关关系,则r= ______ 。 2. 数列中各项指标值都反映事物在一段时期内发展过程的总量或绝对水平的是______ 。 3. 因素分析法的基础是 ______ 。 4. 统计学的三个源流为德国的 ______ ,英国的 ______ ,法国的 ______ 。 5. 重点调查是在调查对象中选择一部分 ______ 、进行调查的一种 ______ 调查。 6. 标志是说明总体单位的名称,它有 ______ 和 ______ 两种。 7. ______ 是统计分析的第一步。 8. 平均发展速度的计算方法通常有 ______ 和 ______ 两种。 9. 统计表一般由 ______ 、 ______ 、 ______ 和 ______ 四个主要部分组成。 10. 已知一组数据的均值为150,离散系数为0.3,则该组数据的方差为 ______ 。 二、名词解释题(本大题共10分,共 2 小题,每小题 5 分) 1. 类型抽样 2. 统计分析 三、计算题(本大题共40分,共 2 小题,每小题 20 分) 1. 在其他条件不变的情况下,某种商品的需求量( y )与该商品的价格 ( x )有关。现对给定时期内的价格与需求量的进行观察,得到如下一组数 据:要求:(1)计算价格与需求量之间的简单相关系数,(2)拟合需求量对价格的回归直线,并解释回归系数的实际含义;(3)计算判定系数合估计标准误差,分析回归直线的拟合程度; 2. 某企业某种产品的有关数据如下: 要求:(1)将表中空格数字填上;(2)计算该企业铲平的年平均增长量;(3)按水平法计算产品产量的年平均增长速度。 四、问答题(本大题共30分,共 3 小题,每小题 10 分) 1. 简述相关分析的内容。

社会统计学期末复习提纲

《社会统计学》课程期末复习提纲 ·考试题型: 一、填空题(10×1分=10分)二、判断题(10×1分=10分) 三、单项选择题(20×1分=20分)四、简答题(2×6分=12分)五、计算题(4题共48分) ·各章复习要点 第一章总论 P.2 统计的含义:统计工作·统计资料·统计学。其中:统计工作和统计资料是活动过程和成果的关系;统计学和统计工作是理论和实践的关系。 “统计”一词包含三种涵义,并且具有密切的联系。其中:统计工作和统计资料之间是工作与成果的关系;统计学和统计工作之间是理论和实践的关系。(y ) P.11—P.13 定类尺度;定序尺度;定距尺度;定比尺度(结合课件相关内容) 量化尺度特征功能举例 1、定类尺度确定类别分类民族的测量 2、定序尺度确定类别排列顺序分类排序考试成绩等级的测量 3、定距尺度确定类别排列顺序测数量差别和间隔距离无绝对零点分类排序加减智商的测量 4、定比尺度确定类别有序排序测数量差别和间隔距离有绝对零点分类排序加减乘除体重的测量何谓定类尺度和定序尺度?两者有何区别?1定类尺度是确定事物类别的计量尺度---高一个层次 2定类只能区分不同性质的现象并予以归类---可将所区分的类别按高低,大小,好坏,强弱,优劣等顺序做有序排列。 3定类不能进行数的比较和数学运算--能进行大小比较。 何谓定距尺度和定比尺度?两者区别定距尺度是确定研究对象之间某些数值相差的距离的尺度---最高的数据计量尺度 缺乏绝对零点---有,0 2. 0只表示一个值,即0值---0是绝对零点,表示没有 3.只能加减,不能乘除---加减乘除,高层次的各种统计分析。 P.13—P.14 总体和总体单位 一、总体和总体单位 (一)总体 1、概念总体(也称为统计总体)是指客观存在的、在同一性质基础上结合起来的许多个别单位的整体(同质个体的集团)。 2、特点·客观性·大量性同质性·差异性 1、总体单位除了必须具备同质性外,还必须具备1、差异性(或变异性)性,否则

第三次社会统计学作业

第三次社会统计学作业:参数估计 的初婚年龄的置信区间。(已知t 0.05(21) =1.721、t 0.05(20) =1.725、t 0.025(21) =2.080、t 0.025(20) =2.086)。 2.某工厂妇女从事家务劳动时间服从正态分布N (μ,2 66.0)。根据36人的随机抽样调查,每天平均从事家务劳 3.根据某地100户的随机抽查,其中有60户拥有电冰箱,求该地区拥有电冰箱成数P 的置信区间(置信度为0.95)。 4.某企业有职工1385人,现从中随机抽出50人调查其工资收入情况如下: 试以0.95的置信度估计该企业职工的月平均工资收入所在范围。 5.某食品公司所生产的牛肉干中,随机抽7盒,称得各盒重量如下:9.6、10.2、9.8、10.0、10.4、9.8、10.2。如牛肉干盒重量近似于正态分布,求置信水平为95%的情况下,牛肉干盒平均重量的置信区间是多少? 6.从某校随机地抽取81名女学生,测得平均身高为163厘米,标准差为6.0厘米,试求该校女生平均身高95%的置信区间。 7.如果认为该市农民工参保率是35%,若要求在95%的置信水平上保证这一比例的估计误差不超过6%,试问调查的样本容量应该有多大? 8.若某一居民小区中住房拥有者的比例近似0.75,那么建立总宽度为0.03 的95%的置信区间,需要多大样本?若住房拥有者的比例改为0. 5,那么建立总宽度为0.03 的95%的置信区间,又需要多大样本? 101}≥0.95,问样本容量n 至少应取多大? 10.为研究睡眠对记忆的影响,在两种条件下对人群进行了试验。(1)在早7点放电影,被测者晚上睡眠正常,第二天晚上就电影的50项内容进行测试;(2)在早7点放电影,被测者白天情况正常,同一天晚7点就电影的50项内容进 =3.24,n2=15。假定两种条件下总体均服从正态分布,且方差相等,试求μ1―μ2的95%的置信区间。

社会统计学复习题(有答案)

社会统计学课程期末复习题 一、填空题(计算结果一般保留两位小数) 1、第五次人口普查南京市和上海市的人口总数之比为 比较 相对指标;某企业男女职工人数之比为 比例 相对指标;某产品的废品率为 结构 相对指标;某地区福利机构网点密度为 强度 相对指标。 2、各变量值与其算术平均数离差之和为 零 ;各变量值与其算术平均数离差的平方和为 最小值 。 3、在回归分析中,各实际观测值y 与估计值y ?的离差平方和称为 剩余 变差。 4、平均增长速度= 平均发展速度 —1(或100%)。 5、 正J 形 反J 形 曲线的特征是变量值分布的次数随变量值的增大而逐步增多; 曲线的特征是变量值分布的次数随变量值的增大而逐步减少。 6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况,这种调查方式属于 重点 调查。 7、要了解某市大学多媒体教学设备情况,则总体是 该市大学中的全部多媒体教学设备 ;总体单位是 该市大学中的每一套多媒体教学设备; 。 8、若某厂计划规定A 产品单位成本较上年降低6%,实际降低了7%,则A 产品单位成本计划超额完成程度为 100%7% A 100% 1.06%100%6% -=-=-产品单位成本计划超额完成程度 ;若某厂计划规定B 产品产量较上年增长5%,实际增长了10%,则B 产品产量计划超额完成程度为 100%10% 100% 4.76%100%5% +=-=+B 产品产量计划超额完成程度 。 9、按照标志表现划分,学生的民族、性别、籍贯属于 品质 标志;学生的体重、年龄、成绩属于 数量 标志。 10、从内容上看,统计表由 主词 和 宾词 两个部分组成;从格式上看,统计表由 总标题 、 横行标题 、 纵栏标题 和 指标数值(或统计数值); 四个部分组成。 11、从变量间的变化方向来看,企业广告费支出与销售额的相关关系,单位产品成本与单位产品原材料消耗量的相关关系属于 正 相关;而市场价格与消费者需求数量的相关关系,单位产品成本与产品产量的相关关系属于 负 相关。 12、按指标所反映的数量性质不同划分,国民生产总值属于 数量 指标;单位成本属于 质量 指标。 13、如果相关系数r=0,则表明两个变量之间 不存在线性相关关系 。 二、判断题

2018年春社会统计学期末复习训练题 (4)

2018年春社会统计学期末复习题 一、单项选择题 1.以下关于因变量与自变量的表述不正确的是() A.自变量是引起其他变量变化的变量 B.因变量是由于其他变量的变化而导致自身发生变化的变量 C.自变量的变化是以因变量的变化为前提 D.因变量的变化是以自变量的变化为前提 2.在频数分布表中,将各个有序类别或组的百分比逐级累加起来称为() A.频率 B.累积频数 C.累积频率 D.比率 3.离散系数的主要目的是() A.反映一组数据的平均水平 B.比较多组数据的平均水平 C.反映一组数据的离散程度 D.比较多组数据的离散程度 4.经验法则表明,当一组数据正态分布时,在平均数加减2个标准差的范围之内大约有() A.50%的数据 B.68%的数据 C.95%的数据

D.99%的数据 5.在某市随机抽取10家企业,7月份利润额(单位:万元)分别为 72.0、63.1、20.0、23.0、54.7、54.3、23.9、25.0、26.9、29.0,那么这10家企业7月份利润额均值为() A.39.19 B.28.90 C.19.54 D.27.95 6.用样本统计量的值直接作为总体参数的估计值,这种方法称为() A.点估计 B.区间估计 C.有效估计 D.无偏估计 7.在频数分布表中,比率是指() A.各组频数与上一组频数之比 B.各组频数与下一组频数之比 C.各组频数与总频数之比 D.不同小组的频数之比 8.下面哪一项不是方差分析中的假定() A.每个总体都服从正态分布 B.观察值是相互独立的 C.各总体的方差相等 D.各总体的方差等于0

9.判断下列哪一个不可能是相关系数() A.-0.9 B.0 C.0.5 D.1.2 10.用于说明回归方程中拟合优度的统计量主要是() A.相关系数 B.离散系数 C.回归系数 D.判定系数 11.在假设检验中,不拒绝虚无假设意味着() A.虚无假设是肯定正确的 B.虚无假设肯定是错误的 C.没有证据证明虚无假设是正确的 D.没有证据证明虚无假设是错误的 12.下列变量属于数值型变量的是() A.工资收入 B.产品等级 C.学生对考试改革的态度 D.企业的类型 13.如果用一个图形描述比较两个或多个样本或总体的结构性问题时,适合选用哪种图形()

统计学第三章练习题(附答案)

一.单项选择题 1.比较两组数据的离散程度最合适的统计量是( D )。 A.极差 B.平均差 C.标准差 D.离散系数 2.如果峰度系数k>3,表明该组数据是(A )。 A.尖峰分布 B.扁平分布 C.左偏分布 D.右偏分布 3.某大学经济管理学院有1200名学生,法学院有800名学生,医学院有320名学生,理学院有200名学生。上面的描述中,众数是( B )。 A.1200 B.经济管理学院 C.200 D.理学院 4.某班共有25名学生,期末统计学课程的考试分数分别为:68,73,66,76,86,74,61,89,65,90,69,67,76,62,81,63,68,81,70,73,60,87,75,64,56,该班考试分数下四分位数和上四分位数分别是(A)。 A.64.5和78.5 B.67.5和71.5 C.64.5和71.5 D.64.5和67.5 5.对于右偏分布,平均数、中位数和众数之间的关系是(A )。 A.平均数>中位数>众数 B.中位数>平均数>众数 C.众数>中位数>平均数 D.众数>平均数>中位数 6.某班学生的统计学平均成绩是70分,最高分是96分,最低分是62分,根据这些信息,可以计算的测度离散程度的指标是( B )。 A.方差 B.极差 C.标准差 D.变异系数 7.在离散程度的测度中,最容易受极端值影响的是(A )。 A.极差 B.方差 C.标准差 D.平均差 8.在比较两组数据的离散程度时,不能直接比较它们的标准差,因为两组数据的( D )。 A.标准差不同 B.方差不同 C.数据个数不同 D.计量单位不同 9.总量指标按其反应的内容不同,可分为(C )。 A.总体指标和个体指标 B.时期指标和时点指标

(完整版)社会统计学简答题与计算题复习资料

社会统计学复习材料 简答题 1、统计数据的质量要求: 1、精度:最低的抽样误差或随机误差; 2、准确性:最小的非抽样误差或偏差; 3、关联性:满足用户决策、管理和研究的需要; 4、及时性:在最短的时间里取得并公布数据; 5、一致性:保持时间序列的可比性; 6、最低成本:以最经济的方式取得数据。 2、抽样误差及其影响因素: 1、由于抽样的随机性所带来的误差; 2、所有样本可能的结果与总体真值之间的平均性差异; 3、影响抽样误差的大小的因素:样本量的大小,总体的变异性。 3、判断计量优劣的评判标准: 用样本的估计量直接作为总体参数的估计值, 无偏性:估计量抽样分布的数学期望等于被估计的总体参数; 有效性:对同一总体参数的两个无偏点估计量,有更小标准差的估计量更有效;一致性:随着样本容量的增大,估计量的值越来越接近被估计的总体参数。4、假设检验的一般步骤: (1)陈述原假设和备择假设; (2)从所研究的总体中抽出一个随机样本; (3)确定一个适当的检验统计量,并利用样本数据算出其具体数值;

(4)确定一个适当的显著性水平,并计算出其临界值,指定拒绝域; (5)将统计量的值与临界值进行比较,作出决策; (6)统计量的值落在拒绝域,拒绝H0,否则不拒绝H0。 5、假设检验中的两类错误及其之间的关系 错误: 1、第Ⅰ类错误(弃真错误)原假设为真时拒绝原假设,第Ⅰ类错误的概率记为a ,即显著性 水平; 2、第Ⅱ类错误(取伪错误)原假设为假时未拒绝原假设,第Ⅱ类错误的概率记为b 。 a 和 b 的关系就像翘翘板,a 小b 就大,a 大b 就小。因此,在样本容量n 固定情况下, 不能同时减少两类错误!一般采用增加样本容量的办法来解决。 关系:当显著性水平a 减小时,由于拒绝域的减小,弃真的错误会减小,但由此而来的是 接受域增大了,因此纳伪的概率b 要增大。反之亦然(P235)。也就是说如果要减小b ,就 增大显著性水平a 。 6、置信区间与置信度的关系表达式: ()αεθθεθ -=+≤≤-1??P []εθεθ+-?,?称作置信区间。α-1称作置信度,可信度,或置信水平。α称置信水平。在样本容量一定的情况下,置信区间和置信度是相互制约的。置 信度愈大,则相应的置信区间也域宽。当把区间估计得小一些,估计的精确程度提高了,但换取的代价将是估错的可能性增加了,也就是可靠性或置信度 α-1下降了。(P201) 7、正态分布曲线的特征: (1)一个高峰:曲线是单峰,有一个最高点。 (2)一个对称轴。曲线的高峰处有一个对称轴,在轴的左右两边是对称的。

《社会统计学》作业(共享含部份答案)

社会统计学作业 一、单项选择题 1.为了解IT行业从业者收入水平,某研究机构从全市IT行业从业者随机抽取800人作为样本进行调查,其中44%回答他们的月收入在6000元以上,30%回答他们每月用于娱乐消费在1000元以上。此处800人是( A ) A.样本 B. 总体 C. 统计量 D. 变量 2.在频数分布表中,将各个有序类别或组的百分比逐级累加起来称为( C )A.频率 B. 累积频数 C. 累积频率 D. 比率 3.离散系数的主要目的是( D ) A.反映一组数据的平均水平 B.比较多组数据的平均水平 C.反映一组数据的离散程度 D.比较多组数据的离散程度 4.经验法则表明,当一组数据正态分布时,在平均数加减1个标准差的范围之内大约有 ( B ) A. 50%的数据 B. 68%的数据 C. 95%的数据 D. 99%的数据 5.在某市随机抽取10家企业,7月份利润额(单位:万元)分别为72.0、63.1、20.0、23.0、54.7、54.3、23.9、25.0、26.9、29.0,那么这10家企业7月份利润额均值为( A ) A. 39.19

B. 28.90 C .19.54 D .27.95 6.用样本统计量的值直接作为总体参数的估计值,这种方法称为( A ) A .点估计 B .区间估计 C .有效估计 D .无偏估计 7.某单位对该厂第一加工车间残品率的估计高达10%,而该车间主任认为该比例(π)偏高。如果要检验该说法是否正确,则假设形式应该为( B ) A .0H :π≥0.1;1H :π<0.1 B .0H :π≤0.1;1H :π>0.1 C .0H :π=0.1;1H :π≠0.1 D .0H :π>0.1;1H :π≤0.1 8.下面哪一项不是方差分析中的假定( D ) A .每个总体都服从正态分布 B .观察值是相互独立的 C .各总体的方差相等 D .各总体的方差等于0 9.判断下列哪一个不可能是相关系数( D ) A .-0.9 B .0 C .0.5 D .1.2 10.用于说明回归方程中拟合优度的统计量主要是( D ) A. 相关系数 B. 离散系数 C. 回归系数 D. 判定系数

16秋华师《社会统计学》在线作业

奥鹏17春16秋华师《社会统计学》在线作业 一、单选题(共30 道试题,共60 分。) 1. 若A 与B 是任意的两个事件,且P(AB)=P(A)?P(B),则可称事件A与B() A. 等价 B. 互不相容 C. 相互独立 D. 即互不相容,又相互独立 正确答案: 2. 根据某城市电话网400次通话调查得知每次通话持续时间为5分钟,标准差为2分钟,请以95%的把握程度估计该城市每次通话的平均持续时间为()。 A. 4.5~5.5分钟 B. 4.836~5.164分钟 C. 4.804~5.196分钟 D. 0~11分钟 正确答案: 3. 处于正态分布概率密度函数与横轴之间,并且大于均值部分的面积为____。 A. 大于0.5 B. —0.5 C. 1 D. 0.5 正确答案: 4. 对于一个右偏的频数分布,一般情况下,下面的值最大的是____。 A. 中位数 B. 众数 C. 算术平均数 D. 几何平均数 正确答案: 5. 在调查项目不多时,宜采用的调查表形式是()。 A. 简单表 B. 复合表 C. 单一表 D. 一览表 正确答案: 6. 统计测定必须遵循的两个重要方法原则是()。 A. 实用与科学 B. 科学与合理 C. 互不与无穷

D. 互斥与穷尽 正确答案: 7. 假设检验中,若增大样本容量,则犯两类错误的可能性()。 A. 都增大 B. 都缩小 C. 都不变 D. 一个增大,一个缩小 正确答案: 8. 在相关分析中,要求相关的两变量____。 A. 都是随机变量 B. 都不是随机变量 C. 其中自变量是随机变量 D. 其中因变量是随机变量 正确答案: 9. 贯穿于统计工作认识过程的中心问题是()。 A. 如何研究现象的量 B. 如何正确区分现象质与量的界限 C. 如何研究现象的质 D. 如何正确对待现象质与量的辩正关系 正确答案: 10. 在下列两两组合的平均指标中,哪一组的两个平均数完全不受极端数值的影响?() A. 算术平均数和调和平均数 B. 几何平均数和众数 C. 调和平均数和众数 D. 众数和中位数 正确答案: 11. 统计总体的特征是()。 A. 大量性、总体性、数量性 B. 总体性、数量性、变异性 C. 同质性、数量性、变异性 D. 大量性、同质性、变异性 正确答案: 12. 若两个相互独立的随机变量X和Y的标准差分别是6和8,则(X+Y)的标准差是() A. 7 B. 10 C. 14 D. 无法计算 正确答案: 13. 对一个无限总体进行无放回的抽样时,这种抽样方式叫做()。 A. 重复抽样 B. 不重复抽样 C. 随意抽样 D. 无限抽样 正确答案:

社会统计学综合练习题资料

社会统计学期末复习训练 一、单项选择题 1.为了解IT行业从业者收入水平,某研究机构从全市IT行业从业者随机抽取800人作为样本进行调查,其中44%回答他们的月收入在6000元以上,30%回答他们每月用于娱乐消费在1000元以上。此处800人是()A.样本 B. 总体 C. 统计量 D. 变量 2.在频数分布表中,将各个有序类别或组的百分比逐级累加起来称为() A.频率 B. 累积频数 C. 累积频率 D. 比率 3.离散系数的主要目的是() A.反映一组数据的平均水平 B.比较多组数据的平均水平 C.反映一组数据的离散程度 D.比较多组数据的离散程度 4.经验法则表明,当一组数据正态分布时,在平均数加减1个标准差的范围之内大约有 ( ) A. 50%的数据 B. 68%的数据 C. 95%的数据 D. 99%的数据 5.在某市随机抽取10家企业,7月份利润额(单位:万元)分别为72.0、63.1、20.0、23.0、54.7、54.3、23.9、25.0、26.9、29.0,那么这10家企业

7月份利润额均值为( ) A. 39.19 B. 28.90 C .19.54 D .27.95 6.用样本统计量的值直接作为总体参数的估计值,这种方法称为( ) A .点估计 B .区间估计 C .有效估计 D .无偏估计 7.某单位对该厂第一加工车间残品率的估计高达10%,而该车间主任认为该比例(π)偏高。如果要检验该说法是否正确,则假设形式应该为( ) A .0H :π≥0.1;1H :π<0.1 B .0H :π≤0.1;1H :π>0.1 C .0H :π=0.1;1H :π≠0.1 D .0H :π>0.1;1H :π≤0.1 8.下面哪一项不是方差分析中的假定( ) A .每个总体都服从正态分布 B .观察值是相互独立的 C .各总体的方差相等 D .各总体的方差等于0 9.判断下列哪一个不可能是相关系数( ) A .-0.9 B .0 C .0.5 D .1.2 10.用于说明回归方程中拟合优度的统计量主要是( ) A. 相关系数

社会统计学习题 卢淑华

1、P58习题十五 人数户数 0 1 2 3 4 5 6 7 8 417 240 366 222 134 63 39 24 21 (1)试作频率统计表,直方图和折线图 (2)试求均值和标准差 2、P59习题十六 设以下是七十二名离婚者的婚龄的统计(见下表)。 (1)试作频率统计表、直方图和折线图 (2)试求众值、中位值和均值,并做简单讨论。 (3)试求四分互差和标准差。 婚龄人数 1-3 4-6 7-9 10-12 13-15 16-18 19-21 22-24 25-27 28-30 5 10 20 14 9 4 3 2 4 1 3、P59习题十七 设以下是1209名抽烟者年龄的统计(见下表) 年龄人数 21-24 25-34 35-44 45-54 55-64 65岁以上212 273 257 226 152 89 (1)试作频率统计表、直方图和折线图 (2)试求四分互差。 4、P72例10 某年级共有学生一百名,其中来自广东省的有二十五名,来自广西省的有十名,问任抽一名,来自两广的概率是多少?

5、P73例12 根据某市职业代际流动的统计,服务性行业代际向下流动的概率为0.07,静止不流动的概率为0.85,求服务性行业代际向上流动的概率是多少? 6、P75例13 为了呀牛父代文化程度对子代文化程度的影响,某大学统计出学生中父亲具有大学文化程度的占30%,母亲具有大学文化程度的占20%,而父母双方都具有大学文化程度的占10%,问学生中任抽一名,父代至少有一名具有大学文化程度的概率是多少? 7、P75例14 某地对外国旅游者旅游动机进行了调查,发现旅游者处于游览名胜的概率为0.219;处于异族文化的吸引占0.509;而两种动机兼而有之的占0.102.问旅游动机为游览名胜或为异族文化吸引的概率是多少? 8、P76例16 根据统计结果,在自然生育情况下,男婴出生的概率为22/43;女婴出生的概率为21/43.某单位有两名孕妇,问两名孕妇都生男婴的概率是多少?两名孕妇都生女婴的概率是多少?其中一名孕妇生男婴、一名孕妇生女婴的概率是多少? 9、P77例17 某居民楼共十二户,其中直系家庭为两户,问访问两户都是直系家庭的概率是多少? 10、P78例18 某居民楼共二十户,其中直系家庭为两户,问访问第二户才是直系家庭的概率是多少?11、P78例20 设居民楼共有住户一千户,其中核心家庭占60%,问访谈中散户都是核心家庭的概率是多少? 12、P83例22 10人抓阄,其中共有2张球票,问第2个人抓到球票的概率? 13、P85例23 设出口商标为Made in China的产品,其中有50%为上海厂的产品;30%为北京厂得产品;20%为天津厂的产品。设上海厂得正品率为90%;北京厂的正品率为95%,天津厂的正品率为97%。问(1)任抽一件为正品的概率是多少?(2)在抽得产品是正品的情况下,是上海厂的概率是多少? 14、P99例27 已知随机变量的概率分布为 ξ13.4 13.5 13.6 13.7 13.8 P(ξ=Xi)0.05 0.15 0.60 0.15 0.05 求σ2=? 15、P106习题三 某班对全班订报纸情况进行了统计,中订《人民日报》的有45%;订《北京晚报》的有80%;两种报纸都订的有30%,试求以下事件的概率。 (1)只定人民日报的 (2)至少订以上一种报纸的 (3)只订以上一种报纸的 (4)以上两种报纸都不订的 16、P107习题6 根据统计,由出生活到60岁的概率为0.8,活到70岁的概率为0.4,问现年60岁的人活到70岁的概率为多少?

《统计学》作业

《统计学》作业 本课程作业由两部分组成。第一部分为“客观题部分”,由15个选择题组成,每题1分,共15分。第二部分为“主观题部分”,由简答题和论述题组成,共15分。作业总分30分,将作为平时成绩记入课程总成绩。 客观题部分: 一、选择题(每题1分,共15题) 1、对于非专业人员而言,统计学原理可以分为()。 A.调查与实验设计 B.描述统计 C.推断统计 D.多元统计分析2、()是统计总体的特征。 A.差异性 B.大量性 C.同质性 D.不可知性 3、说明总体单位名称的是()。 A.指标 B.标志 C.计量单位 D.标识 4、统计学上一般用()来衡量标志。 A.列名尺度 B.顺序尺度 C.间隔尺度 D.比率尺度 5、统计调查按范围可分为()。 A.典型调查 B.重点调查 C.问卷调查 D.抽样调查 6、下列抽样调查方法中属于概率抽样的有()。 A.配额抽样 B.判断抽样 C.简单随机抽样 D.等距抽样7、缺失值处理的方法有()。 A.就近插值 B.删除对应记录 C.随机插值 D.分类插值8、反映社会经济现象总体规模或水平的指标是()。 A.绝对数 B.相对数 C.相对指标 D.总量指标

9、常用的平均指标有()。 A.调和平均数 B.算术平均数 C.众数 D.中位数 10、数据最大值与最小值之差称为()。 A.内距 B.极差 C.方差 D.绝对差 11、探索性数据分析的主题有()。A.耐抗性B.残差C.重新表达D.图示 12、影响时间数列的因素有()。 A.不规则变动 B.循环变动 C.长期趋势 D.季节变动13、测定趋势变动的方法中,修匀方法主要有( )。 A.时距扩大法 B.移动平均法 C.最小二乘法 D.分段平均法 14、影响抽样误差的因素有()。 A.抽样的组织形式 B.抽样方式 C.目标总体的变异程度 D. 15、相关系数( )。 A.可以为负 B.大于等于零小于等于一 C.可以为任意实数 D.绝对值不大于一 主观题部分: 一、简答题(每题2.5分,共2题) 1、什么是统计指标,统计指标有哪些要素? 2、什么是概率抽样,概率抽样有哪些主要形式? 二、论述题(每题5分,共2题) 1、平均指标有哪些类型? 2、什么是探索性数据分析,试阐述探索性数据分析的四大主题。样本容量

相关文档
最新文档