0社会统计学名词解释

0社会统计学名词解释
0社会统计学名词解释

1.社会统计学是运用统计学的一般原理,对社会各种静态结构和动态趋势进行定量描述或推断的一种专门方法与技术。人们既用它来分析已经发生和正在发生的现象,也用它来估计预测未来可能发生的现象。

2.国势学派:产生于德国,其创始人为康令和阿亨瓦尔。该学派一直以统计学为名,但只用文字记述,不用数字计量,历史上人们将该学派称为“有名无实”学派。

3.政治算术学派: 该学派的创始人为英国人格朗特和威廉?配第。该学派“用数字、重量、尺度来表达自己想说的问题”,虽然没有使用统计学这一名词,但所使用的社会宏观数量对比和分析方法揭示了统计学所要研究的内容,因此历史上人们将这一学派称为“有实无名”学派。马克思对配第评价很高,誉他为“政治经济学之父,在某种程度上也可以说是统计学的创始人”。

4.数理统计学派: 该学派的创始人未比利时人凯特勒,其最大的贡献就是将法国的古典概率论引入统计学,用纯数学的方法对社会现象进行研究。由于把概率论引进统计学,使社会随机现象数量方面的研究提高了准确性。因此,一门兼有数学和统计学双重意义的学科被命名为“数理统计学”。凯特勒也被人称为“现代统计学之父”。

5.大量观察法就是就总体中足够多的单位进行调查和综合分析,用以反映社会总体的数量特征。大量观察法是统计调查阶段的重要方法6.大数规律: 是随机现象出现的基本规律,它的一般意义是:观察过程中每次取得的结果可能不同(因为具有偶然性),但大量重复观察结果的平均值却几乎接近某个确定的数值。

7.描述性统计就是讨论范围仅以搜索的资料本身为限,而不予以扩大。早期的统计都是描述统计。

8.推论性统计主要是依据概率论,研究如何依据有限资料对总体性质作推断,从而使统计的功能大为扩充。是在树立统计学派之后发展起来的,属于比较现代的统计分析方法。

9.样本和(或)样本总体是通过抽样得到的用以推断总体特征的那个“部分”。

10.标志标志是说名总体单位属性或数量特征的名称。

11.虚拟变量当品质标志的变异性用离散变量来表达时,这个变量可称虚拟变量。

12.指标体系指标体系就是一系列有内在联系得统计指标集合体。

13.总体和总体单位总体,就是作为统计研究对象的、由许多具有共性的单位构成的整体。统计总体是统计所要研究的对象的全体,它是由客观存在的、具有某种共同性质的许多个体所构成的整体,也有人称之为母体。构成总体的每一个个体称为总体单位,简称单位,也称为个体。

14.中位数把总体单位某一数量标志的各个数值,按大小顺序排列,位于正中处的变量值即为中位数。

15.众数在一组资料中,出现次数(或频数)呈现“峰”值的那些变量值。

16.调和平均数N个变量值倒数算术平均数的倒数,也称倒数平均数。

17.几何平均数:N个变量值连乘积的N次方根。

18.平均指标:就是表明同质总体在一定条件下某一数量标志所达到的一般水平。

19.显著水平: 能允许犯第一类错误的概率叫做检验的显著性水平,它决定了否定域的大小。

1、统计学统计学是一门阐明如何去采集、整理、显示、描述、分析数据和由数据得出结论的一系列概念、原理、原则、方法和技术的科学,是一门独立的、实用性很强的通用方法论科学。

2、指标和标志标志是说明总体单位属性或特征的名称。指标是说明总体综合数量特征和数量关系的数字资料。

4、统计调查统计调查是根据统计研究的目的和要求、采用科学的方法,有组织有计划的搜集统计资料的工作过程。它是取得统计数据的重要手段。

5、统计绝对数和统计相对数反映总体规模的绝对数量值,在社会经济统计中称为总量指标。统计相对数是两个有联系的指标数值之比,用以反映现象间的联系和对比关系。

6、时期指标和时点指标时期指标是反映总体在一段时期内累计总量的数字资料,是流量。时点指标是反映总体在某一时刻上具有的总量的数字资料,是存量。

7、抽样估计和假设检验抽样估计是指根据所抽取的样本特征来估计总体特征的统计方法。假设检验是先对总体的某一数据提出假设,然后抽取样本,运用样本数据来检验假设成立与否。

8、变量和变异标志的具体表现和指标的具体数值会有差别,这种差别就称为变异。数量标志和指标在统计中称为变量。

9、参数和统计量参数是反映总体特征的一些变量,包括总体平均数、总体方差、总体标准差等。统计量是反映样本特征的一些变量,包括样本平均数、样本方差、样本标准差等。

10、抽样平均误差样本平均数与总体平均数之间的平均离散程度称之为抽样平均误差,简称为抽样误差。重复抽样的抽样平均误差为总体标准差的1/n。

11、抽样极限误差抽样极限误差是指样本统计量和总体参数之间抽样误差的可能范围。我们用样本统计量变动的上限或下限与总体参数的绝对值表示抽样误差的可能范围,称为极限误差或允许误差。

12、重复抽样和不重复抽样重复抽样也称为回置抽样,是从总体中随机抽取一个样本时,每次抽取一个样本单位时都放回的抽样方式。不重复抽样也叫不回置抽样,它是在每次抽取样本单位时都不放回的抽样方式。

13、点估计和区间估计点估计也叫定值估计,就是直接用抽样平均数代替总体平均数,用抽样成数代替总体成数。区间估计是在一定概率保证下,用样本统计量和抽样平均误差去推断总体参数的可能范围的估计方法。

14、统计指数广义上来说,它是表明社会经济现象的数量对比关系的相对指标。狭义上来说,它是反映不能直接相加对比的复杂总体综合变动的动态相对数。

15、综合法总指数凡是一个总量指标可以分解为两个或两个以上的因素指标时,将其中一个或一个以上的因素指标固定下来,仅观察另一个因素指标的变动程度,这样的总指数就叫综合法指数。

16、平均法总指数平均法总指数是通过对个体指数进行加权平均而求得的反映不能直接加总的多个个体所组成的复杂总体综合变动的指数。分为两种:加权算术平均法总指数和加权调和平均法总指数。

17、时间数列时间数列是指同一观察现象的观察值按其发生的时间先后顺序排列而形成的数列。时间数列也称为时间序列和动态数列。

18、相关分析和回归分析相关分析是一种分析几个变量之间是否存在关系以及它们的关系如何的统计方法。回归分析是指对具有显著相关关系的现象,根据其关系形态,选择一合适的数学模式,用来近似地表达变量见的平均变动关系的统计分析的方法。

19、时间序列的最初水平、中间水平和最末水平时间数列中第一个观察值称为最处水平,最后一个观察值称为最末水平,其余各个观察值称为中间水平。

20、调查对象、调查单位和填报单位调查对象是所要研究对象的总体。调查单位是所要研究对象的个体。填报单位是提交调查资料的单位。调查单位和填报单位有时相同,有时不同。

21、环比发展速度和定基发展速度环比发展速度是以报告期水平与其前一期水平对比,所得到的动态相对数。表明现象逐期的发展变动程度。定基发展速度是用报告期水平与某一固定基期水平(通常为最初水平)对比,所得到的动态相对数。它表明所观察现象在一段时期内发展的总速度。

22、经常性调查与一次性调查的区别两者的区分是以调查单位的登记在时间上是否具有连续性为依据的。经常性调查的对象本身具有连续不断变化的特点。商品零售额。一次性调查的对象是时点现象。如人口普查。

1.普查:是专门组织的一次性的全面调查。它有两个主要特点,是一次性调查,是专门组织的全面调查;

2.统计整理:是根据统计研究的任务与要求,对统计调查阶段所搜集到的大量原始资料进行加工汇总;

3.标志变异指标:离散趋势表示总体中各单位标志值差别程度的大小、分布均匀性;

4.相关关系:指变量之间客观存在的不严格的非确定性的数量依存关系;

5.国内生产总值:简称GDP是指按市场价格计算的一个国家或地区所有常住单位在一定时期内生产活动的最终成果;

6.流量:是指某一时间内发生的量,是按一定时期算出来的数量,具有时间量纲;

7.原始资料:也称初级资料是指直接向总体单位搜集的,尚待汇总整理,需要由个体过渡到总体的统计资料;

8.分配数列:在统计分组的基础上,将总体的所有单位按组归类整理,并按一定顺序排列,形成总体单位在各组间的分布;

9.总量指标:是反映社会经济现象在一定时间、地点条件下的总规模、总水平的统计指标;

10.时间序列:指将某一系列统计指标在不同时间上的数值,按时间的先后顺序排列起来而形成的数列;

11.综合指数:是两个总量指标对比形成的指数,在总量指标中包含有两个或两个以上的因素,将其中被研究因素以外的一个或一个以上的因素固定下来,仅观察被研究因素的变动,这样编制的指数称为综合指数;

12.样本:是指从总体中随机抽取出来并且代表该总体的那部分单位所构成的全体;

13.相关关系:是指变量之间客观存在的不严格的非确定性的数量依存关系;

14.重点调查:是在调查对象范围内选择部分重点调查单位搜集统计资料的非全面调查;

15.典型调查:就是在调查对象中有意识地选取若干具有典型意义的或有代表性的单位进行的非全面调查;

16.统计调查:是根据统计研究的任务与要求,对统计调查阶段所搜集到的大量原始资料进行加工汇总,使其系统化、条理化、科学化,以得出反映事物总体综合资料的工作过程;

17.相对指标:也称相对数,就是将两个有联系指标的数值进行对比的结果;

18.时期数列:是由时期指标形成的,数列中的每个指标数值都是反映某种社会经济现象在一段时期内发展过程的总量;

19.随机原则:就是从总体中抽取样本单位时,不受人的主观因素的影响,保证每个总体单位都以相同的机会被抽中;

20.单相关:也称为一元相关,是指两个变量之间的相关关系;

21.国民经济:是一个国家或地区全部经济活动的总和,是一个纵横交错、极其复杂的网络般经济活动的有机整体;

22.统计总体:是指客观存在的、在同质基础上结合起来的许多个别单位的整体;

23.一次性调查:是指间隔一段较长的时间对事物的变化进行一次调查,用以了解事物在一定时点上的状态;

24.统计分组:就是根据统计研究的目的和要求以及总体的内在差异,按照某一标志将社会经济现象总体区分为若干部分或若干组的统计整理方法;

25.强度相对数:是两个性质不同但是存在一定联系的指标的对比,用来反映事物的强度、密度和普遍程度的指标;

26.时点数列:是由时点指标形成的,数列中每一个指标数值都是反映现象在某一时间点上所达到的状态或水平;

27.定基指数:是指在一个指数数列中,按照某一固定的基期所编制的指数;

28.代表性误差:是指由于样本结构与总体结构不一致而使样本不能完全代表总体,从而样本指标估计总体指标时所产生的误差;

29.简单随机抽样:这是按随机原则从总体N个单位中直接抽取n个单位做样本,使总体中每一个单位都有同等的可能性被抽中;

30.简单相关表:是资料未经分组的相关表,它是相关因素的标志值按照大小顺序并配合结果标志值一一对应而平行排列起来的统计表;

31.常住单位:是指在我国的经济领土上具有经济利益中心的经济单位;

32.报告法:就是报告单位利用原始记录和核算资料作基础,向有关单位提供统计资料;

33.单项式分组:就是在变量数值不多,变动幅度不大的情况下,用一个变量值来代表一个组的分组方法;

34.相对数时间序列:是将一系列同类相对指标值按时间先后顺序排列而形成的数列;

35.季节变动:是指某些社会经济现象受到季节交替、生产条件和自然因素的影响,而形成每年重复出现的有规律性的周期变动。

36.环比指数:是指在一个指数数列中,各期指数都以它前一期作为基期所编制的指数;

37.随机误差:是指在遵守了随机原则的前提下,由于变量的随机波动而使样本结构异于总体结构而产生的估计误差;

38.平均指标:是指将总体单位某一变量值的具体差异抽象化,用以反映总体在具体条件下的一般水平;

39.统计指标体系:是指由一系列相互联系的统计指标组成的有机整体;

40.抽样调查:一种非全面调查,它是在全部调查单位中按照随机原则抽取一部分单位进行调查,根据调查的结果推断总体的一种调查方法;41.货币单位:就是以货币作为价值尺度来衡量物质财富或劳动成果的一种价值计量单位;

42.平均数时间序列:是将一系列平均指标值按时间先后顺序排列而形成的数列;

43.平均指数:是计算总指数的另一种形式,它是在个体指数的基础上计算总指数的;

44.资本形成:是指各机构单位通过经济交易获得或处理生产资产的行为;

45.因素分析法:它是利用指数体系,对现象的综合变动从数量上分析其受各因素影响的一种分析方法。

46.资本转移:是指在无对应回报情况下,一个机构单位向另一个机构单位提供了一笔资产(现金或实物)或取消了另一个机构单位的负债而形成的转移活动。

47.调和平均数:又称“倒数平均数”,是先计算变量值的倒数,然后求倒数的算术平均数,最后对这个倒数平均数求倒数所得的数。48.等距抽样:又称机械抽样或系统抽样。它是把总体单位按一定的标志排队,然后按相等的距离抽取样本单位。

49.移动平均法:是采用逐项移动,边移动边平均的方法计算一系列移动的序列平时数,形成一个新的序时平均数时间序列,在这个新的时间数列中,原数列中受偶然因素的影响而引起的波动被消弱,从而反映出现象的总趋势的一种方法。

50.简单相关系数:在线性相关的条件下说明两个变量之间的相关关系密切程度和方向的统计分析指标。

51.生产法:是从生产过程中创造的货物和服务价值入手,剔除生产过程中投入的中间货物和服务价值,得到增加值的一种方法。52.区间估计:在样本数据的基础上给出一个随机区间,使该区间以一个给定的概率包含被估计的指标。

53.相关图:又称散点图,它是用直角坐标系的水平轴代表变量X,纵轴代表变量Y,将两变量相对应的成对数据用坐标点的形式描绘出来,用以表明两个变量之间相关关系的图形。

54 .统计指数:简称指数,有广义和狭义之分。前者指用来测定一个变量对于一个特定的变量值大小的相对数;后者指因不同度量而不能直接加总的多种事物在不同时间对比的综合相对数。

55.综合指标法:运用各种统计综合指标来反映和研究社会现象总体的一般数量特征和数量关系的研究方法。

56.一元线性回归模型:对于只涉及一个自变量的一元线性回归模型可表示为Y=a+Bx+ε。在一元线性回归模型中,Y是X的线性函数加上随机误差。a+Bx反映了由于X的变化引起的Y的线性变化;随机误差项ε反映了除X外其它影响Y的随即因素。

57.定基发展速度:是指以报告期水平与某一固定时期水平之比计算的发展速度,它用来说明报告期水平已经发展到了固定时期水平的百分之几,表明这种现象在较长时期内总的发展速度。

58.存量:存量是指某一时点上测算出来的量,表示现象在某一点的状态,不具有时间量纲。

59.统计总体:是指客观存在的、在同质基础上结合起来的许多个别单位的整体。

60.总体单位:是指构成总体的各个单位,是统计所研究的属性和特征的原始、直接、具体的承担者。

61.统计标志:简称为标志,它是用来说明总体单位所具有的属性或特征的名称。

62.统计指标:简称为指标,是综合反映统计总体数量特征的名称。一个完整的统计指标包括指标名称和指标数值两部分。

63.品质标志:是说明总体单位属性的名称,其标志表现一般用文字来描述。数量标志是用来说明总体单位量的特征,可以用数字来表示的。

64.数量指标:是说明总体规模大小、数量多少的总量指标,一般用绝对数表示。

65.质量指标:是说明总体质量的指标,反映现象的相对水平或工作质量,一般用相对数或平均数表示。

66.统计指标体系:是由一系列相互联系的统计指标组成的有机整体。它能从多个不同的方面综合反映总体现象的状况和发展变化过程,反映社会现象的因果关系、依存关系和平衡关系等。

67.变量:是说明现象某种特征的概念或名称。

68.分类数据:是对事物进行分类的结果,数据表现为类别,是用文字来表述的。

69.顺序数据:是对事物之间等级差别或顺序差别的一种测度。

70.数值型数据:是按照数字尺度测量的观测值,其计量结果表现为具体的数值。

72统计调查:是统计工作过程的第一阶段,即根据研究的目的或任务,采用适当的、科学的调查方法,系统地搜集有关研究对象的各项资料的过程。

73统计资料:是反映研究对象特征,以数字、文字为主要形式的数据资料。统计资料一般分为原始资料和次级资料。

74.重点调查:是选择部分重点调查单位搜集统计资料的非全面调查。

75.抽样调查:是按照随机原则抽取一部分单位进行调查,根据调查的结果推断总体的一种调查方法。

76.统计报表:是按照国家或上级部门统一规定的表式、统一的指标、统一的报送程序和报送时间,自下而上逐级提供基本统计资料的一种调查方式。特点:统一,时效,全面,可靠。

77.统计报表制度:是基层单位和主管机关按照统一规定的表格形式和报送程序,定期向上级机关和国家报告自身基本情况、计划执行情况和重要经济活动情况及其状况的一种统计调查方法。

78.重点单位:是指在全部总体中虽然数目不多,所占比重不大,但就调查的标志值来说,却在总量中占很大的比重的那些单位。

79.经常调查:是随着调查对象的变化,连续不断的进行调查登记,以了解事物在一定时期内发生、发展的全部过程的调查方式。

80.调查对象:是指需要进行研究的总体范围,即调查总体。

81.调查时间:是指调查资料所属的时点或时期。

82.全面调查是对构成调查对象总体的所有单位一一进行调查的调查方式。

83.时期指标:是反映了在某一段时间内发展累计的总数量的总量指标。

84.时点指标:是反映了某一时刻瞬间的总量的总量指标。

85.统计分组:就是根据统计研究的目的和要求以及总体的内在差异,按照某一标志讲社会经济现象总体区分为若干部分或若干组的统计整理方法。

86.简单分组:就是对被研究现象总体只按一个标志进行的分组。

87.复合分组:就是对同一总体选择两个或两个以上标志进行的分组。

88.组中值:指本组的上限与下限之间的中点值。它代表组内所有单位的标准值的平均水平。

89.次数分布:是指在统计分组的基础上,将总体的所有单位按组归类整理,并按一定顺序排列,形成总体单位在各组间的分布。

90.总体:按数量标志分组就形成变量分配数列,简称变量数列。

91.统计表就是用来表现统计资料汇总整理结果的汇总表。

92.累计次数:是指数列中高于或低于某一变量值的次数总和。

93.强度相对指标:是两个性质不同但是存在一定联系的指标的对比,用来反映事物的强度、密度和普遍程度的指标。

94.众数:是指总体中出现次数最多的标志值。

95.平均发展水平:将不同时期的发展水平加以平均而得的平均数叫平均发展水平,在统计上又称为序时平均数或动态平均数。

86.逐期增长量:是指报告期水平与前一期水平之差,它表明本期比上一期增长的绝对数量。

87.定期发展速度:是指以报告期发展水平与上年同期发展水平之比。

88.长期趋势:是指某种现象在一个相当长的时期内持续向上或向下发展变动趋势。

89.指数:广义地讲,是指用来测定一个变量对于一个特定变量值大小的相对数;狭义地讲,指数是值因不同度量而不能直接加总的多种事物在不同时间对比的综合相对数。

90.综合指数:是指两个总量指标对比形成的指数,在总量指标中包含有两个或两个以上的因素,将其中被研究因素以外的一个或一个以上的因素固定下来,仅观察被研究因素的变动。

91.同度量因素:是把不能直接相加的指标过渡到可以相加的指标的因素。

92.指数体系:广义上说,指数体系是指由若干个经济上具有一定联系的指数所构成的一个整体。狭义上说:指数体系是指不仅经济上具有一定的联系,而且还具有一定的数量对等关系的三个或三个以上的指数所构成的一个整体。

93.因素分析法:就是利用指数体系,对现象的综合变动从数量上分析其受各因素影响的一种分析方法。

94.抽样推断法:包括抽样调查和抽样推断两部分.抽样调查是在全部调查单位中按照随机原则抽取一部分单位进行调查,观察获得各项数据.而抽样推断则是进一步运用概率论和数理统计的原理,根据抽样调查所取得的数据,对研究对象即总体的数量特征作出具有一定可靠程度的估计和判断,达到对研究对象总体的认识。

95.抽样分布:就是样本统计量的概率分布,它是对总体参数作区间估计的前提条件。

96.抽样平均误差:是样本统计量或样本指标的标准差,表示抽样估计的平均误差。

97.区间估计:就是在样本数据的基础上给出一个随机区间,使该地区以一个给定的概率包含被估计总体参数或总体指标。

98.置信度或概率保证度:是调研者给定的,以样本指标为中心,TU为宽度的随机区间包含总体指标的概率。

99.概率度表示标准正态分布随机变量以1-A的概率的对称取值区间的宽度,与置信度意义对应.

100.抽样极限误差是在一定的估计可靠性下,区间估计的最大误差。

101.复相关:也称多元相关,是指三个或三个以上变量之间的相关关系。

102.偏相关:在多元相关中,当研究因变量与两个以上自变量的相关时,如果把其余的自变量看做不变,只研究其中某一个自变量与因变

量之间的相关关系。

103.相关系数:即简单相关系数,是在线性相关的条件下说明两个变量之间相关关系密切程度和方向的统计分析指标。

104.斯皮尔曼等级相关系数:把有关联的数量标志或品质标志的具体表现按等级次序排列,形成X和Y这两个序列数列,再测定这两个序列数列之间的相关程度,用这种方法计算的相关指标。

105.回归系数:在数学上称为斜率,它代表自变量X每变动一个单位时因变量Y平均变动的单位数。

106.判定系数:又称可决系数,是对估计的回归直线拟合优度进行度量的重要指标,它表明因变量Y的方差可由自变量X的方差所解释的程度,或表明Y的方差中由X原因所引起的程度。

107.估计标准误差:是指因变量的实际值Y与估计值YC的平均离差。

108.常住单位:在我国的经济领土上具有经济利益中心的经济单位。

109.机构单位:是指有权拥有资产和承担负债,能够独立地从事经济活动并与其他实体进行交易的经济实体.

110.产业活动单位:是指在一个地点,从事一种或主要从事一种类型生产活动并具有收入和支持会计核算资料的生产单位。

111.生产账户:反映国内机构部门在核算期内通过生产过程所创造的价值以及与此价值对应的收入形态。

112.国民生产总值:是指市场价格计算的一个国家所有常住单位在一定时期内收入初次分配的最终结果。

113.直接消耗系数:是指在生产经营过程中第J部门的单位总产出所直接消耗的第I部门产品的数量。

114.收入初次分配:是指按照各生产要素所有者和政府对生产的参与与程度和贡献程度,对生产成果——增加值所进行的直接分配。115.最终消费:是指常住单位在一定时期内对于货物和服务的全部最终消费支出。

116.统计报表:是指按照国家或上级部门统一规定的表式、统一的指标、统一的报送程序和报送时间,自下而上逐期提供基本统计资料的一种调查方式。

117.中位数:总体各单位标志值按大小或者一定顺序进行排序后,处于中间位置的那个标志值就是中位数。

118.发展水平:发展水平是时间序列中各个不同时期的统计指标数值以反映现象在各个不同时期发展达到的水平,它是计算各种动态分析指标的基础。

119.大数定律:表明随机事件在大量的重复取值或重复试验中能呈现某种统计规律性。

120.中心极限定理的含义:表明若总体分布未知,只要样本容量足够大,则样本平均数或样本比率近似服从正态分布。

121.点估计:就是以样本统计量直接估计总体参数。

122.区间估计:就是在样本数据的基础上给出一个随机区间,使该区间以一个给定的概率包含被估计的总体参数或总体指标。

123.回归分析:是在相关分析的基础上,对具体有相关关系的两个或两个以上变量数量变化的一般关系进行测定,确定一个合适的数字表达式,以便于对因变量进行估计或预测的一种统计分析方法。

124.国民经济:是一个国家或地区全部经济活动的总和,是一个纵横交错,极其复杂的网络般经济活动的有机整体。

125.投入产出核算:又称投入产出分析,是指主要利用投入产出表来反映部门间生产过程中所形成的技术经济联系和各种比例关系。126.资金流量核算:是指以分配和社会资金运动为对象的核算。

127.资金负债核算:是我国国民经济核算体系的重要组成部分,它是以一个国家或地区经济资产与负债为对象的核算。

128.国际收支核算:又称对外交易核算,它是从国外的角度来反映常住单位与所有非常住单位之间一切经济交往的核算,是国民经济核算体系的重要组成部分。

1、指标和标志的区别与联系

两者的区别:(1)指标是反映总体特征的,而标志是反映总体单位特征的。

(2)标志可以用文字来反映,也可以用数字来表示。而指标都是用数量来表示的。

两者的联系:(1)指标是指标的汇总和综合。(2)根据研究目的的不同,两者有时可以互换。

2、统计总体的特点

(1)同质性。即总体单位都必须具有某些共同的品质标志属性或数量标志属性。这是构成总体的前提。

(2)大量性。即构成总体的总体单位数目要足够多。这是形成总体的充分条件。

(3)差异性。即总体单位必须具有一个或若干个可变的品质标志或数量标志。这是形成总体的必要条件。

3、重点调查、抽样调查、典型调查的区别与联系

联系:都是非全面调查,调查对象都是总体中的一部分区别:

4、统计绝对数的分类

(1)按其反映总体内容的不同分:总体单位总量和总体标志总量。

(2)按其反映不同的时间状况不同分:时期指标和时点指标。

(3)按其采用的计量单位的不同分:实物指标、价值指标和劳动指标。

5、时期指标和时点指标的区别

时期指标:(1)连续记数,其值可以相加(2)具有时间长度,与时间长短有关(3)是流量

时点指标:(1)间断记数,其值不可以相加,相加无实际意义(2)不具有时间长度,与时间长短无关(3)是存量

6、抽样技术的特点

(1)在调查单位的抽取上,遵循随机原则。

(2)以样本数据估计总体数据。

(3)以概率估计的方法对总体进行估计。

(4)在推断理论上,以大数定律和中心极限定理为基础。

(5)抽样误差可以计算并加以控制。

7、抽样误差的种类

(1)登记性误差。又称调查误差或工作性误差,是完全可以避免的。

(2)代表性误差。它又可以分为系统性误差和随机性误差。系统性误差是破坏随机原则造成的偏差,也是可以避免的。随机性误差包括抽样个体误差和抽样平均误差。抽样个体误差不确定,难以计算。抽样平均误差无法避免,但可以计算和控制。

8、影响抽样误差的因素

(1)总体总变量值X间的差异大小。差异越大,误差越大。

(2)样本容量。样本容量越大,抽样误差越小。

(3)抽样方法。重复抽样误差一般大于不重复抽样误差。

(4)抽样调查的组织形式。不同的组织形式,误差不同。

9、统计相对数的种类

(1)计划完成相对数。是实际完成数与计划数的比值。

(2)结构相对数。是总体各组成部分数值与总体总数值的比值。

(3)比例相对数。总体中某一组的指标数值与总体中另一组的指标数值的比值。

(4)动态相对数。某现象报告期数值与同一现象基期数值的比值。

(5)比较相对数。某类现象的数值与不同空间同类现象的数值的比值。

(6)强度相对数。某一现象数值与另一有联系但性质不同的现象数值的比值。

10、强度相对数与平均数的区别

(1)概念含义不同。平均数=总体标志总量/总体单位总量。强度相对数是某一现象数值与另一有联系但性质不同的现象数值的比值。(2)作用不同。强度相对数是反映某现象在另一现象中的强度、密度或普遍程度,反映现象间依存性的比例关系。而平均数是反映总体各单位的某一变量的各个变量值一般水平的代表值。

(3)表现形式不同。强度相对数的单位多是复合单位,由分子、分母的指标单位复合而成。平均数则是和标志总量单位的一致。

(4)强度相对数分子、分母可以互换,平均数的分子、分母不可以互换,互换无意义。

11、统计指数的种类

(1)按反映对象的范围不同分:个体指数、类指数和总指数。

(2)按反映统计指标的不同内容分:质量指标指数和数量指标指数。

(3)按所采用的基期不同分:定基指数和环比指数。

(4)按表现形式不同分:综合法总指数和平均法总指数。

12、相关关系的种类

(1)从涉及的因素多少来分,可分为单相关和复相关。只研究两个因素之间的相关关系叫单相关。两个以上的为复相关。

(2)从相关关系所呈现形态来分,可分为直线相关和曲线相关。

(3)直线单相关按呈现相关关系的方向划分,又可分为正相关和负相关。正相关表明两个因素的变动方向是相同的,负相关表明两个因素的变动方向是不同的。

广东财经社会统计学期末考试试卷(A卷)

广东财经社会统计学期末考试试卷(A卷) 一、单项选择题(请将正确选项的序号填在答题纸相应的位置。) 1.社会统计中的变量一般分四个层次,其中最高层次的变量是 D 。 A、定类变量 B、定序变量 C、定距变量 D、定比变量 2.标准正态分布的均值一定 C 。 A、等于1 B、等于-1 C、等于0 D、不等于0 3.计算中位值时,对于未分组资料,先把原始资料按大小顺序排列成数列,然后用公式 D 确定中位值所在位置。 A、n/2 B、(n-1)/2 C、(n+2)/2 D、(n+1)/2 4.下列统计指标中,对极端值的变化最不敏感的是 A 。 A、众值 B、中位值 C、四分位差 D、均值 5.如果原假设是总体参数不小于某一数值,即大于和等于某一数值,应采用的检验是。 A、两端检验 B、右端检验 C、左端检验 D、无法判断 6.在一个右偏的分布中,大于均值的数据个数将。 A、不到一半 B、等于一半 C、超过一半 D、视情况而定 7.下列关于“回归分析和相关分析的关系”的说法中不正确的是。 A、回归分析可用于估计和预测 B、相关分析是研究变量之间的相互依存关系的密切程度 C、相关分析不需区分自变量和因变量 D、回归分析是相关分析的基础 8.假定男性总是与比自己年轻3岁的女性结婚,那么夫妻年龄之间的积距相关系数r为。 A、-1 < r< 0 B、0 < r< 1 C、r = 1 D、r = -1 9.“4、6、8、10、12、26”这组数据的集中趋势宜用测量。 A、众值 B、中位值 C、均值 D、平均差 10.某校期末考试,全校语文平均成绩为80分,标准差为4.5分,数学平均成绩为87分,标准差为9.5分。某学生语文得了83分,数学得了92分,从相对名次的角度看,该生的成绩考得更好。 A、数学 B、语文 C、两门课程一样 D、无法判断 三、判断题(请在答题纸相应位置打√或?。) 1.无论分布曲线是正偏还是负偏,中位值都居于均值和众值之间。 2.一组数据的均值代表了该组数据中大多数的数据。 3.对于连续型随机变量,讨论某一点取值的概率是没有意义的。 4.异众比率越大,各变量值相对于众值越离散,众值的代表性越好。 5.只要样本量足够大,则不论总体分布如何,样本均值的抽样分布都服从正态分布。 6.检验均值差异时,独立样本采用“差的均值”、关联样本采用“均值的差”进行检验。 7.在显著性水平既定的情况下,一端检验比两端检验更容易拒绝H0。 8.不管相关关系表现形式如何,当r=1时,变量X和变量Y都是完全相关;当r=0时,变量X 和变量Y都是完全不相关。 9.方差分析就其内容来说,是分析或检验总体间的均值是否存在差异。 10.纳伪的概率β可以根据原假设H0所设的分布计算出来。 1

统计学名词解释

1、统计学 统计学是一门阐明如何去采集、整理、显示、描述、分析数据和由数据得出结论的一系列概念、原理、原则、方法和技术的科学,是一门独立的、实用性很强的通用方法论科学。 2、指标和标志 标志是说明总体单位属性或特征的名称。指标是说明总体综合数量特征和数量关系的数字资料。 3、总体、样本和单位 统计总体是统计所要研究的对象的全体,它是由客观存在的、具有某种共同性质的许多个体所构成的整体。简称总体。构成总体的个体则称为总体单位,简称单位。样本是从总体中抽取的一部分单位。 4、统计调查 统计调查是根据统计研究的目的和要求、采用科学的方法,有组织有计划的搜集统计资料的工作过程。它是取得统计数据的重要手段。 5、统计绝对数和统计相对数 反映总体规模的绝对数量值,在社会经济统计中称为总量指标。统计相对数是两个有联系的指标数值之比,用以反映现象间的联系和对比关系。 6、时期指标和时点指标 时期指标是反映总体在一段时期内累计总量的数字资料,是流量。时点指标是反映总体在某一时刻上具有的总量的数字资料,是存量。 7、抽样估计和假设检验 抽样估计是指根据所抽取的样本特征来估计总体特征的统计方法。假设检验是先对总体的某一数据提出假设,然后抽取样本,运用样本数据来检验假设成立与否。 8、变量和变异 标志的具体表现和指标的具体数值会有差别,这种差别就称为变异。数量标志和指标在统计中称为变量。 9、参数和统计量 参数是反映总体特征的一些变量,包括总体平均数、总体方差、总体标准差等。统计量是反映样本特征的一些变量,包括样本平均数、样本方差、样本标准差等。 10、抽样平均误差 样本平均数与总体平均数之间的平均离散程度称之为抽样平均误差,简称为抽样误差。重复抽样的抽样平均误差为总体标准差的1/n。 11、抽样极限误差 抽样极限误差是指样本统计量和总体参数之间抽样误差的可能范围。我们用样本统计量变动的上限或下限与总体参数的绝对值表示抽样误差的可能范围,称为极限误差或允许误差。 12、重复抽样和不重复抽样 重复抽样也称为回置抽样,是从总体中随机抽取一个样本时,每次抽取一个样本单位时都放回的抽样方式。不重复抽样也叫不回置抽样,它是在每次抽取样本单位时都不放回的抽样方式。13、点估计和区间估计 点估计也叫定值估计,就是直接用抽样平均数代替总体平均数,用抽样成数代替总体成数。区间估计是在一定概率保证下,用样本统计量和抽样平均误差去推断总体参数的可能范围的估计方法。 14、统计指数 广义上来说,它是表明社会经济现象的数量对比关系的相对指标。狭义上来说,它是反映不能直接相加对比的复杂总体综合变动的动态相对数。 15、综合法总指数 凡是一个总量指标可以分解为两个或两个以上的因素指标时,将其中一个或一个以上的因素指

(完整版)社会统计学试卷A及答案解析

级专业2010学年第 1 学期《社会统计学》试卷 A 姓名:学号: (□开卷□闭卷) 一、选择题:2*10=20分 1、要了解400个学生的学习情况,则总体单位是( B ) 。 A 400个学生 B 每一个学生 C 400个学生的成绩 D 每一个学生的成绩 2、只与一个自由度有关的是( A ) χ分布 B 超几何分布C 泊松分布 D F分布 A 2 3、将总体按与研究有关的标志进行分组,然后再随机地从各组中抽选单位组成样本。这种 抽样方式叫( B )。 A 简单随机抽样 B 类型抽样 C 等距抽样 D 整群抽样。 4、在方差分析中,自变量是(A )。 A 定类变量 B 定序变量 C 定距变量 D 定比变量 5、某城市男性青年27岁结婚的人最多,该城市男性青年结婚平均年龄为26.2岁,则该城 市男性青年结婚的年龄分布为(B)。 A.正偏B.负偏 C.对称D.不能作出结论 6、分析统计资料,可能不存在的平均指标是( A )。 A 众数 B 算术平均数 C 中位数 D 几何平均数 7、在一个左偏的分布中,小于平均数的数据个数将( C )。 A 超过一半 B 等于一半 C 不到一半 D 视情况而定 8、若P(A)=0.2,P(B)=0.6,P(A/B)=0.4,则) P I=( D )。 A (B A 0.8 B 0.08 C 0.12 D 0.24。 9、关于学生t分布,下面哪种说法不正确(B )。 A 要求随机样本 B 适用于任何形式的总体分布

C 可用于小样本 D 可用样本标准差S 代替总体标准差σ 10、对于大样本双侧检验,如果根据显著性水平查正态分布表得 Z α/2=1.96,则当零假 设被否定时,犯第一类错误的概率是( C )。 A 20% B 10% C 5% D .1% 二、判断题:2*10=20分 1、所有的统计指标都是变量。 ( 对 ) 2、统计所研究的对象就是社会经济现象的数量方面。 (错 ) 3、随机变量在相同的条件下进行观测,其可能实现的值不止一个。 (对 ) 4、在社会现象中,即使相同的意识作用也完全可能有不确定的结果,这就提供了概率论应用的可能性。 ( 对 ) 5、成功次数的期望值λ是决定泊松分布的关键因素。 ( 对 ) 6、进行区间估计,置信水平总是预先给定的。 ( 对 ) 7、可以对置信水平作如下解释:“总体参数落在置信区间的概率是(1-α)”。(错 ) 8、将收集到得的数据分组,组数越多,丧失的信息越多。 (错 ) 9、N 个变量值连乘积的平方根,即为几何平均数。 (错 ) 10、当样本容量n 无限增大时,样本均值与总体均值的绝对离差小于任意正数的概率趋于零。 (错 ) 三、简答题:5*7=35分 1、大数规律 大数规律是随机现象出现的基本规律,它的一般意义是:观察过程中每次取得的结果可能不同(因为具有偶然性),但大量重复观察结果的平均值却几乎接近某个确定的数值。 2、配对样本 所谓配对样本,指只有一个总体,双样本是由于样本中的个体两两匹配成对而产生的。 3、消减误差比例 变量间的相关程度,可以用不知Y 与X 有关系时预测Y 的误差0E ,减去知道Y 与X 有关 系时预测Y 的误差1E ,再将其化为比例来度量。将削减误差比例记为PRE 。 4、同分对 如果在X 序列中,我们观察到i j X =X (此时Y 序列中无i j Y =Y ),则这个配对仅是X 方向而非Y 方向的同分对;如果在Y 序列中,我们观察到i j Y =Y (此时X 序列中无i j X =X ),则这个配对仅是Y 方向而非X 方向的同分对;我们观察到i j X =X ,也观察到i j Y =Y ,则称这个配对为X 与Y 同分对。 5、什么是分层抽样? 分层抽样也叫类型抽样,就是先将总体按某种特征或属性分若干类别或层次,再按照一定比 例在各个子类别或层次中随机抽取,最后将各抽取的单位合并成样本。 6、简述回归分析和相关分析之间的密切联系。 一般说来,只有当两个变量之间存在着较高程度的相关关系时,回归分析才变得有意义和有价值。相关程度越高,回归预测越准确。因此,往往先进行相关分析,然后才选用有明显相关关系的变量作回归分析。与此同时,相关关系往往要通过回归分析才能阐释清楚,例如皮尔逊相关系数的PRE 性质。回归分析具有推理的性质,而相关分析从本质上讲只是对客观事物的一种描述,知其然而不知其所以然。因而从分析层次上讲,回归分析更深刻一些。 7、P 值决策与统计量的比较 P 值是被称为观察到的(或实测的)显著性水平。用P 值进行检验比根据统计量检验提供更多

社会统计学复习题(有答案)复习课程

社会统计学复习题(有 答案)

社会统计学课程期末复习题 一、填空题(计算结果一般保留两位小数) 1、第五次人口普查南京市和上海市的人口总数之比为 比较 相对指标;某企业男女职工人数之比为 比例 相对指标;某产品的废品率为 结构 相对指标;某地区福利机构网点密度为 强度 相对指标。 2、各变量值与其算术平均数离差之和为 零 ;各变量值与其算术平均数离差的平方和为 最小值 。 3、在回归分析中,各实际观测值y 与估计值y ?的离差平方和称为 剩余 变差。 4、平均增长速度= 平均发展速度 —1(或100%)。 5、 正J 形 反J 形 曲线的特征是变量值分布的次数随变量值的增大而逐步增多; 曲线的特征是变量值分布的次数随变量值的增大而逐步减少。 6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况,这种调查方式属于 重点 调查。 7、要了解某市大学多媒体教学设备情况,则总体是 该市大学中的全部多媒体教学设备 ;总体单位是 该市大学中的每一套多媒体教学设备; 。 8、若某厂计划规定A 产品单位成本较上年降低6%,实际降低了7%,则A 产品单位成本计划超额完成程度为 100%7% A 100% 1.06%100%6% -=- =-产品单位成本计划超额完成程度 ;若某厂计划规定B 产 品产量较上年增长5%,实际增长了10%,则B 产品产量计划超额完成程度为 100%10% 100% 4.76%100%5% += -=+B 产品产量计划超额完成程度 。 9、按照标志表现划分,学生的民族、性别、籍贯属于 品质 标志;学生的体重、年龄、成绩属于 数量 标志。

社会统计学的名词解释

社会统计学的名词解释 非参数检验:泛指“对分布类型已知的总体进行参数检验”之外的所有检验方法。符号检验:181页 配对符号秩检验:183页 秩和检验方法:把两个样本混合起来,从小到大进行编号;分别计算两个样本的秩和;;计算检验统计量U;如果计算出的U只小于或等于从附表10中查处的临界值,则零假设被拒绝。 游程检验:把样本1和样本2混合起来,按数值从小到大编号;点算游程数目,以混合样本中游程数目r为检验统计量。 确定性关系:一个变量值确定后,另一个变量值也就完全确定了。 非确定性关系:给定了一个变量值,另一个变量值还可以在一定的范围内变化。相关系数r:这一指标用来度量相关关系程度或强度。就线性相关来说,当\r\=1时,表示完全相关;当0<\r\<1时,表示不完全相关;当\r\=0时,表示无相关或零相关。 判断两个变量有因果联系的条件:(1)两个变量有共变关系;(2)两个变量之间的关系不是有其他因素形成的;(3)两个变量的产生和变化有明确的时间顺序。 列联表:按品质标志吧两个变量的频数分布进行交互分类,由于表内的每一个频

数都需同时满足两个变量的要求,所以列联表又称条件频数表。 消减误差比例(PRE)=(原来的误差—后来的误差)\原来的误差 Gamma系数:适用于测量两对称的定序变项的相关系数。 积差系数:两个定距变量之间的相关测量,最常用的就是积差系数。英国统计学家皮尔逊用积差方法推导出来的,所以也称皮尔逊相关系数,用符号r表示。回归:有一种力量使子辈个体身高趋向父辈平均身高,高尔顿把这种趋向中心的现象称之为回归。 拟合优度检验:检验总体是否具有正态或其他分部形式的非参数统计检验。 方差分析:他可以检验多个总体均值是否存在差异的统计检验方法。 时间数列:是某一指标的数值按时间按先后顺序排列而成的一个序列,也称动态数列。一般有两个基本要素构成:被研究对象所属的时间和反映该现象在各个时间上的统计指标数值。 增长量:总量指标报告期水平和基期水平之差,表明该指标在一定时期内增加和减少的绝对数量。(逐期增长量和累计增长量) 发展速度:反映社会现象发展程度的动态相对指标,即时间相对数。发展速度时报告期发展水平除以基期发展水平所得之商。如果这个比值大于1,表示水平提高了;如果这个比值小于1,表示水平下降了。(环比发展速度、定基发展速度)

社会统计学自考真题

浙江省2006年4月高等教育自学考试 社会统计学试题 课程代码:00278 一、填空题(本大题共8小题,每空1分,共10分) 请在每小题的空格中填上正确答案。错填、不填均无分。 1.统计资料整理阶段的基本方法是________。 2.调查人员从记录社会现象的各种载体中获取所需信息的调查方法,称为________。 3.若采用异距分组,________用来反映单位组距内分布的频数。 4.将所有变量值按大小顺序排列,中位数就是________的变量值。 5.已知各期的环比发展速度,应采用________法计算平均发展速度。 6.时间数列的两个基本构成要素是________和________。 7.推论统计的两个基本内容是________和________。 8.在数据的各种测量尺度中,既可进行加减运算,也可进行乘除运算的测量尺度是________。 二、单项选择题(本大题共30小题,每小题1分,共30分) 在每小题列出的四个备选项中只有一个是符合题目要求的,请将其代码填写在题后的括号内。错选、多选或未选均无分。 1.一个总体单位( ) A.只能有一个标志 B.只能有一个指标 C.可以有多个标志 D.可以有多个指标 2.政治算术学派的代表人物是( ) A.康令 B.格朗特 C.凯特勒 D.恩格尔 3.要了解某企业员工的收入,则总体单位是( ) A.该企业的全部员工 B.该企业每个员工的收入水平 C.该企业的每一个员工 D.该企业全部员工的平均收入水平 4.下列属于品质标志的是( ) A.工人年龄 B.工人性别 C.工人体重 D.工人工资等级 5.实际工作中,最常用的分类抽样是( ) A.定额分配 B.等额分配 C.定比分配 D.异比分配 6.抽样调查应遵循的原则是( ) A.灵活性 B.准确性 C.可靠性 D.随机性

社会统计学期末复习提纲

《社会统计学》课程期末复习提纲 ·考试题型: 一、填空题(10×1分=10分)二、判断题(10×1分=10分) 三、单项选择题(20×1分=20分)四、简答题(2×6分=12分)五、计算题(4题共48分) ·各章复习要点 第一章总论 P.2 统计的含义:统计工作·统计资料·统计学。其中:统计工作和统计资料是活动过程和成果的关系;统计学和统计工作是理论和实践的关系。 “统计”一词包含三种涵义,并且具有密切的联系。其中:统计工作和统计资料之间是工作与成果的关系;统计学和统计工作之间是理论和实践的关系。(y ) P.11—P.13 定类尺度;定序尺度;定距尺度;定比尺度(结合课件相关内容) 量化尺度特征功能举例 1、定类尺度确定类别分类民族的测量 2、定序尺度确定类别排列顺序分类排序考试成绩等级的测量 3、定距尺度确定类别排列顺序测数量差别和间隔距离无绝对零点分类排序加减智商的测量 4、定比尺度确定类别有序排序测数量差别和间隔距离有绝对零点分类排序加减乘除体重的测量何谓定类尺度和定序尺度?两者有何区别?1定类尺度是确定事物类别的计量尺度---高一个层次 2定类只能区分不同性质的现象并予以归类---可将所区分的类别按高低,大小,好坏,强弱,优劣等顺序做有序排列。 3定类不能进行数的比较和数学运算--能进行大小比较。 何谓定距尺度和定比尺度?两者区别定距尺度是确定研究对象之间某些数值相差的距离的尺度---最高的数据计量尺度 缺乏绝对零点---有,0 2. 0只表示一个值,即0值---0是绝对零点,表示没有 3.只能加减,不能乘除---加减乘除,高层次的各种统计分析。 P.13—P.14 总体和总体单位 一、总体和总体单位 (一)总体 1、概念总体(也称为统计总体)是指客观存在的、在同一性质基础上结合起来的许多个别单位的整体(同质个体的集团)。 2、特点·客观性·大量性同质性·差异性 1、总体单位除了必须具备同质性外,还必须具备1、差异性(或变异性)性,否则

统计学名词解释及简答题 .

名词解释 一、分类数据(categorical data )是只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,使用文字来表述的。 二、顺序数据(ran k data )是只能归于某一有序类别的非数字型数据。 三、数值型数据(metric data )是按数字尺度测量的观察值,其结果表现为具体的数值。 四、系统抽样(systematic sampling )将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机的抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位,这种抽样方法被称为系统抽样。 五、非概率抽样(non-probability sampling )是相对于概率抽样而言的,指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采取某种方式从总体中抽出部分单位对其实施调查。 六、抽样误差(sampling error )是由于抽样的随机性引起的样本结果与总体真值之间的误差。 七、四分位数(quartile)也称四分位点,他是一组数据排序后处于25%和75%位置上的值。四分位数是通过3个点将全部数据等分为4部分,其中每部分包括25%的数据。 八、离散系数也成为变异系数(coefficient of variation ),它是一组数据的标准差与其相应的平均数之比。其计算公式为: s s v x = 离散系数是测度数据离散程度的相对统计量,主要是用于比较不同样本数据的离散程度。离散系数大,说明数据的离散程度也大;离散系数小,说明数据的离散程度也小。 九、泊松分布(Poisson distribution )是用来描述在一指定时间范围内或在指定的面积或体积之内某一事件出现的次数的分布。 十、中心极限定理(central limit theorem ):设从均值μ、2σ(有限)的任意一个总体中抽取样本量为n 的样本,当n 充分大时,样本均值X 的抽样分布近似服从均值为μ、方差2σ/n 的正态分布。 十一、置信区间(confidence interval )在区间估计中,有样本统计量所构造的总体参数的估计区间称为置信区间,其中区间的最小值称为置信上限。 十二、显著性水平(significant level)是一个统计专有名词,在假设检验中,它的含义是当原假设正确时却被拒绝的概率或风险,其实这就是前面所说假设检验中犯弃真错误的概率,它是由人们根据检验的要求确定的,通常取0.05α=或0.01α=,这表明,当做出接受原假设的决定时,其正确的概率为95%或99%。 十三、方差分析(analysis of variance, ANOV A )就是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。 十四、相关系数(correlation coefficient )是根据样本数据计算的度量两个变量之间线性关系强度的统计量。 十五、回归模型(regression model )对于具有线性关系的两个变量,可以用一个线性方程来表示他们之间的关系。描述因变量y 如何依赖于自变量x 和误差项ε的方程称为回归模型。 十六、点估计 利用估计的回归方程,对于x 的一个特定值0x ,求出y 的一个估计值就是点估计。点估计可分为两种:一是平均值的点估计;二是个别值的点估计。 十七、时间序列(time series )是同一现象在不同时间上的相继观察值排列而成的序列。 十八、指数平滑法(exponential smoothing )是通过对过去的观察值加权平均进行预测的一种方法,该方法使t+1期的预测值等于t 期的实际观察值与t 期的预测值的加权平均值。 十九、指数,或称统计指数,是分析社会经济现象数量变化的一种重要统计方法。指数是测定多项内容数量综合变动的相对数。这个概念中包含两个重点:第一个要点是指数的实质是测定多项内容;指数概念的第二个要点是其表现形式为动态相对数,既然是动态相对

社会统计学复习题(有答案)

社会统计学课程期末复习题 一、填空题(计算结果一般保留两位小数) 1、第五次人口普查南京市和上海市的人口总数之比为 比较 相对指标;某企业男女职工人数之比为 比例 相对指标;某产品的废品率为 结构 相对指标;某地区福利机构网点密度为 强度 相对指标。 2、各变量值与其算术平均数离差之和为 零 ;各变量值与其算术平均数离差的平方和为 最小值 。 3、在回归分析中,各实际观测值y 与估计值y ?的离差平方和称为 剩余 变差。 4、平均增长速度= 平均发展速度 —1(或100%)。 5、 正J 形 反J 形 曲线的特征是变量值分布的次数随变量值的增大而逐步增多; 曲线的特征是变量值分布的次数随变量值的增大而逐步减少。 6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况,这种调查方式属于 重点 调查。 7、要了解某市大学多媒体教学设备情况,则总体是 该市大学中的全部多媒体教学设备 ;总体单位是 该市大学中的每一套多媒体教学设备; 。 8、若某厂计划规定A 产品单位成本较上年降低6%,实际降低了7%,则A 产品单位成本计划超额完成程度为 100%7% A 100% 1.06%100%6% -=-=-产品单位成本计划超额完成程度 ;若某厂计划规定B 产品产量较上年增长5%,实际增长了10%,则B 产品产量计划超额完成程度为 100%10% 100% 4.76%100%5% +=-=+B 产品产量计划超额完成程度 。 9、按照标志表现划分,学生的民族、性别、籍贯属于 品质 标志;学生的体重、年龄、成绩属于 数量 标志。 10、从内容上看,统计表由 主词 和 宾词 两个部分组成;从格式上看,统计表由 总标题 、 横行标题 、 纵栏标题 和 指标数值(或统计数值); 四个部分组成。 11、从变量间的变化方向来看,企业广告费支出与销售额的相关关系,单位产品成本与单位产品原材料消耗量的相关关系属于 正 相关;而市场价格与消费者需求数量的相关关系,单位产品成本与产品产量的相关关系属于 负 相关。 12、按指标所反映的数量性质不同划分,国民生产总值属于 数量 指标;单位成本属于 质量 指标。 13、如果相关系数r=0,则表明两个变量之间 不存在线性相关关系 。 二、判断题

2020年自考《社会统计学》模拟试题及答案

2020年自考《社会统计学》模拟试题及答案 一、填空题 1.统计数据分组的关键在于。 2.一般说来,统计分组具有三方面的作用:(1) ;(2) ;(3) 。 3.根据分组标志的不同,统计分组可以有分组和分组。 4.按每个变量值分别列组所编制的变量分布数列叫,其组数等于。 5.在组距式数列中,表示各组界限的变量值叫。各组中点位置上的变量值叫。 6.组距式变量数列,根据各组的组距是否相等可以分为和。 7.已知一个数列最后一组的下限为900,其相邻的组中值为850,则最后一组的上限和组中值分别为和。 8.统计资料的表现形式主要有和。 9.从形式上看,统计表主要由、、和四部分组成;从内容上看,统计表由和两部分组成。 10.统计数据整理就是对搜集得到的进行审核、分组、汇总,使之条理化、系统化,变成能反映总体特征的的工作过程。 11.数据的预处理是数据整理先行步骤,它是在对数据分类或分组之前对和所做的必要处理,包括对数据的、和。 12.直方图是用——的宽度和高度来表示频数分布的图形。 13.雷达图是一种的图示方法。 二、单项选择题

1.统计分组的关键问题是( ) A确定分组标志和划分各组界限B确定组距和组数 C确定组距和组中值D确定全距和组距 2.要准确地反映异距数列的实际分布情况,必须采用( ) A次数B累计频率C频率D次数密度 3.按品质标志分组,分组界限的确定有时会发生困难,这是由于( ) A组数较多B标志变异不明显C两种性质变异间存在过渡形态D分组有粗有细 4.某连续变量数列,其末组为开口组,下限为200,又知其邻组的组中值为170,则末组组中值为( ) A260 B 215 C 230 D 185 5.下列分组中按品质标志分组的是( ) A人口按年龄分组B产品按质量优劣分组 C企业按固定资产原值分组D乡镇按工业产值分组 6.对企业先按经济类型分组,再按企业规模分组,这样的分组,属于( ) A简单分组B平行分组C复合分组D再分组 7.用组中值代表各组内的一般水平的假定条件是( ) A各组的次数均相等B各组的组距均相等 C各组的变量值均相等D各组次数在本组内呈均匀分布 8.对统计总体按两个及以上标志分组后形成的统计表叫( )

社会统计学名词解释

1.社会统计学 社会统计学是运用统计学的一般原理,对社会各种静态结构和动态趋势进行定量描述或推断的一种专门方法与技术。人们既用它来分析已经发生和正在发生的现象,也用它来估计预测未来可能发生的现象。 2.国势学派 产生于德国,其创始人为康令和阿亨瓦尔。该学派一直以统计学为名,但只用文字记述,不用数字计量,历史上人们将该学派称为“有名无实”学派。 3.政治算术学派 该学派的创始人为英国人格朗特和威廉·配第。该学派“用数字、重量、尺度来表达自己想说的问题”,虽然没有使用统计学这一名词,但所使用的社会宏观数量对比和分析方法揭示了统计学所要研究的内容,因此历史上人们将这一学派称为“有实无名”学派。马克思对配第评价很高,誉他为“政治经济学之父,在某种程度上也可以说是统计学的创始人”。 4.数理统计学派 该学派的创始人未比利时人凯特勒,其最大的贡献就是将法国的古典概率论引入统计学,用纯数学的方法对社会现象进行研究。由于把概率论引进统计学,使社会随机现象数量方面的研究提高了准确性。因此,一门兼有数学和统计学双重意义的学科被命名为“数理统计学”。凯特勒也被人称为“现代统计学之父”。 5.大量观察法 大量观察法,就是就总体中足够多的单位进行调查和综合分析,用以反映社会总体的数量特征。大量观察法是统计调查阶段的重要方法 6.大数规律 大数规律是随机现象出现的基本规律,它的一般意义是:观察过程中每次取得的结果可

能不同(因为具有偶然性),但大量重复观察结果的平均值却几乎接近某个确定的数值。7.描述性统计 描述性统计,就是讨论范围仅以搜索的资料本身为限,而不予以扩大。早期的统计都是描述统计。 8.推论性统计 推论性统计,主要是依据概率论,研究如何依据有限资料对总体性质作推断,从而使统计的功能大为扩充。是在树立统计学派之后发展起来的,属于比较现代的统计分析方法。9.样本和(或)样本总体 样本或样本总体,是通过抽样得到的用以推断总体特征的那个“部分”。 10.标志 标志是说名总体单位属性或数量特征的名称。 11.虚拟变量 当品质标志的变异性用离散变量来表达时,这个变量可称虚拟变量。 12.指标体系 指标体系就是一系列有内在联系得统计指标集合体。 13.总体和总体单位 总体,就是作为统计研究对象的、由许多具有共性的单位构成的整体。也有人称之为母体。构成总体的每一个个体称为总体单位,简称单位,也称为个体。 14.中位数 把总体单位某一数量标志的各个数值,按大小顺序排列,位于正中处的变量值即为中位数。 15.众数

2018年春社会统计学期末复习训练题 (4)

2018年春社会统计学期末复习题 一、单项选择题 1.以下关于因变量与自变量的表述不正确的是() A.自变量是引起其他变量变化的变量 B.因变量是由于其他变量的变化而导致自身发生变化的变量 C.自变量的变化是以因变量的变化为前提 D.因变量的变化是以自变量的变化为前提 2.在频数分布表中,将各个有序类别或组的百分比逐级累加起来称为() A.频率 B.累积频数 C.累积频率 D.比率 3.离散系数的主要目的是() A.反映一组数据的平均水平 B.比较多组数据的平均水平 C.反映一组数据的离散程度 D.比较多组数据的离散程度 4.经验法则表明,当一组数据正态分布时,在平均数加减2个标准差的范围之内大约有() A.50%的数据 B.68%的数据 C.95%的数据

D.99%的数据 5.在某市随机抽取10家企业,7月份利润额(单位:万元)分别为 72.0、63.1、20.0、23.0、54.7、54.3、23.9、25.0、26.9、29.0,那么这10家企业7月份利润额均值为() A.39.19 B.28.90 C.19.54 D.27.95 6.用样本统计量的值直接作为总体参数的估计值,这种方法称为() A.点估计 B.区间估计 C.有效估计 D.无偏估计 7.在频数分布表中,比率是指() A.各组频数与上一组频数之比 B.各组频数与下一组频数之比 C.各组频数与总频数之比 D.不同小组的频数之比 8.下面哪一项不是方差分析中的假定() A.每个总体都服从正态分布 B.观察值是相互独立的 C.各总体的方差相等 D.各总体的方差等于0

9.判断下列哪一个不可能是相关系数() A.-0.9 B.0 C.0.5 D.1.2 10.用于说明回归方程中拟合优度的统计量主要是() A.相关系数 B.离散系数 C.回归系数 D.判定系数 11.在假设检验中,不拒绝虚无假设意味着() A.虚无假设是肯定正确的 B.虚无假设肯定是错误的 C.没有证据证明虚无假设是正确的 D.没有证据证明虚无假设是错误的 12.下列变量属于数值型变量的是() A.工资收入 B.产品等级 C.学生对考试改革的态度 D.企业的类型 13.如果用一个图形描述比较两个或多个样本或总体的结构性问题时,适合选用哪种图形()

《社会统计学》作业(共享含部份答案)

社会统计学作业 一、单项选择题 1.为了解IT行业从业者收入水平,某研究机构从全市IT行业从业者随机抽取800人作为样本进行调查,其中44%回答他们的月收入在6000元以上,30%回答他们每月用于娱乐消费在1000元以上。此处800人是( A ) A.样本 B. 总体 C. 统计量 D. 变量 2.在频数分布表中,将各个有序类别或组的百分比逐级累加起来称为( C )A.频率 B. 累积频数 C. 累积频率 D. 比率 3.离散系数的主要目的是( D ) A.反映一组数据的平均水平 B.比较多组数据的平均水平 C.反映一组数据的离散程度 D.比较多组数据的离散程度 4.经验法则表明,当一组数据正态分布时,在平均数加减1个标准差的范围之内大约有 ( B ) A. 50%的数据 B. 68%的数据 C. 95%的数据 D. 99%的数据 5.在某市随机抽取10家企业,7月份利润额(单位:万元)分别为72.0、63.1、20.0、23.0、54.7、54.3、23.9、25.0、26.9、29.0,那么这10家企业7月份利润额均值为( A ) A. 39.19

B. 28.90 C .19.54 D .27.95 6.用样本统计量的值直接作为总体参数的估计值,这种方法称为( A ) A .点估计 B .区间估计 C .有效估计 D .无偏估计 7.某单位对该厂第一加工车间残品率的估计高达10%,而该车间主任认为该比例(π)偏高。如果要检验该说法是否正确,则假设形式应该为( B ) A .0H :π≥0.1;1H :π<0.1 B .0H :π≤0.1;1H :π>0.1 C .0H :π=0.1;1H :π≠0.1 D .0H :π>0.1;1H :π≤0.1 8.下面哪一项不是方差分析中的假定( D ) A .每个总体都服从正态分布 B .观察值是相互独立的 C .各总体的方差相等 D .各总体的方差等于0 9.判断下列哪一个不可能是相关系数( D ) A .-0.9 B .0 C .0.5 D .1.2 10.用于说明回归方程中拟合优度的统计量主要是( D ) A. 相关系数 B. 离散系数 C. 回归系数 D. 判定系数

社会统计学_1_试题卷

山东工商学院 2020学年第一学期社会统计学课程试题 A卷 (考试时间:120分钟,满分100分) 特别提醒:1、所有答案均须填写在960数字加起来827参考答案207上,写在试题纸上无效。 2、每份答卷上均须准确填写函授站、专业、年级、学号、姓名、课程名称。 一单选题 (共20题,总分值40分 ) 1. 标准差的大小取决与()(2 分) A. 平均水平的高低 B. 各标志值与平均水平离差的大小 C. 标志值水平的高低 D. 各标志值与平均水平离差的大小和平均水平的高低 2. 当变量X的值减少时,变量Y的值也随之减少,则变量X与变量Y之间存在()(2 分) A. 直线相关关系 B. 曲线相关关系 C. 正相关关系 D. 负相关关系 3. 抽样调查和典型调查都是非全面调查,二者的根本区别在于()。(2 分) A. 灵活程度不同 B. 作用不同 C. 组织方式不同 D. 选取调查单位的方法不同 4. 统计报表大多数属于()。(2 分) A. 一次性全面调查 B. 经常性全面调查 C. 经常性非全面调查 D. 一次性非全面调查 5. 分配数列中,当标志值较小的一组权数较大时,计算出来的算术平均数()。(2 分) A. 接近标志值大的一方 B. 接近标志值小的一方 C. 不受权数的影响 D. 不能确定其移动方向 6. 在一定的抽样平均误差条件下,()(2 分)

A. 扩大极限误差范围,可以提高推断的可靠程度 B. 扩大极限误差范围,会降低推断的可靠程度 C. 缩小极限误差范围,可以提高推断的可靠程度 D. 缩小极限误差范围,不改变推断的可靠程度 7. 对于不同水平的总体不能直接用标准差比较其标志变动度,这时需分别计算各自的()来比较。(2 分) A. 标准差系数 B. 平均差 C. 全距 D. 均方差 8. 反映样本指标与总体指标之间的平均误差程度的指标是()(2 分) A. 抽样误差系数 B. 概率度 C. 抽样平均误差 D. 抽样极限误差 9. 下列相对指标中,可以用有名数表示的有()。(2 分) A. 计划完成相对指标 B. 结构相对指标 C. 动态相对指标 D. 强度相对指标 10. 在销售量综合指数中,表示()(2 分) A. 商品价格变动引起销售额变动的绝对额 B. 价格不变的情况下,销售量变动引起销售额变动的绝对额 C. 价格不变的情况下,销售量变动的绝对额 D. 销售量和价格变动引起销售额变动的绝对额 11. 下列调查中,调查单位与填报单位一致的是()(2 分) A. 企业设备调查 B. 人口普查 C. 农村耕地调查 D. 工业企业现状调查 12. 已知某企业总产值2001年比1998年增长187.5%,2000年比1998年增长150%,则2001年比2000年增长()(2 分) A. 37.5% B. 125% C. 115% D. 15% 13. 如果两变量之间的相关系数为-1,说明两变量之间存在()(2 分)

社会统计学习题和答案--相关与回归分析报告

第十二章 相关与回归分析 第一节 变量之间的相关关系 相关程度与方向·因果关系与对称关系 第二节 定类变量的相关 双变量交互分类(列联表)·削减误差比例(PRE )·λ系数与τ系数 第三节 定序变量的相关分析 同序对、异序对和同分对·Gamma 系数·肯德尔等级相关系数(τa 系数、τb 与τc 系数)·萨默斯系数(d 系数)·斯皮尔曼等级相关(ρ相关)·肯德尔和谐系数 第四节 定距变量的相关分析 相关表和相关图·积差系数的导出和计算·积差系数的性质 第五节 回归分析 线性回归·积差系数的PRE 性质·相关指数R 第六节 曲线相关与回归 可线性化的非线性函数·实例分析(二次曲线指数曲线) 一、填空 1.对于表现为因果关系的相关关系来说,自变量一般都是确定性变量,依变量则一般是( 随机性 )变量。 2.变量间的相关程度,可以用不知Y 与X 有关系时预测Y 的全部误差E 1,减去知道Y 与X 有关系时预测Y 的联系误差E 2,再将其化为比例来度量,这就是( 削减误差比例 )。 3.依据数理统计原理,在样本容量较大的情况下,可以作出以下两个假定:(1)实际观察值Y 围绕每个估计值c Y 是服从( );(2)分布中围绕每个可能的c Y 值的( )是相同的。 4.在数量上表现为现象依存关系的两个变量,通常称为自变量和因变量。自变量是作为( 变化根据 )的变量,因变量是随( 自变量 )的变化而发生相应变化的变量。 5.根据资料,分析现象之间是否存在相关关系,其表现形式或类型如何,并对具有相关关系的现象之间数量变化的议案关系进行测定,即建立一个相关的数学表达式,称为( 回归方程 ),并据以进行估计和预测。这种分析方法,通常又称为( 回归分析 )。 6.积差系数r 是( 协方差 )与X 和Y 的标准差的乘积之比。 二、单项选择 1.当x 按一定数额增加时,y 也近似地按一定数额随之增加,那么可以说x 与y 之间 存在( A )关系。 A 直线正相关 B 直线负相关 C 曲线正相关 D 曲线负相关

(完整版)社会统计学简答题与计算题复习资料

社会统计学复习材料 简答题 1、统计数据的质量要求: 1、精度:最低的抽样误差或随机误差; 2、准确性:最小的非抽样误差或偏差; 3、关联性:满足用户决策、管理和研究的需要; 4、及时性:在最短的时间里取得并公布数据; 5、一致性:保持时间序列的可比性; 6、最低成本:以最经济的方式取得数据。 2、抽样误差及其影响因素: 1、由于抽样的随机性所带来的误差; 2、所有样本可能的结果与总体真值之间的平均性差异; 3、影响抽样误差的大小的因素:样本量的大小,总体的变异性。 3、判断计量优劣的评判标准: 用样本的估计量直接作为总体参数的估计值, 无偏性:估计量抽样分布的数学期望等于被估计的总体参数; 有效性:对同一总体参数的两个无偏点估计量,有更小标准差的估计量更有效;一致性:随着样本容量的增大,估计量的值越来越接近被估计的总体参数。4、假设检验的一般步骤: (1)陈述原假设和备择假设; (2)从所研究的总体中抽出一个随机样本; (3)确定一个适当的检验统计量,并利用样本数据算出其具体数值;

(4)确定一个适当的显著性水平,并计算出其临界值,指定拒绝域; (5)将统计量的值与临界值进行比较,作出决策; (6)统计量的值落在拒绝域,拒绝H0,否则不拒绝H0。 5、假设检验中的两类错误及其之间的关系 错误: 1、第Ⅰ类错误(弃真错误)原假设为真时拒绝原假设,第Ⅰ类错误的概率记为a ,即显著性 水平; 2、第Ⅱ类错误(取伪错误)原假设为假时未拒绝原假设,第Ⅱ类错误的概率记为b 。 a 和 b 的关系就像翘翘板,a 小b 就大,a 大b 就小。因此,在样本容量n 固定情况下, 不能同时减少两类错误!一般采用增加样本容量的办法来解决。 关系:当显著性水平a 减小时,由于拒绝域的减小,弃真的错误会减小,但由此而来的是 接受域增大了,因此纳伪的概率b 要增大。反之亦然(P235)。也就是说如果要减小b ,就 增大显著性水平a 。 6、置信区间与置信度的关系表达式: ()αεθθεθ -=+≤≤-1??P []εθεθ+-?,?称作置信区间。α-1称作置信度,可信度,或置信水平。α称置信水平。在样本容量一定的情况下,置信区间和置信度是相互制约的。置 信度愈大,则相应的置信区间也域宽。当把区间估计得小一些,估计的精确程度提高了,但换取的代价将是估错的可能性增加了,也就是可靠性或置信度 α-1下降了。(P201) 7、正态分布曲线的特征: (1)一个高峰:曲线是单峰,有一个最高点。 (2)一个对称轴。曲线的高峰处有一个对称轴,在轴的左右两边是对称的。

电大社会统计学考试小抄【名词解释部分】

电大社会统计学名词解释资料小抄 1.社会统计学 社会统计学是运用统计学的一般原理,对社会各种静态结构和动态趋势进行定量描述或推断的一种专门方法与技术。人们既用它来分析已经发生和正在发生的现象,也用它来估计预测未来可能发生的现象。 2.国势学派 产生于德国,其创始人为康令和阿亨瓦尔。该学派一直以统计学为名,但只用文字记述,不用数字计量,历史上人们将该学派称为“有名无实”学派。 3.政治算术学派 该学派的创始人为英国人格朗特和威廉·配第。该学派“用数字、重量、尺度来表达自己想说的问题”,虽然没有使用统计学这一名词,但所使用的社会宏观数量对比和分析方法揭示了统计学所要研究的内容,因此历史上人们将这一学派称为“有实无名”学派。马克思对配第评价很高,誉他为“政治经济学之父,在某种程度上也可以说是统计学的创始人”。 4.数理统计学派 该学派的创始人未比利时人凯特勒,其最大的贡献就是将法国的古典概率论引入统计学,用纯数学的方法对社会现象进行研究。由于把概率论引进统计学,使社会随机现象数量方面的研究提高了准确性。因此,一门兼有数学和统计学双重意义的学科被命名为“数理统计学”。凯特勒也被人称为“现代统计学之父”。 5.大量观察法 大量观察法,就是就总体中足够多的单位进行调查和综合分析,用以反映社会总体的数量特征。大量观察法是统计调查阶段的重要方法 6.大数规律 大数规律是随机现象出现的基本规律,它的一般意义是:观察过程中每次取得的结果可能不同(因为具有偶然性),但大量重复观察结果的平均值却几乎接近某个确定的数值。 7.描述性统计 描述性统计,就是讨论范围仅以搜索的资料本身为限,而不予以扩大。早期的统计都是描述统计。 8.推论性统计 推论性统计,主要是依据概率论,研究如何依据有限资料对总体性质作推断,从而使统计的功能大为扩充。是在树立统计学派之后发展起来的,属于比较现代的统计分析方法。 9.样本和(或)样本总体 样本或样本总体,是通过抽样得到的用以推断总体特征的那个“部分”。 10.标志 标志是说名总体单位属性或数量特征的名称。 11.虚拟变量 当品质标志的变异性用离散变量来表达时,这个变量可称虚拟变量。 12.指标体系 指标体系就是一系列有内在联系得统计指标集合体。 13.总体和总体单位 总体,就是作为统计研究对象的、由许多具有共性的单位构成的整体。也有人称之为母体。构成总体的每一个个体称为总体单位,简称单位,也称为个体。 14.中位数 把总体单位某一数量标志的各个数值,按大小顺序排列,位于正中处的变量值即为中位数。 15.众数 在一组资料中,出现次数(或频数)呈现“峰”值的那些变量值。 16.调和平均数 N个变量值倒数算术平均数的倒数,也称倒数平均数。 17.几何平均数: N个变量值连乘积的N次方根。 18.平均指标: 就是表明同质总体在一定条件下某一数量标志所达到的一般水平。 19.显著水平

相关文档
最新文档