spss教程-常用的数据描述统计：频数分布表等--统计学

第二节常用的数据描述统计

本节拟讲述如何通过SPSS菜单或命令获得常用的统计量、频数分布表等。

1．数据

这部分所用数据为第一章例1中学生成绩的数据，这里我们加入描述学生性别的变量“sex”和班级的变量“class”，前几个数据显示如下（图2－2），将数据保存到名为“2-6-1.sav”的文件中。

图2－2：数据输入格式示例

1．Frequencies语句

（1）操作

打开数据文件“2-6-1.sav”，单击主菜单Analyze /Descriptive Statistics / F requencies…，出现频数分布表对话框如图2-3所示。

图2－3：Frequencies定义窗口

把score变量从左边变量表列中选到右边，并请注意选中下方的Display frequency table复选框（要求显示频数分布表）。如果您只要求得到一个频数分布表，那么就可以点OK按钮了。如果您想同时获得一

些统计量，及统计图表，还需要进一步设置。

①Statistics选项

单击Statistics按钮，打开对话框，请按图2-4自行设置。有关说明如下：

（ⅰ）在定义百分位值（percentile value）的矩形框中，选择想要输出的各种分位数，SPSS提供的选项有：●Quartiles四分位数，即显示25%、50%、75%的百分位数。

●Cut points equal 把数据平均分为几份。如本例中要求平均分为3份。

●Percentile显示用户指定的百分位数，可重复多次操作。本例中要求15%、50%、85%的百分位数。(ⅱ) 在定义输出集中趋势（Central Tendency）的矩形框中，选择想要输出的集中统计量，常用的选项有：●Mean 算术平均数

●Median 中数

●Mode 众数

●Sum 算术和

（ⅲ）在定义输出离散统计量（Dispersion）的矩形框中，选择想要输出的离散统计量，常用的选项有：●Std. Deviation 标准差

●Variance 方差

●Range 全距

●Minimum 最小值

●Maximum 最大值

●S.E. mean 平均数的标准误

（ⅳ）描述数据分布（Distribution）的统计量

●Skewness 偏度，非对称分布指数。

●Kurtosis 峰度，CASE围绕中心点的扩展程度。

另外，频数过程（Frequence）除了能够提供上面常用的统计量外，还可以对分组数据计算百分位数和中数（Values are group midpoints），即对于已经分组的数据，并且数据中的原始数据表示的是组中数的数据计算百分位数的值和中位数。

图2-4：次数分布统计量定义窗口图2-5：次数分布图形定义窗口

在本例中，我们选择输出：四分位点的值，平均分为3等分的分位点的值和15％，50％，85％的分位点的值；对于集中趋势的度量，选择输出算术平均数、中数、众数和总和，对于离散程度的度量选择输出标准差和方差。

②Charts选项

为了获得统计图表，单击主对话框中的Charts铵钮，打开它的对话框，如图2-5所示。

用户可以在图形类型（Chart Type）选择框中定义输出的图形类型，频数（Frequence）过程可以提供的输出选项有：

●None 不显示图表

●Bar charts 条形图

●Pie charts 圆形图

●Histograms 直方图

另外，对于图形中纵坐标值的表示，可以有两种方式：

●Frequencies 纵座标为变量值的频数

●Percentages 纵座标为变量值的百分比

在本例中，由于学生成绩可以看成是连续性的数据，所以这里选择输出直方图，并拟合正态曲线。点击Continue返回主对话框。

③Format选项

单击Format…，打开Format对话框，如图2-6所示。在该对话框，可以选择数据输出显示的顺序（Order by），Frequencies提供的选项有：

●Ascending values 在输出频数分布表时按变量值升序排列

●Descending values 在输出频数分布表时按变量值降序排列

●Ascending counts 输出频数分布表时按变量值频数的升序排列

●Descending counts 输出频数表时按变量值频数的降序排列

图2-6：定义输出显示格式对话框

在Format中我们一律使用默认选项。点击Continue返回主对话框，在主对话框中点击OK,可以得到次数分布的输出结果。

（2）结果及解释

①学生成绩变量的Frequences输出描述统计结果：

输出说明：

●N 后面的Valid和Missing分别用来描述有效值样本容量和缺失值的样本个数，在本例所用数据中，

有100个有效数字，缺失值的个数为0。

●Mean、Median、Mode 和Sum分别用来描述算术平均数、中数、众数和数据的总和，本例所用数据

的算术平均数为79.680，中数为79.75，众数为80，数据总和为7968.0。

●Std. Deviation和Variance分别用来描述数据的标准差和方差，这里数据的标准差为7.026，方差为

49.371。

●Percentiles后给出不同的百分位数对应的值，如15后面的数字72.075表示，15％的分位点的值为

72.075，即小于72.075分的人数占总人数的15％。（表中有两个无穷循环小数，是我们自定义的三等

分的百分位数）

②学生成绩的频数分布表：

SCORE

Frequency Percent Valid Percent Cumulative Percent

Valid 62.0 1 1.0 1.0 1.0

65.0 1 1.0 1.0 2.0

66.0 1 1.0 1.0 3.0

67.0 1 1.0 1.0 4.0

68.0 1 1.0 1.0 5.0

68.5 1 1.0 1.0 6.0

69.0 1 1.0 1.0 7.0

70.0 1 1.0 1.0 8.0

70.5 1 1.0 1.0 9.0

71.5 1 1.0 1.0 13.0

72.0 2 2.0 2.0 15.0

72.5 1 1.0 1.0 16.0

73.0 2 2.0 2.0 18.0

73.5 2 2.0 2.0 20.0

74.0 2 2.0 2.0 22.0

74.5 2 2.0 2.0 24.0

75.0 3 3.0 3.0 27.0

75.5 2 2.0 2.0 29.0

76.0 3 3.0 3.0 32.0

76.5 2 2.0 2.0 34.0

77.0 2 2.0 2.0 36.0

77.5 2 2.0 2.0 38.0

78.0 3 3.0 3.0 41.0

78.5 2 2.0 2.0 43.0

79.0 4 4.0 4.0 47.0

79.5 3 3.0 3.0 50.0

80.0 5 5.0 5.0 55.0

80.5 3 3.0 3.0 58.0

81.0 3 3.0 3.0 61.0

81.5 2 2.0 2.0 63.0

82.0 3 3.0 3.0 66.0

82.5 2 2.0 2.0 68.0

83.0 4 4.0 4.0 72.0

83.5 2 2.0 2.0 74.0

84.0 3 3.0 3.0 77.0

84.5 1 1.0 1.0 78.0

85.0 1 1.0 1.0 79.0

85.5 1 1.0 1.0 80.0

86.0 3 3.0 3.0 83.0

86.5 1 1.0 1.0 84.0

87.0 2 2.0 2.0 86.0

87.5 1 1.0 1.0 87.0

88.0 1 1.0 1.0 88.0

88.5 1 1.0 1.0 89.0

89.0 2 2.0 2.0 91.0

89.5 1 1.0 1.0 92.0

90.0 1 1.0 1.0 93.0 90.5 1 1.0 1.0 94.0

92.5 1 1.0 1.0 96.0

93.0 1 1.0 1.0 97.0

94.0 1 1.0 1.0 98.0

96.0 1 1.0 1.0 99.0

98.0 1 1.0 1.0 100.0

Total 100 100.0 100.0

在输出的频数分布表中，第一列给出数据中出现的不同数值；第二列给出该数值对应的频数（Frequency）；第三列给出对应数据在总数据中所占的百分比（Percent）；第四列给出有效百分比（Valid percent）即去除缺失值后的百分比，由于在此例中不含有缺失值所以该列数据与第三列相同；最后一列给出累加百分比（Cumulative percent）。如数据70，对应的频数为1，表示在这组数据中70出现了1次，所占比例和有效百分比都是1％，累计百分比8％表示小于等于70的人数占总人数的8％。

2.Descriptives

仍以上面所用数据为例，简单说明另外一种常用的输出描述统计量的过程—Descriptive。打开数据文件“2-6-1.sav”，

（1）操作

单击主菜单Analyze /Descriptive Statistics / Descriptives…，打开主对话框如图2-7所示：

图2－7：Descriptives定义窗口

将左边变量表列中的class、sex和scores变量选到右边的变量表列（Variable(s)）中。注意选中下方Save standardized values as variables复选框，即要求把该变量值的标准分存为一变量，并在数据窗口中显示（请注意在执行完操作后自行查看结果，新生成的变量名称分别为zclass、zsex和zscore）。

图2－8：Descriptives的options窗口

①options选项

单击options…按钮，打开描述统计过程的选择输出对话框（Descriptives:Options），设置如图2-8所示：请注意，这里所给出的一些统计量，与在Frequencies 中所给的相差无几。所以，当我们需要用到这些描述统计量的时候，可以不受一种特殊方法的限制。在此不再对这些统计量作过多说明，如有不解之处，请参阅Frequencies部分。

在图2－8的下方，提供了有关输出显示顺序（Display Order）的定义框：

●Variable list 变量表列中变量的排列顺序为数据窗口中的顺序

●Alphabetic 按字母顺序

●Ascending means 按平均数的升序排列

●Descending means 按平均数的降序排列

定义完成后，点击Continue，返回主对话框，点击OK，可以得到的输出结果。

（2）结果及解释

Descriptive Statistics

Variance

N Range Minimum Maximum Sum Mean Std.

Deviation

Statistic Statistic Statistic Statistic Statistic Statistic Std. Error Statistic Statistic

CLASS 100 2.00 1.00 3.00 205.00 2.0500 8.087E-02 .8087 .654

SEX 100 1 0 1 48 .48 5.02E-02 .50 .252

SCORE 100 36.0 62.0 98.0 7968.0 79.680 .703 7.026 49.371

Valid N

100

(listwise)

结果解释：上表分别给出三个变量（class,sex和score）的样本容量、全距、最小值、最大值、和、均值、标准误、标准差和方差。如对于学生分数（score）对应一行的输出结果显示：该组数据所含样本容量为100（N=100），最高分与最低分的差为36，即全距为36（Range=36）、最低分数为62分，即最小值为62（Minimum ＝62）；最高分数为98分，即最大值为98（Maximum＝98）；100个学生分数总和为7968（Sum=7968）；平均分79.68分（Mean=79.68），标准误为0.703（Std. Error＝0.703）、标准差为7.026（Std. Deviation＝7.026）和方差为49.371（Variance=49.371）。

再返回数据编辑（Data Editor）窗口，数据中多了三列数据分别命名为zclass，zsex和zscore，对应于三个变量的标准分数。

3.求分组平均数（Means命令）

有时我们常常需要求不同组的平均数和标准差，如对于上面所描述的资料，研究者往往预了解三个班级每个班学生的平均学习成绩等信息。SPSS提供了用于描述分组数据描述统计量的过程----Means，下面仍用上面的数据介绍这一过程的具体应用。

（1）操作

打开数据文件“2-6-1.sav”，单击主菜单Analyze / Compare Means / Means…，打开Means对话框，将score选入右边的Dependent list对话框，将class选入右边的Independent list对话框。如下图2-9所示：

图2-9 ：Means语句主对话框图2-10 ：Means的Options窗口

我们的目的在于计算不同班级学生的平均成绩和标准差。

①Options选项

在主对话框单击Options按钮，打开选择（Options）输出对话框如图2-10所示：

左面是统计量表列，包含一些常用的统计量，我们在Frequencies 与Descriptives中做过说明，在此从略。右边三项：

●Mean 平均数

●Number of cases 样本容量

●Standard deviation 标准差

是默认的统计量，如果需要计算其他的统计量，可以将左侧统计量选入右侧。这里我们采用默认的选项。点击Continue返回主对话框，然后点击OK，得到最后的统计结果。

（2）结果及解释

①所用CASE 的情况

包括有效值与缺失值的实际数目及所占百分比。

Case Processing Summary

Cases

Included Excluded Total

N Percent N Percent N Percent

SCORE * CLASS 100 100.0% 0 .0% 100 100.0%

上面输出结果表明，在分析的100个数据中，有效数据100个，排除在分析之外的数据个数为零，说明在分析的这一组数据中不含有缺失数据。

②结果报告表：各班的平均数、标准差、每个班级的人数

CLASS Mean N Std. Deviation

1.00 79.733 30 6.579

2.00 80.557 35 7.288

3.00 78.757 35 7.215

Total 79.680 100 7.026

上述结果表明1班学生人数为30人，这次考试成绩的平均分数为79.733分，标准差为6.579分；2班学生人数为35人，这次考试成绩的平均分数为80.557分，标准差为7.288分；3班学生人数为35人，这次考试成绩的平均分数为79.757分，标准差为7.215分；三个班总学生人数为100人，总平均分数为79.680分，标准差为7.026分。

社会统计学复习题(有答案)

社会统计学课程期末复习题一、填空题(计算结果一般保留两位小数）１、第五次人口普查南京市和上海市的人口总数之比为比较相对指标;某企业男女职工人数之比为比例相对指标；某产品的废品率为结构相对指标；某地区福利机构网点密度为强度相对指标。 2、各变量值与其算术平均数离差之和为零 ;各变量值与其算术平均数离差的平方和为最小值。 3、在回归分析中，各实际观测值y 与估计值y ?的离差平方和称为剩余变差。 4、平均增长速度＝平均发展速度 —1（或100%）。 5、正J 形反J 形曲线的特征是变量值分布的次数随变量值的增大而逐步增多; 曲线的特征是变量值分布的次数随变量值的增大而逐步减少。 6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况，这种调查方式属于重点调查。 7、要了解某市大学多媒体教学设备情况，则总体是该市大学中的全部多媒体教学设备；总体单位是该市大学中的每一套多媒体教学设备；。 8、若某厂计划规定A 产品单位成本较上年降低6%,实际降低了7%，则A 产品单位成本计划超额完成程度为 100%7% A 100% 1.06%100%6% -=-=-产品单位成本计划超额完成程度 ;若某厂计划规定B 产品产量较上年增长5％,实际增长了1０％，则B 产品产量计划超额完成程度为 100%10% 100% 4.76%100%5% +=-=+B 产品产量计划超额完成程度。 9、按照标志表现划分,学生的民族、性别、籍贯属于品质标志;学生的体重、年龄、成绩属于数量标志。１0、从内容上看，统计表由主词和宾词两个部分组成;从格式上看，统计表由总标题、横行标题、纵栏标题和指标数值（或统计数值）; 四个部分组成。 11、从变量间的变化方向来看，企业广告费支出与销售额的相关关系，单位产品成本与单位产品原材料消耗量的相关关系属于正相关;而市场价格与消费者需求数量的相关关系，单位产品成本与产品产量的相关关系属于负相关。 12、按指标所反映的数量性质不同划分，国民生产总值属于数量指标；单位成本属于质量指标。 13、如果相关系数ｒ=0，则表明两个变量之间不存在线性相关关系。二、判断题

2014统计学课后复习题答案

《应用统计学》习题解答第一章绪论【1.1】指出下列变量的类型：（1）汽车销售量；（2）产品等级；（3）到某地出差乘坐的交通工具（汽车、轮船、飞机）；（4）年龄；（5）性别；（6）对某种社会现象的看法（赞成、中立、反对）。【解】（1）数值型变量（2）顺序变量（3）分类变量（4）数值型变量（5）分类变量（6）顺序变量【1.2】某机构从某大学抽取200个大学生推断该校大学生的月平均消费水平。要求：（1）描述总体和样本。（2）指出参数和统计量。（3）这里涉及到的统计指标是什么？【解】（1）总体：某大学所有的大学生样本：从某大学抽取的200名大学生（2）参数：某大学大学生的月平均消费水平统计量：从某大学抽取的200名大学生的月平均消费水平（3）200名大学生的总消费，平均消费水平【1.3】下面是社会经济生活中常用的统计指标： ①轿车生产总量，②旅游收入，③经济发展速度，④人口出生率，⑤安置再就业人数，⑥全国第三产业发展速度，⑦城镇居民人均可支配收入，⑧恩格尔系数。在这些指标中，哪些是数量指标，哪些是质量指标？如何区分质量指标与数量指标？【解】数量指标有：①、②、⑤ 质量指标有：③、④、⑥、⑦、⑧ 数量指标是说明事物的总规模、总水平或工作总量的指标，表现为绝对数的形式，并附有计量单位。而质量指标是说明总体相对规模、相对水平、工作质量和一般水平的统计指标，通常是两个有联系的统计指标对比的结果。【1.4】某调查机构从某小区随机地抽取了50为居民作为样本进行调查，其中60%的居民对自己的居住环境表示满意，70%的居民回答他们的月收入在6000元以下，生活压力大。回答以下问题：（1）这一研究的总体是什么？（2）月收入是分类变量、顺序变量还是数值型变量？（3）对居住环境的满意程度是什么变量？【解】（1）这一研究的总体是某小区的所有居民。

教育统计学与SPSS课后作业答案祥解题目

教育统计学课后作业一、P118 1 题目：10位大一学生平均每周所花的学习时间与他们的期末考试成绩见表6-17.试问：（1）学习时间与考试成绩之间是否相关？（2）比较两组数据谁的差异程度大一些？（3）比较学生2与学生9的期末考试测验成绩。表6-17 学习时间与期末考试成绩 1 2 3 4 5 6 7 8 9 10 学习时间考试成绩40 58 43 73 18 56 10 47 25 58 33 54 27 45 17 32 30 68 47 69 解题步骤：（1）第一步：定义变量：“xuexishijian”、“xuexichengji”后，输入数据.如下图： 1

第二步：单击选择“分析(Analyze)”中的“相关(Correlate)”中的“双变量(Bivariate Correlations)”，将上图中的“xuexishijian”和“xuexichengji”添加到右边变量框中，如下图：第三步：点击“确定“后，输出结果如下图：第四步：分析结果

3 由上图可知：学习时间与学习成绩之间的pearson 相关系数为0.714，p （双侧）为0.20。自由度 df=10-2=8时，查“皮尔逊积差相关系数显著临界值表”知：r 0.05= 0.623 ； r 0.01=0.765。因为0.765 > 0.714 >0.623，所以在0.05水平上学习时间和学习成绩是相关显著的。（2）SPSS 软件分析结果如下图：由上图可知：学习时间标准差和平均值为：S 1=12.037 ?X 1= 29.00 ；学习时间标准差和平均值为：S 2=12.437?X 2=56.00 根据差异系数公式可知：学习时间差异系数为：%100?=X S CV S =12.037/29.00×100%=41.51% 学习成绩差异系数为：%100?= X S CV S =12.437/56.00×100%=22.27% 有上述结果可知学习时间差异程度大于学习成绩差异程度。（4）把学生2和学生9的期末考试成绩转化成标准分数： Z 2=(X -?X) /S= (73—56)/12.437=1.367 Z 9=(X-?X)/S=(68—56)/12.437=0.965 由上计算可知：学生2期末考试测验成绩优于学生9的期末考试测验成绩。二、P119 2 题目：某班数学的平均成绩为90，标准差10；化学的平均分为85，标准差为8；物理的平均分为79，标准差为15.某生这三科成绩分别为95,80,80.试问（1）该生在哪一学科上突出一些？（2）该班三科成绩的差异度如何？有无学习分化现象？（3）该生的学期分数是多少？（4）三科的总平均和总标准差是多少？解题步骤：

统计学课后习题答案(Chap1.2)

第1章绪论 1．什么是统计学怎样理解统计学与统计数据的关系 2．试举出日常生活或工作中统计数据及其规律性的例子。 3．．一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。因此，他们开始检查供货商的集装箱，有问题的将其退回。最近的一个集装箱装的是2 440加仑的油漆罐。这家零售商抽查了50罐油漆，每一罐的质量精确到4位小数。装满的油漆罐应为4.536 kg。要求： (1)描述总体； (2)描述研究变量； (3)描述样本； (4)描述推断。答：(1)总体：最近的一个集装箱内的全部油漆； (2)研究变量：装满的油漆罐的质量； (3)样本：最近的一个集装箱内的50罐油漆； (4)推断：50罐油漆的质量应为×50＝226.8 kg。 4．“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。假定作为百事可乐营销战役的一部分，选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中，两个品牌不做外观标记)，请每一名被测试者说出A品牌或B品牌中哪个口味更好。要求： (1)描述总体； (2)描述研究变量； (3)描述样本； (4)一描述推断。答：(1)总体：市场上的“可口可乐”与“百事可乐” (2)研究变量：更好口味的品牌名称； (3)样本：1000名消费者品尝的两个品牌 (4)推断：两个品牌中哪个口味更好。第2章统计数据的描述——练习题 ●1.为评价家电行业售后服务的质量，随机抽取了由100家庭构成的一个样本。服务质量的等级分别表示为：A.好；B.较好；C.一般；D.差；E.较差。调查结果如下： B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C D E A B D D C A D B C C A E D C B C B C E D B C C B C (1) 指出上面的数据属于什么类型； (2)用Excel制作一张频数分布表；

统计分析及SPSS的应用课后练习答案解析

《统计分析与SPSS的应用（第五版）》（薛薇）课后练习答案第4章SPSS基本统计分析 1、利用第2章第7题数据采用SPSS频数分析，分析被调查者的常住地、职业和年龄分布特征，并绘制条形图。分析——描述统计——频率，选择“常住地”，“职业”和“年龄”到变量中，然后，图表——条形图——图表值（频率）——继续，勾选显示频率表格，点击确定。 Statistics 户口所在地职业年龄 N Valid282282282 Missing000 户口所在地 Frequency Percent Valid Percent Cumulative Percent Valid 中心城市200 边远郊区82 Total282 职业 Frequency Percent Valid Percent Cumulative Percent Valid 国家机关24商业服务业54文教卫生18公交建筑业15经营性公司18学校15一般农户35种粮棉专业户 4

种果菜专业户 10 工商运专业户 34 退役人员17 金融机构35 现役军人3 Total282 年龄 Frequency Percent Valid Percent Cumulative Percent Valid 20岁以下4 20~35岁146 35~50岁91 50岁以上41 Total282

分析：本次调查的有效样本为282份。常住地的分布状况是：在中心城市的人最多，有200人，而在边远郊区只有82人；职业的分布状况是：在商业服务业的人最多，其次是一般农户和金融机构；年龄方面：在35-50岁的人最多。由于变量中无缺失数据，因此频数分布表中的百分比相同。 2、利用第2章第7题数据，从数据的集中趋势、离散程度以及分布形状等角度，分析被调查者本次存款金额的基本特征，并与标准正态分布曲线进行对比。进一步，对不同常住地储户存款金额的基本特征进行对比分析。分析——描述统计——描述，选择存款金额到变量中。点击选项，勾选均值、标准差、方差、最小值、最大值、范围、偏度、峰度、按变量列表，点击继续——确定。分析：由表中可以看出，有效样本为282份，存（取）款金额的均值是，标准差为，峰度系数为，偏度系数为。与标准正态分布曲线进行对比，由峰度系数可以看出，此表的存款金额的数据分布比标准正态分布更陡峭；由偏度系数可以看出，此表的存款金额的数据为右偏分布，表明此表的存款金额均值对平均水平的测度偏大。

社会统计学习题和答案--相关与回归分析报告

第十二章相关与回归分析第一节变量之间的相关关系相关程度与方向·因果关系与对称关系第二节定类变量的相关双变量交互分类（列联表）·削减误差比例（PRE ）·λ系数与τ系数第三节定序变量的相关分析同序对、异序对和同分对·Gamma 系数·肯德尔等级相关系数（τa 系数、τb 与τc 系数）·萨默斯系数（d 系数）·斯皮尔曼等级相关（ρ相关）·肯德尔和谐系数第四节定距变量的相关分析相关表和相关图·积差系数的导出和计算·积差系数的性质第五节回归分析线性回归·积差系数的PRE 性质·相关指数R 第六节曲线相关与回归可线性化的非线性函数·实例分析（二次曲线指数曲线）一、填空 1．对于表现为因果关系的相关关系来说，自变量一般都是确定性变量，依变量则一般是（随机性）变量。 2．变量间的相关程度，可以用不知Y 与X 有关系时预测Y 的全部误差E 1，减去知道Y 与X 有关系时预测Y 的联系误差E 2，再将其化为比例来度量，这就是（削减误差比例）。 3．依据数理统计原理，在样本容量较大的情况下，可以作出以下两个假定：（1）实际观察值Y 围绕每个估计值c Y 是服从（）；（2）分布中围绕每个可能的c Y 值的（）是相同的。 4．在数量上表现为现象依存关系的两个变量，通常称为自变量和因变量。自变量是作为（变化根据）的变量，因变量是随（自变量）的变化而发生相应变化的变量。 5．根据资料，分析现象之间是否存在相关关系，其表现形式或类型如何，并对具有相关关系的现象之间数量变化的议案关系进行测定，即建立一个相关的数学表达式，称为（回归方程），并据以进行估计和预测。这种分析方法，通常又称为（回归分析）。 6．积差系数r 是（协方差）与X 和Y 的标准差的乘积之比。二、单项选择 1．当x 按一定数额增加时，y 也近似地按一定数额随之增加，那么可以说x 与y 之间存在（ A ）关系。 A 直线正相关 B 直线负相关 C 曲线正相关 D 曲线负相关

统计学第四版(贾俊平)课后思考题答案

统计课后思考题答案第一章思考题 1.1什么是统计学统计学是关于数据的一门学科，它收集，处理，分析，解释来自各个领域的数据并从中得出结论。 1.2解释描述统计和推断统计描述统计；它研究的是数据收集，处理，汇总，图表描述，概括与分析等统计方法。推断统计；它是研究如何利用样本数据来推断总体特征的统计方法。 1.3统计学的类型和不同类型的特点统计数据；按所采用的计量尺度不同分；（定性数据）分类数据：只能归于某一类别的非数字型数据，它是对事物进行分类的结果，数据表现为类别，用文字来表述；（定性数据）顺序数据：只能归于某一有序类别的非数字型数据。它也是有类别的，但这些类别是有序的。（定量数据）数值型数据：按数字尺度测量的观察值，其结果表现为具体的数值。统计数据；按统计数据都收集方法分；观测数据：是通过调查或观测而收集到的数据，这类数据是在没有对事物人为控制的条件下得到的。实验数据：在实验中控制实验对象而收集到的数据。统计数据；按被描述的现象与实践的关系分；截面数据：在相同或相似的时间点收集到的数据，也叫静态数据。时间序列数据：按时间顺序收集到的，用于描述现象随时间变化的情况，也叫动态数据。 1.4解释分类数据，顺序数据和数值型数据答案同1.3 1.5举例说明总体，样本，参数，统计量，变量这几个概念对一千灯泡进行寿命测试，那么这千个灯泡就是总体，从中抽取一百个进行检测，这一百个灯泡的集合就是样本，这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数，这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量，变量就是说明现象某种特征的概念，比如说灯泡的寿命。 1.6变量的分类

教育统计学与SPSS名解总结

第一章导论（阅览前必读：书上每个章节后的名解我全都列出来了，黑色字体的都是书上原文，量多，但有些不重要的名解没必要背，你挑着背不要被吓到。绿色是章节题目，红色的就是我的一些说明、补充、吐槽，一个人打字很无聊啊有木有！一直自言自语啊有木有！并非书上的名词解释，看看就好，可删。这段紫色的也删了哈。接下来……正文，走你！）统计学（statistics）：即研究统计原理与方法的科学。教育统计学（educational statistics）：是专门研究如何搜集、整理、分析在心理和教育方面有实验或调查所获得的数字资料，如何根据这些资料所传递的信息，进行数学推论，找出客观规律的一门学科。简言之，教育统计学是运用统计学的一般原理和方法研究教育科学领域数量关系的一门科学。描述统计（descriptiive statistics）：是实验或调查所获得的数据加以整理（如制表、绘图），并计算其各种代表量数（如集中量数、差异量数、相关量数等），其基本思想是平均。 Or：是研究如何整理心理与教育科学实验或调查得来的大量数据，描述一组数据的全貌，表达一件事物的性质的一种统计方法。推断统计（inferencial statistics）：又称抽样统计，它是根据对部分个体进行观测所得到的信息，通过概括性的分析、论证，在一定可靠程度上去推测相应的团体。 Or：是研究如何通过局部数据所提供的信息，运用概率的理论进行分析论证，在一定可靠程度上推论总体或全局情形的统计方法。这是统计学中的主要内容。实验设计（experimental statistics）：是研究如何更加合理、有效的获得观测资料，如何更正确、更经济、更有效的达到实验目的，以揭示实验中各种变量关系的实验计划。 Or：实验者为了揭示实验中自变量与因变量的关系，在实验之前所制定的实验计划，称为实验设计。他是研究如何科学地、经济地以及更有效地进行实验。统计常态法则：从总体中随机抽取一部分个体所组成的样本，差不多可以保持总体的特征。小数永存法则：从总体中抽取的第一个样本中所表现的特性，在其他样本中也会存在。大量惰性原则：某一事物的某一性质或状态，在反复观察或试验中是保持不变的。有效数字：是指能影响测量准确性的数字。随机变量（random variable）：在统计学中把在取值之前不能预料到取什么值的量称为变量（随机变量）。数据（data）：如果一旦某个数值被取定了，成这个数值为随机变量的一个观察值，即数据。总体（population）：指客观存在的，并在同一性质的基础上结合起来的许多个别单位的整体，即具有某一特性的一类事物的全体，又叫母体或全域。个体（individual）: 构成总体的基本单位或单元，又称元素或个案。样本（sample）：从总体中抽取的一部分个体。参数（parameter）：表示总体特征的量数。统计量（statistic）：是直接从样本计算出的量数，代表样本的特征。

统计学课后题答案

第二章 3.某公司下属40个销售点2012年的商品销售收入数据如下：单位：万元152 124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 108 97 88 123 115 119 138 112 146 113 126 要求：（1）根据上面的数据进行适当分组，编制频数分布表，绘制直方图。（2）制作茎叶图，并与直方图进行比较。解：（1）频数分布表

或：（2）茎叶图

第三章 1. 已知下表资料：试根据频数和频率资料，分别计算工人平均日产量。解：计算表

根据频数计算工人平均日产量：6870 34.35200 xf x f = = =∑∑（件）根据频率计算工人平均日产量：34.35f x x f = = ∑∑ g （件）结论：对同一资料，采用频数和频率资料计算的变量值的平均数是一致的。 2.某企业集团将其所属的生产同种产品的9个下属单位按其生产该产品平均单位成本的分组资料如下表：试计算这9个企业的平均单位成本。解：

这9个企业的平均单位成本=f x x f = ∑∑ =13.74（元） 3.某专业统计学考试成绩资料如下：试计算众数、中位数。解：众数的计算：根据资料知众数在80～90这一组，故L=80，d=90-80=10,fm=20,fm-1=14,fm+1=9, ()() 1 11m m o m m m m f f M L d f f f f --+-=+ ?-+-

《统计分析与SPSS的应用(第五版)》课后练习标准答案(第2章)

《统计分析与SPSＳ的应用（第五版)》（薛薇) 课后练习答案第2章SＰSS数据文件的建立和管理１、SPSS中有哪两种基本的数据组织形式？各自的特点和应用场合是什么？ SＰSS中两个基本的数据组织方式：原始数据的组织方式和计数数据的组织方式。 ●原始数据的组织方式:待分析的数据是一些原始的调查问卷数据,或是一些基本的统计指标。 ●计数数据的组织方式:所采集的数据不是原始的调查问卷数据,而是经过分组汇总后的数据。２、什么是SＰSS的个案？什么SPSＳ的变量? 个案:在原始数据的组织方式中,数据编辑器窗口中的一行称为一个个案或观测。变量:数据编辑器窗口中的一列。 3、在定义SPＳS数据结构时,默认的变量名和变量类型是什么？如果希望增强ＳPSS统计分析结果的易读性,还需要对数据结构的哪些方面进行必要说明？默认的变量名:VAR---－--；默认的变量类型：数值型。变量名标签和变量值标签可增强统计分析结果的可读性。４、收集到以下关于两种减肥产品试用情况的调查数据，请问在SPSS中应如何组织该份资料? 产品类型体重变化情况明显减轻无明显变化第一种产品2７１９第二种产品20 33 问:在SＰＳS中应如何组织该数据? 数据文件如图所示: ５、什么是SＰSS的用户缺失值？为什么要对用户缺失值进行定义?如何在SPSＳ中指定用户缺失值? 缺失值分为用户缺失值(User Missing Valuｅ）和系统缺失值（Ｓｙstｅm Ｍiｓｓing

Ｖaｌue）。用户缺失值指在问卷调查中,将无回答的一些数据以及明显失真的数据当作缺失值来处理。用户缺失值的编码一般用研究者自己能够识别的数字来表示，如“０”、“9”、“9９”等。系统缺失值主要指计算机默认的缺失方式，如果在输入数据时空缺了某些数据或输入了非法的字符,计算机就把其界定为缺失值,这时的数据标记为一个圆点“?”。在变量视图中定义。 6、从计量尺度角度看，变量包括哪三种主要类型？请各举出一个相应的实际数据。如何在ＳＰSS中指定变量的计算尺度？变量类型包括：数值型（身高）、定序型（受教育程度)以及定类型（性别)。在变量视图中定义。７、有一份关于居民储蓄调查的模拟数据存储在Eｘｃel中，文件名为“居民储蓄调查数据．ｘｌs”。该数据的第一行是变量名，格式如下图所示。请将该份数据转换成SPSＳ数据文件，并在SＰSＳ中指定其变量名标签和变量值标签。(该份数据的具体含义见Excel文件的后半部分) 【文件(F)】→【打开（O)】→【数据(A)】→文件类型选“Ｅｘceｌ(＊.xｌｓ,…)”,文件名选“居民储蓄调查数据.xls”→【打开】→选中“从第一行数据读取变量名”,在“范围” 中输入“A１：Q２８3”→【确定】→在“变量视图”窗口，调整Ａ1变量的宽度,输入变量名标签和变量值标签→在主菜单窗口选定【文件（F)】→【保存】→选择保存路径,保存类型为“saｖ”，文件名为“居民储蓄调查数据”→【保存】. ８、现有股民投资状况调查的文本数据，文件名为“股民投资数据．txt”。其中各变量的含义和编码见文件“股民投资数据.xls”。请将该文本数据读入ＳＰSS，并定义变量名标签和变量值标签。其中各变量取值为9的均为用户缺失值，请加以定义说明。（注：本调查问卷中涉及多选项问题,以及多选项问题的编码等，可先忽略。）【文件(Ｆ)】→【打开文本数据(D)】→【数据（A)】→文件类型选“Text（＊.txt,…)”，文件名选“股民投资数据.ｔxｔ”，【打开】→在“您的文本文件与预定义的格式匹配吗？”中选“否”，【下一步】→在“变量名称是否包括在文件的顶部”中选“是”,【下一步】→在“第一个数据个案从哪个行号开始”中输入“2”,其他默认,【下一步】→【下一步】→在“数据格式”中输入“字符串”,接着在弹出的窗口输入“4”，【下一步】→默认各选项,【完成】→在主菜单窗口选定【文件(Ｆ)】→【保存】→选择保存路径,保存类型为“sav”，文件名为“股民投资数据”→【保存】.

社会统计学复习题有答案

社会统计学复习题有答案集团标准化工作小组 #Q8QGGQT-GX8G08Q8-GNQGJ8-MHHGN#

社会统计学课程期末复习题一、填空题（计算结果一般保留两位小数） 1、第五次人口普查南京市和上海市的人口总数之比为比较相对指标；某企业男女职工人数之比为比例相对指标；某产品的废品率为结构相对指标；某地区福利机构网点密度为强度相对指标。 2、各变量值与其算术平均数离差之和为零；各变量值与其算术平均数离差的平方和为最小值。 3、在回归分析中，各实际观测值y 与估计值y ?的离差平方和称为剩余变差。 4、平均增长速度= 平均发展速度 —1（或100%）。 5、正J 形反J 形曲线的特征是变量值分布的次数随变量值的增大而逐步增多；曲线的特征是变量值分布的次数随变量值的增大而逐步减少。 6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况，这种调查方式属于重点调查。 7、要了解某市大学多媒体教学设备情况，则总体是该市大学中的全部多媒体教学设备；总体单位是该市大学中的每一套多媒体教学设备；。 8、若某厂计划规定A 产品单位成本较上年降低6％，实际降低了7％，则A 产品单位成本计划超额完成程度为 100%7% A 100% 1.06%100%6% -=- =-产品单位成本计划超额完成程度；若某厂计划规定B 产品产量较上年增长5％，实际增长了10％，则B 产品产量计划超额完成程度为 100%10% 100% 4.76%100%5% += -=+B 产品产量计划超额完成程度。

9、按照标志表现划分，学生的民族、性别、籍贯属于品质标志；学生的体重、年龄、成绩属于数量标志。 10、从内容上看，统计表由主词和宾词两个部分组成；从格式上看，统计表由总标题、横行标题、纵栏标题和指标数值（或统计数值）；四个部分组成。 11、从变量间的变化方向来看，企业广告费支出与销售额的相关关系，单位产品成本与单位产品原材料消耗量的相关关系属于正相关；而市场价格与消费者需求数量的相关关系，单位产品成本与产品产量的相关关系属于负相关。 12、按指标所反映的数量性质不同划分，国民生产总值属于数量指标；单位成本属于质量指标。 13、如果相关系数r=0，则表明两个变量之间不存在线性相关关系。二、判断题 1、在季节变动分析中，若季节比率大于100%，说明现象处在淡季；若季节比率小于100%，说明现象处在旺季。（×；答案提示：在季节变动分析中，若季节比率大于100%，说明现象处在旺季；若季节比率小于100%，说明现象处在淡季。） 2、工业产值属于离散变量；设备数量属于连续变量。（×；答案提示：工业产值属于连续变量；设备数量属于离散变量） 3、中位数与众数不容易受到原始数据中极值的影响。（√；） 4、有意识地选择十个具有代表性的城市调查居民消费情况，这种调查方式属于典型调查。（√）

统计学 SPSS作业

频率统计量 XB性别MRC月消费金额 N 有效126 126 缺失0 0 频率表 XB性别频率百分比有效百分比累积百分比有效 A.男65 51.6 51.6 51.6 A.女61 48.4 48.4 100.0 合计126 100.0 100.0 MRC月消费金额频率百分比有效百分比累积百分比有效 A.300元-400元 1 .8 .8 .8 B.401元-600元9 7.1 7.1 7.9 C.601元-1000元77 61.1 61.1 69.0 D.1000元以上39 31.0 31.0 100.0 合计126 100.0 100.0

通过以上交叉表可知，男性日常用品花费在41-60元和61-100元这两个区间所占比游程检验 2 XB性别NL年龄检验值a 1.48 19.59 案例 < 检验值65 70 案例 >= 检验值61 56 案例总数126 126 Runs 数8 35 Z -10.017 -5.112 渐近显著性(双侧) .000 .000 a. 均值从上图中可以知道图中显示性别的分割点分别为1和1.48，,SPSS计算出游程数分别共有1和8，表格中年龄所使用的分割点为均数19和19.59，而不是原先的中位数20，导致游程增加到46和35.

可见在年龄为21时样本的信心指数均值为1.8556，低于基线水平100.样本均数抽样误差为0.13216 由上面的检验结果t=-742.635 p=0 由于p值小于检验水准0.05。因此拒绝H0，所以样本所在的均值与假设的在总体均值相同。

分析结果的第一部分为Levene’s方差齐性检验，用于判别两总体方差是否为齐性方差，这里的检测结果为F=10.975，P=0.006，因此拒绝Ho,认为本例中两个样本所在总体的方差是不齐的。相关性控制变量NL年龄YY MRC月消费金额NL年龄相关性 1.000 . 显著性（双侧）. . df 0 15 YY 相关性. 1.000 显著性（双侧）. . df 15 0 在控制了月消费金额之后计算出的年龄和总指数的偏相关矩阵，可见两者的偏相关系数为1。 G图

社会统计学习题和答案--相关与回归分析

第十二章相关与回归分析第一节变量之间的相关关系相关程度与方向·因果关系与对称关系第二节定类变量的相关双变量交互分类(列联表)·削减误差比例(PRE)·λ系数与τ系数第三节定序变量的相关分析同序对、异序对与同分对·Gamma 系数·肯德尔等级相关系数(τa 系数、τb 与τc 系数)·萨默斯系数(d 系数)·斯皮尔曼等级相关(ρ相关)·肯德尔与谐系数第四节定距变量的相关分析相关表与相关图·积差系数的导出与计算·积差系数的性质第五节回归分析线性回归·积差系数的PRE 性质·相关指数R 第六节曲线相关与回归可线性化的非线性函数·实例分析(二次曲线指数曲线) 一、填空 1.对于表现为因果关系的相关关系来说,自变量一般都就是确定性变量,依变量则一般就是( 随机性 )变量。 2.变量间的相关程度,可以用不知Y 与X 有关系时预测Y 的全部误差E 1,减去知道Y 与X 有关系时预测Y 的联系误差E 2,再将其化为比例来度量,这就就是( 削减误差比例 )。 3.依据数理统计原理,在样本容量较大的情况下,可以作出以下两个假定:(1)实际观察值Y 围绕每个估计值c Y 就是服从( );(2)分布中围绕每个可能的c Y 值的( )就是相同的。 4.在数量上表现为现象依存关系的两个变量,通常称为自变量与因变量。自变量就是作为( 变化根据 )的变量,因变量就是随( 自变量 )的变化而发生相应变化的变量。 5.根据资料,分析现象之间就是否存在相关关系,其表现形式或类型如何,并对具有相关关系的现象之间数量变化的议案关系进行测定,即建立一个相关的数学表达式,称为( 回归方程 ),并据以进行估计与预测。这种分析方法,通常又称为( 回归分析 )。 6.积差系数r 就是( 协方差 )与X 与Y 的标准差的乘积之比。二、单项选择 1.当x 按一定数额增加时,y 也近似地按一定数额随之增加,那么可以说x 与y 之间存在( A )关系。 A 直线正相关 B 直线负相关 C 曲线正相关 D 曲线负相关 2.评价直线相关关系的密切程度,当r 在0、5～0、8之间时,表示( C )。 A 无相关 B 低度相关 C 中等相关 D 高度相关 3.相关分析与回归分析相辅相成,又各有特点,下面正确的描述有( D )。 A 在相关分析中,相关的两变量都不就是随机的;

统计学课后习题答案完整版

统计学课后习题答案 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】

第四章统计描述【】某企业生产铝合金钢，计划年产量40万吨，实际年产量45万吨；计划降低成本5%，实际降低成本8%；计划劳动生产率提高8%，实际提高10%。试分别计算产量、成本、劳动生产率的计划完成程度。【解】产量的计划完成程度=%5.112100%40 45 100%=?=?计划产量实际产量即产量超额完成%。成本的计划完成程=84%.96100%5%-18% -1100%-1-1≈?=?计划降低百分比实际降低百分比即成本超额完成%。劳动生产率计划完= 85%.101100%8%110% 1100%11≈?++=?++计划提高百分比实际提高百分比即劳动生产率超额完成%。【】某煤矿可采储量为200亿吨，计划在1991~1995年五年中开采全部储量的%，试计算该煤矿原煤开采量五年计划完成程度及提前完成任务的时间。【解】本题采用累计法：（1）该煤矿原煤开采量五年计划完成=100% ?数计划期间计划规定累计数计划期间实际完成累计 = 75%.1261021025357 4 =?? 即：该煤矿原煤开采量的五年计划超额完成%。（2）将1991年的实际开采量一直加到1995年上半年的实际开采量，结果为2000万吨，此时恰好等于五年的计划开采量，所以可知，提前半年完成计划。【】我国1991年和1994年工业总产值资料如下表：

要求：（1）计算我国1991年和1994年轻工业总产值占工业总产值的比重，填入表中；（2）1991年、1994年轻工业与重工业之间是什么比例（用系数表示）？（3）假如工业总产值1994年计划比1991年增长45%，实际比计划多增长百分之几？ 1991年轻工业与重工业之间的比例=96.01.144479 .13800≈； 1994年轻工业与重工业之间的比例=73.04.296826 .21670≈ （3） %37.25 1%) 451(2824851353 ≈-+ 即，94年实际比计划增长%。【】某乡三个村2000年小麦播种面积与亩产量资料如下表：要求：（1）填上表中所缺数字；（2）用播种面积作权数，计算三个村小麦平均亩产量；（3）用比重作权数，计算三个村小麦平均亩产量。

教育统计学 SPSS练习题

1.某学校初中一年级80名学生的数学考试成绩如下，制作频数分布表和图形并作频数分布分析。某校初一年级80名学生的数学考试成绩 88,89,90,72,89,88,84,83,92,86 90,86,76,87,91,90,90,74,85,84 90,85,89,76,77,85,93,91,81,84 91,83,80,85,87,86,87,84,89,91 84,89,88,84,83,95,85,89,89,89 80,95,83,91,86,87,92,93,89,73 95,82,87,89,80,70,85,85,68,83 82,89,88,85,90,89,80,90,77,72 2.将第1题中的80名学生的数学考试成绩分成0-60，60-70，70-80，80-90，90-100五段，进行分段频数统计，并绘制频数分布条形图 3.某班学生政治面貌分布情况为：党员21人，团员35人，群众43人，请绘制统计图。 4.某班学生政治面貌分布情况为：党员21人（其中男生11人，女生10人），团员35人（其中男生15人，女生20人），群众43人（其中男生23人，女生20人），请绘制统计图。 5.某职业技术学院2000年对其240名学生家长的职业调查结果如下：公务员58人，医生26人，军人15人，工人90人，个体工商业主45人，教师6人，请据此绘制一个圆形图。 6.对15名初三学生用一套初中数学水平测验试卷进行测试，其测验得分如下，另以这些学生的校内数学期末考试成绩为效标，试计算初中数学水平测验的效标关联效度系数。学生序号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 水平测验得分56 73 65 78 64 77 90 61 54 75 45 72 88 95 61 期末成绩63 65 70 74 68 85 92 64 59 70 50 79 90 91 65 7.某大学一年级12名学生的英语阅读理解能力测验成绩与其平时阅读作业成绩如下表所列，试计算阅读理解能力测验的效标关联效度系数。学生序号 1 2 3 4 5 6 7 8 9 10 11 12 测验得分32 33 34 34 36 37 38 39 40 41 43 45 作业成绩（等级）6 4 2 7 5 9 1 3 11 12 10 8 8. 从某班学生中随机抽取15名，测得他们的数学成绩如下： 65,77,80,78,89,90,74,73,89,95,83,56,68,92,82 （1）试对该班学生的数学平均成绩和成绩的离散程度作出估计。（2）试求该班成绩均值的95%和99%的置信区间。 9.已知某年级学生的语文成绩服从正态分布，其中总体平均数为76.9，标准差未知。现从该年级某班随机抽取16名学生的语文成绩，数据如下： 75,88,73,93,85,76,68,90,61,58,78,89,95,77,60,74，问该班学生的平均语文成绩是否也是76.9？（α=0.01）

(完整版)社会统计学复习题(有答案),DOC

o o 海量资源，欢迎共阅社会统计学课程期末复习题一、填空题（计算结果一般保留两位小数） 1、第五次人口普查南京市和上海市的人口总数之比为比较相对指标；某企业男女职工人数之比为比例相对指标；某产品的废品率为结构相对指标；某地区福利机构网点密度为强度相对指标。2最小值。345、正J 6于重点7；总 8计划超额完成程度为；若某 100%7% A 100% 1.06%100%6% -=- =-产品单位成本计划超额完成程度厂计划规定B 产品产量较上年增长5％，实际增长了10％，则B 产品产量计划超额完成程度为。 100%10% 100% 4.76%100%5% += -=+B 产品产量计划超额完成程度9、按照标志表现划分，学生的民族、性别、籍贯属于品质标志；学生的体重、年龄、成绩属于数量标志。

海量资源，欢迎共阅 10、从内容上看，统计表由主词和宾词两个部分组成；从格式上看，统计表由总标题、横行标题、纵栏标题和指标数值（或统计数值）；四个部分组成。 11、从变量间的变化方向来看，企业广告费支出与销售额的相关关系，单位产品成本与单位产品原材料消耗量的相关关系属于正相关；而市场价格与消费者需求数量的相关关系，单位 13 1 100%，） 2 3 4、有意识地选择十个具有代表性的城市调查居民消费情况，这种调查方式属于典型调查。（√） 5、统计调查按调查范围划分可以分为全面调查和非全面调查。（√） 6、用移动平均法修匀时间数列时，如果移动项数为偶数项，只要进行一次移动平均；如果移动项数为奇数项，则要进行二次移动平均。（×；答案提示：用移动平均法修匀时间数列时，如果移动项数为奇数项，只要进行一次移动平均；如果移动项数为偶数项，则要进行二

《卫生统计学》课后思考题答案

《卫生统计学》思考题参考答案第一章绪论 1、统计资料可以分为那几种类型？举例说明不同类型资料之间是如何转换的？答：（1）1定量资料（离散型变量、连续型变量）、2无序分类资料（二项分类资料、无序多项分类资料）、3有序分类资料（即等级资料）；（2）例如人的健康状况可分为“非常好、较好、一般、差、非常差”5个等级，应归为等级资料，若将该五个等级赋值为5、4、3、2、1，就可按定量资料处理。 2、统计工作可分为那几个步骤？答：设计、收集资料、整理资料、分析资料四个步骤。 3、举例说明小概率事件的含义。答：某人打靶100次，中靶次数少于等于5，那么该人一次打中靶的概率≤0.05，即可称该人一次打中靶的事件为小概率事件，可以视为很可能不发生。第二章调查研究设计 1、调查研究有何特点？答：（1）不能人为施加干预措施（2）不能随机分组（3）很难控制干扰因素（4）一般不能下因果结论 2、四种常用的抽样方法各有什么特点？答：（1）单纯随机抽样：优点是操作简单，统计量的计算较简便；缺点是当总体观察单位数量庞大时，逐一编号繁复，有时难以做到。

（2）系统抽样：优点是易于理解、操作简便，被抽到的观察单位在总体中分布均匀，抽样误差较单纯随机抽样小；缺点是在某些情况下会出现偏性或周期性变化。（3）分层抽样：优点是抽样误差小，各层可以独立进行统计分析，适合大规模统计；缺点是事先要进行分层，操作麻烦。（4）整群抽样：优点是易于组织和操作大规模抽样调查；缺点是抽样误差大。 3、调查设计包括那些基本内容？答：（1）明确调查目的和指标（2）确定调查对象和观察单位（3）选择调查方法和技术（4）估计样本大小（5）编制调查表（6）评价问卷的信度和效度（7）制定资料的收集计划（8）指定资料的整理与分析计划（9）制定调查的组织措施 4、调查表中包含那几种项目？答：（1）分析项目直接整理计算的必须的内容；（2）备查项目保证分析项目填写得完整和准确的内容；（3）其他项目大型调查表的前言和表底附注。第三章实验设计 1、简述实验设计的特点。

《统计分析与SPSS的应用(第五版)》课后练习答案解析(第4章)

WORD 格式整理《统计分析与SPSS的应用（第五版）》（薛薇）课后练习答案第 4 章 SPSS基本统计分析 1、利用第2章第7题数据采用SPSS频数分析，分析被调查者的常住地、职业和年龄分布特征，并绘制条形图。分析——描述统计——频率，选择“常住地”，“职业”和“年龄”到变量中，然后，图表——条形图——图表值（频率）——继续，勾选显示频率表格，点击确定。 Statistics 户口所在职业年龄地 Valid282282282 N Missing 000 户口所在地 Frequency Percent Valid Cumulative Percent Percent 中心城市20070.970.970.9 Valid 边远郊区8229.129.1100.0 Total282100.0100.0 职业 Frequency Percent Valid Cumulative Percent Percent 国家机关248.58.58.5 商业服务业5419.119.127.7 文教卫生18 6.4 6.434.0 公交建筑业15 5.3 5.339.4 Valid 经营性公司18 6.4 6.445.7学校15 5.3 5.351.1 一般农户3512.412.463.5 种粮棉专业 4 1.4 1.464.9 户

WORD 格式整理种果菜专业 10 3.5 3.568.4 户工商运专业 3412.112.180.5户退役人员17 6.0 6.086.5 金融机构3512.412.498.9 现役军人3 1.1 1.1100.0 Total282100.0100.0 年龄 Frequency Percent Valid Cumulative Percent Percent 20 岁以下4 1.4 1.4 1.4 20~35 岁14651.851.853.2 Valid 35~50 岁9132.332.385.5 50 岁以上4114.514.5100.0 Total282100.0100.0