@2017.3.16-统计学-计量资料的统计描述方法

@2017.3.16-统计学-计量资料的统计描述方法
@2017.3.16-统计学-计量资料的统计描述方法

计量资料的统计描述方法

怎样表达一组数据?

描述计量资料的常用指标—

A 、描述平均水平(中心位置):

均数X 、中位数和百分位数、几何均数G 、众数(mode ) B 、描述数据的分散程度:

标准差、四分位数间距、 变异系数、方差、全距

(一)均数mean 和标准差standard deviation

1. (算术)均数X

均数是描述一组计量资料平均水平或集中趋势的指标。 *直接计算公式:

应用条件:适用于对称分布,特别是正态分布资料。

2. 中位数(median )M 和百分位数(percentile )

A.中位数M

是将一组观察值从小到大排序后,居于中间位置的那个值或两个中间值的平均值。 应用条件:

12n

X

X X X X n

n

+++==

∑L

用于任何分布类型,包括偏态资料、两端数据无界限的资料。 计算:

n 为奇数时--

n 为偶数时--

9人数据:12,13,14, 14, 15, 15, 15, 17, 19天

B.百分位数

是将N 个观察值从小到大依次排列,再分成100等份,对应于X%位的数值即为第X 百分位数。中位数是第百分50位数。

四分位数间距(quartile range )

=第25百分位数(P25)~第75百分位数(P75)。

四分位数间距用于描述偏态资料的分散程度(代替标准差S ),包含了全部观察值的一半。

)

(天1552

19===+X X M 88451

22221415214.5()

M X X X X ??

==== ???+如果只调查了前八位中学生,则:

+(+)(+)天

百分位数计算(频数表法):

X L :第X 百分位数所在组段下限 L Σf :小于X L 各组段的累计频数 X i :第X 百分位数所在组段组距

n :总例数f x :所在组段频数

注:有的教材X= r ;

L f ∑=C

例:求频数表的第25、第75百分位数(四分位数间距)

组段 频数f 累积频数∑f 56~ 2 2 59~ 5 7 62~ 12 19 ∑f 25

L 2565~

15 34 P 25在此

68~ 25 59 71~ 26 85∑f 75

L 7574~

19 104 P 75在此

77~ 15 119 80~ 10 129 83~85

1 130

合计

130

① 确定Px 所在组段:

P 25所在的组段:n X %=130×25%=32.5,

65~组最终的累积频数=34,32.5落在65~组段内;

P 75所在的组段:n X %=130×75%=97.5, 此值落在74~组段 ② 确定Px 所在组段的X L 、X i 、f x 、L Σf ③P 25=65+3x[(130x25%-19)/15]=65.90

P 75=74+3x[(130x75%-85)/19]=74.66

四分位数间距=65.90~74.66 (次/分)

3.几何均数G (geometric mean )

应用:

适用于成等比数列的资料,特别是服从对数正态分布资料。 原始数据分布不对称,经对数转换后呈对称分布的资料。 可用于反映一组经对数转换后呈对称分布或正态分布的变量值在数量上的平均水平。例如抗体滴度。

计算:N 个数值的乘积开N 次方, 即为这N 个数的几何均数。

有8份血清的抗体效价分别为1:5, 1:10, 1:20, 1:40, 1:80, 1:160,1:320,1:640,求平均抗体效价。使用分母计算!

121

lg 1lg (lg lg lg )lg lg n G X G X X X n n X

G n

-==+++=

=∑∑L 为正值

,为底的反对数表示以为底的对数;表示以

010lg 10lg 1>-X 57.566403201608040201058=???????=G 1

lg [(lg5lg10lg20lg640)/8]56.57

G -=++++=L

平均抗体效价为: 1:57 加权法:

众数

是一组观察值中出现频率最高的那个观察值;若为分组资料,众数则是出现频率最高的那个

组段的组中值。适用于大样本但较粗糙。

例:有16例病人的发病年龄为42,45,48,51,52,54,55,55,58,58,58,58,61,61,62,62

,试求众数。

正态分布时:均数=中位数=众数

正(右)偏态分布时:均数>中位数>众数 负(左)偏态分布时:均数<中位数<众数

3. 标准差S

S 描述数据的分散程度.描述一组数据在其平均数周围的分布情况,若每个数据集中在其平均数周围,此平均数对这组数据的代表照就大;反之,代表性较差。

标准差S

甲组 75 80 85 90 95 100 105 n 1=7 X 1=90 s 1=10.8 乙组

45

60

75

90

105 120 135 n 2=7

X 2=90

s 2=32.4

()数据越分散 1

2

-∑-=

n X X S ,分子越大。或者

S =

标准差的5应用:

描述变异程度、计算标准误、计算变异系数、

描述正态分布、估计正常值范围

S用于正态分布资料

怎样使用均数和标准差?

论文中常用X±S描述对称、正态或近似正态分布数据的特征。

描述偏态资料的分散程度需用四分位数间距P25~P75(代替标准差S)。

方差:

方差=S2

全距R :

R= 最大值–最小值。简单,但仅利用了两端点值,稳定性差。变异系数(coefficient of variation,CV):

计算:CV=(S/X) 100%,无单位

应用:1.单位不同的多组数据比较;

2.均数相差悬殊的多组资料

什么是正态分布?

(二)正态分布(Normal distribution)

正态分布是描述连续型变量值分布的曲线. 当例数比较多时,医

学上许多资料近似服从正态分布。正态分布在统计推断上有重要的作用。

正态分布曲线理论上的特征

(1)以X= μ均数为中心, X值呈钟型分布,中央高、两端对称性减少、与X轴永不相交。

(2 )在X= μ处,f(x)取最大值(例数最多)。

(3 )正态分布由均数μ、标准差σ决定曲线的左右位置和高低形状:正态分布有两个参数,即位置参数--均数μ和形态参数--标准差σ。

若固定标准差σ,改变均数μ值,曲线沿着X轴平行移动,其形状不变。

若固定μ,σ越小,曲线形状越陡峭;反之,σ越大,曲线越平坦。

spss的数据分析报告范例

关于某地区361个人旅游情况统计分析报告 一、数据介绍: 本次分析的数据为某地区361个人旅游情况状况统计表,其中共包含七变量,分别是:年龄,为三类变量;性别,为二类变量(0代表女,1代表男);收入,为一类变量;旅游花费,为一类变量;通道,为二类变量(0代表没走通道,1代表走通道);旅游的积极性,为三类变量(0代表积极性差,1代表积极性一般,2代表积极性比较好,3代表积极性好 4代表积极性非常好);额外收入,一类变量。通过运用spss统计软件,对变量进行频数分析、描述性统计、方差分析、相关分析,以了解该地区上述方面的综合状况,并分析个变量的分布特点及相互间的关系。 二、数据分析 1、频数分析。基本的统计分析往往从频数分析开始。通过频数分地区359个人旅游基本 状况的统计数据表,在性别、旅游的积极性不同的状况下的频数分析,从而了解该地区的男女职工数量、不同积极性情况的基本分布。 统计量 积极性性别 N 有效359 359 缺失0 0 首先,对该地区的男女性别分布进行频数分析,结果如下

性别 频率百分比有效百分 比 累积百分 比 有效女198 55.2 55.2 55.2 男161 44.8 44.8 100.0 合计359 100.0 100.0 表说明,在该地区被调查的359个人中,有198名女性,161名男性,男女比例分别为44.8%和55.2%,该公司职工男女数量差距不大,女性略多于男性。 其次对原有数据中的旅游的积极性进行频数分析,结果如下表: 积极性 频率百分比有效百分 比 累积百分 比 有效差171 47.6 47.6 47.6 一般79 22.0 22.0 69.6 比较 好 79 22.0 22.0 91.6 好24 6.7 6.7 98.3 非常 好 6 1. 7 1.7 100.0 合计359 100.0 100.0 其次对原有数据中的积极性进行频数分析,结果如下表: 其次对原有数据中的是否进通道进行频数分析,结果如下表:

统计学原理计算题试题及答案(最新整理)

电大专科统计学原理计算题试题及答案 计算题 1某单位40名职工业务考核成绩分别为 68 89 8884 86 87 75 73 72 68 75 82 9758 81 54 79 76 95 76 71 60 9065 76 72 76 85 89 92 64 57 83 81 78 77 72 61 70 81 单位规定:60分以下为不及格,60 — 70分为及格,70 — 80分为中,80 — 90 分为良,90 — 100分为优。 要求: (1)将参加考试的职工按考核成绩分为不及格、及格、中、良、优五组并编制一张考核成绩次数分配表; (2)指出分组标志及类型及采用的分组方法; (3)分析本单位职工业务考核情况。 解:(1) (2)分组标志为”成绩",其类型为" 的开放组距式分组,组限表示方法是重叠组限; (3)本单位的职工考核成绩的分布呈两头小,中间大的”正态分布”的形态, 说明大多数职工对业务知识的掌握达到了该单位的要求。 2.2004年某月份甲、乙两农贸市场农产品价格和成交量、成交额资料如下 价格(元/斤) 甲市场成交额(万元) 乙市场成交量(万斤) 品种

试问哪一个市场农产品的平均价格较高?并说明原因 解:先分别计算两个市场的平均价格如下: 甲市场平均价格 X m 5.5 1.375 (元 /斤) m/x 4 乙市场平均价格 X xf 5.3 1.325 (元 / 斤) f 4 说明:两个市场销售单价是相同的,销售总量也是相同的,影响到两个市场 平均价格高低不同的原因就在于各种价格的农产品在两个市场的成交量不同 3. 某车间有甲、乙两个生产组,甲组平均每个工人的日产量为 36件, 标准差为9.6件;乙组工人日产量资料如下:

习题-计量资料统计描述

计量资料统计描述----习题 1、中位数是表示变量值()的指标。 A.平均水平 B.变化范围 C.频数分布 D.相互间差别大小 E.变异程度 2、血清学滴度资料最常计算()来表示平均水平。 A.算术均数 B.中位数 C.几何均数 D.全距 E.百分位数 3、最小组段无下限或最大组段无上限的频数分布资料宜用() A.算术均数 B.中位数 C.几何均数 D.全距 E.标准差 4、原始数据同减去一个不等于零的常数后,()。 A. x 不变,S 变 B. x 变,S 不变 C. x 和S 都不变 D. x 和S 都变 E.以上均不对 5、变异系数CV()。 A.表示X 的绝对离散度 B.表示X 的相对离散度 C.表示x的绝对离散度 D.表示x的相对离散度 E.以上均不对 6、描述一组偏态分布资料的变异度,以()指标较好。 A.全距 B.标准差 C.变异系数 D.四分位数间距 E.均数 7、用均数和标准差可以全面描述()资料的特征。 A.正偏态分布 B.负偏态分布 C.正态分布和近似正态分布 D.分布不知 E.对数正态分布 8、比较身高和体重两组数据变异度大小宜采用() A.变异系数 B.标准差 C.四分位数间距 D.全距 E.方差 9、偏态分布宜用()描述其分布的集中趋势 A.算术均数 B.标准差 C.中位数 D.众数 E.百分位数 10、各观察值同乘以一个不等于0 的常数后,()不变。 A.算术均数 B.标准差 C.中位数 D.四分位数间距 E.变异系数 11、()分布的资料,均数等于中位数。 A.对称 B.左偏态 C.右偏态 D.偏态 E.以上均不对 12、随机抽查某地成年女子身高,算得均数x =160cm,标准差S=5cm,则可计算变异系数CV=------- 5 160 C.(160/5)cm D.(5/160)cm ×160 13、变异系数CV 的数值()。 A.一定大于1 B.一定小于1 C.可大于1,也可小于1 D.一定比标准差小 E.不能判定 14、列数8、-3、5、0、4、-1 的中位数是()。 、关于标准差,哪项是错误的()。 A.反映全部观察值的离散程度 B.度量了一组数据偏离平均数的大小 C.反映了均数代表性的好坏 D.不会小于算术均数 E.适用于对称分布资料 16、5 人的血清滴度为<1:20、1:40、1:80、1:160、1:320 描述平均滴度,用哪种指标较好()。 A.平均数 B.几何均数 C.算术均数 D.中位数 E.众数

年度医院医疗统计分析报告

2013年度医疗统计分析报告 综合全年医疗统计数字,对比去年同期,对期内统计数据做以分析,为医院综合工作提供参考,进一步提高医疗服务质量和工作效率。 工作效率分析,即运用统计指标来分析和评定医院工作效率,可以了解医院科室人员、设施、设备、技术、物资的利用情况。反映医院管理方面的成效和问题,对改进医院管理有重要意义。 按照国家对二级甲等医院临床医疗质量与工作效率的指标,实际床位使用率应≥85%,从此数据反映平均每天使用床位与实有床位的比例情况;平均住院日≤12天,超过则说明病床负担过重;术前平均住院日<3天,反映了术前诊断质量、术前准备质量、手术室管理水平。 我们通过分析认为,我院2013全年床位使用率还是低于范围值,平均住院日及术前住院日都在允许范围内。积极深入查找原因,及时反馈有关部门,在保证医疗质量的前提下,提高床位使用率,不仅能节省床位投资,使现有的卫生资源得到充分有效的利用,也使我们医院的技术优势能够得到充分的发挥。 一、床位使用率、平均住院日、术前平均住院日分析 1、资料与方法 资料来源于我院病案统计2013年与2012年统计数据汇总。 2、结果 表一: 3、分析 由表一可以看出:我院2013年总体床位使用率为57.40%,虽比2012年同期上升12.7%,但是离国家卫生主管部门规定≥85%的标准差距太大,依然处于低效率运行状态。 我院2013年出院病人平均住院日10.14天,同比2012年同期下降0.27天,低于规定≤12天标准,处于正常效率运行状态。

我院2013年术前平均住院日2.04天,低于规定<3天标准,处于正常效率运行状态。 从表上数据看我院2013年床位使用率低效率运行科室是妇产科和五官科。妇产科孕产妇就诊率极低,与市里专业性极强的妇、产医院竞争,实力明显薄弱。五官科亦面临同样的问题。 结果分析反映出: 我院2013年床位未得到充分利用,出院病人平均住院日处于正常效率运行状态,而床位使用率处于低效率运行,说明住院病人率低。 建议:加大人才培养力度,广招贤能充实医院卫生专业技术人员队伍,选派技术骨干进修学习,提高医疗技术水平、强化优质服务和管理力度,合理用药合理医治,降低患者治疗成本,吸引患者,提高床位运行效率。 我院2013年同比2012年同期的术前平均住院日,均处于正常效率运行状态,它反映术前诊断质量、术前准备质量、手术安排合理性、手术室管理均达到标准水平。 二、门诊诊疗工作状态分析 1、来源:门诊工作数据来源主要通过门诊电脑就诊挂号系统提取,并每月定期收集门诊专家工作日志,深入查看门诊患者的入住率。 2、结果:2013及2012年门诊工作量对比 表二 3、结果分析: 2013年我院门诊工作量同比2012年同期增长21.80%。 门诊量增长幅度不是太大,因素:2013年上半年诊疗工作在老院,下半年10月搬迁入新住院楼,千头万绪,新环境、新设备,医务人员缺口大,业务工作于2013年年底才基本进入有序轨道运行。 建议:2014年国家还会加大医疗保险的投入,社会保险人群大幅度增加,尤其是新农合报销比例也在不断增加,大形势越好竞争也就越激烈,我们还得在宣传力度和医疗技术与服务上投大力气、下大功夫吸引患者,加上我院几年来一直深入农村、村屯、各农牧场开展免费诊疗,随队人员都是主任医师、副主任医师,我们一定能克服客观困难,争取提高工作量。 三、临床诊断质量分析 1、来源:医疗统计系统提取报表数据 2、对照

统计学原理(第五版)》习题计算题答案详解

《统计学原理(第五版)》习题计算题答案详解 第二章 统计调查与整理 1. 见教材P402 2. 见教材P402-403 3. 见教材P403-404 第三章 综合指标 1. 见教材P432 2. %86.12270 25 232018=+++= 产量计划完成相对数 3. 所以劳动生产率计划超额%完成。 4. %22.102% 90% 92(%)(%)(%)=== 计划完成数实际完成数计划完成程度指标 一季度产品单位成本,未完成计划,还差%完成计划。 5. %85.011100%8% 110% 1=?++==计划完成数实际完成数计划完成程度指标计划完成数;所以计划完成数实际完成数标因为,计划完成程度指%105%103= = 1.94%%94.101% 103% 105,比去年增长解得:计划完成数==()得出答案)将数值带入公式即可以计算公式, 上的方程,给大家一个很多同学都不理解也可以得出答案,鉴于(根据第三章天)。 个月零天(也即是个月零(月)也就是大约)(上年同季(月)产量达标季(月)产量超出计划完成产量 达标期完成月数计划期月数超计划提前完成时间达标期提前完成时间完成计划的时间万吨。根据公式:提前多出万吨,比计划数万吨产量之和为:季度至第五年第二季度方法二:从第四年第三PPT PPT 6868825.8316-32070 -7354-60--3707320181718=+=+=+==+++()天完成任务。个月零 年第四季度为止提前(天),所以截止第五)(根据题意可设方程:万吨完成任务。天达到五年第二季度提前万吨。根据题意,设第万吨达到原计划,还差万吨产量之和为:季度至第五年第一季度方法一:从第四年第二6866891 -91*20)181718(1916707016918171816=++++=+++x x x

@2017.3.16-统计学-计量资料的统计描述方法

计量资料的统计描述方法 怎样表达一组数据? 描述计量资料的常用指标— A 、描述平均水平(中心位置): 均数X 、中位数和百分位数、几何均数G 、众数(mode ) B 、描述数据的分散程度: 标准差、四分位数间距、 变异系数、方差、全距 (一)均数mean 和标准差standard deviation 1. (算术)均数X 均数是描述一组计量资料平均水平或集中趋势的指标。 *直接计算公式: 应用条件:适用于对称分布,特别是正态分布资料。 2. 中位数(median )M 和百分位数(percentile ) A.中位数M 是将一组观察值从小到大排序后,居于中间位置的那个值或两个中间值的平均值。 应用条件: 12n X X X X X n n +++== ∑L

用于任何分布类型,包括偏态资料、两端数据无界限的资料。 计算: n 为奇数时-- n 为偶数时-- 9人数据:12,13,14, 14, 15, 15, 15, 17, 19天 B.百分位数 是将N 个观察值从小到大依次排列,再分成100等份,对应于X%位的数值即为第X 百分位数。中位数是第百分50位数。 四分位数间距(quartile range ) =第25百分位数(P25)~第75百分位数(P75)。 四分位数间距用于描述偏态资料的分散程度(代替标准差S ),包含了全部观察值的一半。 ) (天1552 19===+X X M 88451 22221415214.5() M X X X X ?? ==== ???+如果只调查了前八位中学生,则: +(+)(+)天

百分位数计算(频数表法): X L :第X 百分位数所在组段下限 L Σf :小于X L 各组段的累计频数 X i :第X 百分位数所在组段组距 n :总例数f x :所在组段频数 注:有的教材X= r ; L f ∑=C 例:求频数表的第25、第75百分位数(四分位数间距) 组段 频数f 累积频数∑f 56~ 2 2 59~ 5 7 62~ 12 19 ∑f 25 L 2565~ 15 34 P 25在此 68~ 25 59 71~ 26 85∑f 75 L 7574~ 19 104 P 75在此 77~ 15 119 80~ 10 129 83~85 1 130 合计 130 ① 确定Px 所在组段: P 25所在的组段:n X %=130×25%=32.5, 65~组最终的累积频数=34,32.5落在65~组段内;

统计学计算题答案..

第 1 页/共 12 页 1、下表是某保险公司160名推销员月销售额的分组数据。书p26 按销售额分组(千元) 人数(人) 向上累计频数 向下累计频数 12以下 6 6 160 12—14 13 19 154 14—16 29 48 141 16—18 36 84 112 18—20 25 109 76 20—22 17 126 51 22—24 14 140 34 24—26 9 149 20 26—28 7 156 11 28以上 4 160 4 合计 160 —— —— (1) 计算并填写表格中各行对应的向上累计频数; (2) 计算并填写表格中各行对应的向下累计频数; (3)确定该公司月销售额的中位数。 按上限公式计算:Me=U- =18-0.22=17,78 2、某厂工人按年龄分组资料如下:p41 工人按年龄分组(岁) 工人数(人) 20以下 160 20—25 150 25—30 105 30—35 45 35—40 40 40—45 30 45以上 20 合 计 550 要求:采用简捷法计算标准差。《简捷法》 3、试根据表中的资料计算某旅游胜地2004年平均旅游人数。P50 表:某旅游胜地旅游人数 时间 2004年1月1日 4月1日 7月1日 10月1日 2005年1月1 日 旅游人数(人) 5200 5000 5200 5400 5600 4、某大学2004年在册学生人数资料如表3-6所示,试计算该大学2004年平均在册学生人数. 时间 1月1日 3月1日 7月1日 9月1日 12月31日 在册学生人数(人) 3408 3528 3250 3590 3575

统计学计算题(有答案)

1、甲乙两班同时参加《统计学原理》课程的测试,甲班平均成绩为81分,标准差为9.5分,乙 班的成绩分组资料如下: 按成绩分组学生人数(人) 60以下 4 60~70 10 70~80 25 80~90 14 90~100 2 计算乙班学生的平均成绩,并比较甲乙两班,哪个班的平均成绩更有代表性? 2、某车间有甲乙两个生产组,甲组平均每个人的日产量为36件,标准差为9.6件,乙组工人产 量资料如下: 日产量(件)工人数(人) 15 15 25 38 35 34 45 13 要求:(1)计算乙组平均每个工人的日产量和标准差 (2)比较甲乙两生产小组的日产量更有代表性 3 月份 1 2 3 4 5 6 8 11 12

库存额60 55 48 43 40 50 45 60 68 又知1月1日商品库存额为63万元,试计算上半年,下半年和全年的平均商品库存额。 4 品名单位销售额2002比2001销售量增长(%) 2001 2002 电视台5000 8880 23 自行车辆4500 4200 -7 合计9500 13080 (2)计算由于销售量变动消费者增加或减少的支出金额 5、某商店两种商品的销售额和销售价格的变化情况如下:(万元) 商品单位销售额1996比1995年销售价格提高(%) 1995 1996 甲米120 130 10 乙件40 36 12 要求:(1)计算两件商品销售价格总指标和由于价格变动对销售额的影响绝对值(2)计算销售量总指数,计算由于销售变动消费者增加或减少的支出金额

6、某企业上半年产品量和单位成本资料如下: 要求:(1)计算相关系数, 说明两个变量相关的密切程度 (2)配合回归方程,指出产量每增加1000件时,单位成本平均变动多少? 月份 产量(千克) 单位成本(元) 1 2 73 2 3 72 3 4 71 4 3 73 5 4 69 6 5 68

《统计学》计算题型与参考答案

《统计学》计算题型 (第二章)1.某车间40名工人完成生产计划百分数(%)资料如下:9065 100 102 100 104 112 120 124 98 110110 120 120 114 100 109 119 123 107 110 99 132 135 107 107 109 102 102 101 110 109 107 103 103 102 102 102 104 104 要求: (1)编制分配数列;(4分) (2)指出分组标志及其类型;(4分) (3)对该车间工人的生产情况进行分析。(2分) 解答: (1)

(2)分组标志:生产计划完成程度 类型:数量标志 (3)从分配数列可以看出,该计划未能完成计划的有4人,占10%,超额完成计划在10%以内的有22人,占55%,超额20%完成的有7人,占17.5%。反映该车间,该计划完成较好。 (第三章)2.2005年9份甲、乙两农贸市场某农产品价格和成交量、成交额资料如下: 试问哪一个农贸市场农产品的平均价格较高?(8分)并分析说明原因。(2分) 解答: (1)x 甲=∑∑m x m 1=24 8.41 6.36.314.24.21246.34.2?+?+?++=30/7=4.29(元) x 乙= ∑∑f xf = 1 241 8.426.344.2++?+?+?=21.6/7=3.09(元) (2)原因分析:甲市场在价格最高的C 品种成交量最高,而乙市场是在最低的价格A 品种成交量最高,根据权数越大其对应的变量值对平均数的作用越大的原理,可知甲市场平均价格趋近于C ,而乙市场平均价格却趋近于A ,所以甲市场平均价格高于乙市场平均价格。

统计学计算题和标准答案

企业型号价格(元/台)甲专卖店销售额(万元)乙专卖店销售量(台) A 2500 50.0 340 B 3400 115.6 260 C 4100 106.6 200 合计—272.2 — 要求:分别计算两个专卖店空调的平均销售价格,并分析平均价格差异的原因。 答案: 2某企业甲、乙两个生产车间,甲车间平均每个工人日加工零件数为65件,标准差为11件;乙车间工人日加工零件数资料如下表。试计算乙车间工人加工零件的平均数和标准差,并比较甲、乙两个生产车间哪个车间的平均日加工零件数更有代表性? 日加工零件数(件)60以下60—70 70—80 80—90 90—100 工人数(人) 5 9 12 14 10 答案: 三、某地区2009—2014年GDP资料如下表,要求: 1、计算2009—2014年GDP的年平均增长量; 2、计算2009—2014年GDP的年平均发展水平; 3、计算2009—2014年GDP的年平均发展速度和平均增长速度。

答案: x-== 年平均增长速度:100%100%22.9% 试用最小平方法配合销售额的直线趋势方程,并预测2016年的销售额将达到什么水平? 答案:2010年—2014年的数据有5项,是奇数,所以取中间为0,以1递增。设定x为-2、-1、0、1、2、 年份/销售额(y)x xy x2 2010 320 -2 -640 4 2011 332 -1 -332 1 2012 340 0 0 0 2013 356 1 356 1 2014 380 2 760 4 合计1728 0 144 10 b=∑xy/∑x2=144/10=14.4 a=∑y/n=1728/5=345.6 y=345.6+14.4x 预测2016年,按照设定的方法,到2016年应该是5 y=345.6+14.4*5=417.6元 五、某企业生产三种产品,2013年三种产品的总生产成本分别为20万元,45万元,35万元,2014年同2013年相比,三种产品的总生产成本分别增长8%,10%,6%,产量分别增长12%,6%,4%。试计算: 1、三种产品的总生产成本增长的百分比及增加的绝对额; 2、三种产品的总产量增长的百分比,及由于产量增长而增加的总生产成本; 3、利用指数体系推算单位产品成本增长的百分比。 试计算: 1、三种商品的销售额总指数; 2、三种商品的价格总指数和销售量总指数;

2019年统计学数据分析报告

统计学数据分析报告 一、调查研究方案的设计与组织实施 (一)调查目的 (1)描述和反映本校商学院14级金融系学生对于毕业去向的意向,分析并研究各意向的分布情况; (2)在专业,性别,家庭因素,个人因素等方面对毕业意向的分布进行研究,探究这些因素对于毕业意向分布的影响。(3)分析和解释形成毕业意向分布差异的因素和原因; (二)调查对象和调查单位 本次调查的基本调查对象是本校商学院金融类的部分同学。调查单位为此范围内的每一个同学。 在此基础上,在每个专业内随机抽取样本进行抽样调查,进而对整体进行推断。 (三)调查的组织和实施方法 获取资料的方法:问卷法、文献法本小组采用的基本方法为问卷法,发放问卷60份,收回问卷54份。辅助方法为文献法,通过图书馆和网络获取相关背景资料,对研究素材进行丰富和补充。调查方法:抽样调查抽样方法:分层抽样 将调查对象按专业分为金融工程、金融学和信用管理三个类别,然后从各个类别中随机抽取组成样本,用于对整体进行推断。数据资料整理结果如下:

在全部被调查对象中,男生23人,占43%,女生31人,占57%,金融学18人,占总体1/3,信用管理18人,占总体1/3,金融工程18人,占总体1/3。选择考研的有14人,占总体的26%。选择出国深造的有1人,占总体的2%。选择自主创业的有3人,占总体6%。选择直接就业的有29人,占总体54%。选择考公务员的有7人,占总体12%。 (四)调查时间和调查期限 调查时间:20XX年5月9日 调查期限:20XX年5月9日―20XX年5月14日(五)调查项目和调查表 调查项目:性别年级专业毕业意向家庭收入情况性格特点就业优势调查表如下: 二、统计数据的整理和分析 (一)总体分布情况与相关分析 根据问卷统计的数据得到的频数分布表和毕业意向分布饼图如下: 由上表可以得到以下结论: 选择直接就业的人数占总体的比例最大,占总体的54%其次是选择考研和考公务员,分别占总体的26%和12%。 选择出国深造和自主创业的人数最少,只占总体的2%和6%。可以看出大部分同学的毕业意向集中在直接就业和考研两个方面,而出国深造和自主创业对本校商学院来说仍旧是比较冷僻的意向。

统计学练习题及答案

2014统计学练习题及答案 一判断题 1、某企业全部职工的劳动生产率计划在去年的基础上提高8%,计划执行结果仅提高4%,则劳动生产率的任务仅实现一半。(错) 2、在统计调查中,调查标志的承担者是调查单位。( 错) 3、制定调查方案的首要问题是确定调查对象。( 错) 4、正相关指的就是因素标志和结果标志的数量变动方向都是上升的。( 错) 5、现象之间的函数关系可以用一个数学表达式反映出来。(对) 6.上升或下降趋势的时间序列,季节比率大于1,表明在不考虑其他因素影响时,由于季.的影响使实际值高于趋势值,(对) 7.特点是“先对比,后综合。”(错 8.隔相等的时点数列计算平均发展水平时,应用首尾折半的方法。( 错) 9.均数指数的计算特点是:先计算所研究对象各个项目的个体指数;然后将个体指数进行加权平均求得总指数。( 错) 10.和样本指标均为随机变量。( 错) 11.距数列中,组数等于数量标志所包含的变量值的个数。(对) 12.中值是各组上限和下限之中点数值,故在任何情况下它都能代表各组的一般水平。( 错) 13.标志和数量标志都可以用数值表示,所以两者反映的内容是相同的。(错) 14.变异度指标越大,均衡性也越好。( 对) 15.于资料的限制,使综合指数的计算产生困难,就需要采用综合指数的变形公式平均数指数。( 错) 16.计量是随机变量。(对) 17.数虽然未知,但却具有唯一性。(错) 18.标和数量标志都可以用数值表示,所以两者反映的内容是相同的(错) 19.以经常进行,所以它属于经常性调查(错) 20.样本均值来估计总体均值,最主要的原因是样本均值是可知的。()答案未 21.工业普查中,全国工业企业数是统计总体,每个工业企业是个体。(错) 22.标志的承担者,标志是依附于个体的。(对) 23.志表明个体属性方面的特征,其标志表现只能用文字来表现,所以品质标志不能转化为统计指标。(错) 24.标和数量标志都可以用数值表示,所以两者反映的内容是相同的。(错) 25.计指标都是用数值表示的,所以数量标志就是统计指标。(错) 26.标及其数值可以作为总体。(错) 27.润这一标志可以用定比尺度来测定。(错) 28.统计学考试成绩分别为55分,78分,82分,96分,这4个数字是数量指标。(错) 29.术学派注重对事物性质的解释,而国势学派注重数量分析。(错) 30.是统计研究现象总体数量的前提。(对) 31.析中,平均发展速度的计算方法分水平法和方程两种。(错) 32.数值越大,说明相关程度越高:同理,相关系数的数值越小,说明相关程度越低(对 33.志是总体同质性特征的条件,而不变标志是总体差异性特征的条件。(错) 34.度具有另外三种尺度的功能。(对) 35.民旅游意向的问卷中,“你最主要的休闲方式是什么?”,这一问题应归属于事实性问题

统计学计算例题及答案

计算题例题及答案: 1、某校社会学专业同学统计课成绩如下表所示。 社会学专业同学统计课成绩表 学号成绩学号成绩学号成绩101023 76 101037 75 101052 70 101024 91 101038 70 101053 88 101025 87 101039 76 101054 93 101026 78 101040 90 101055 62 101027 85 101041 76 101056 95 101028 96 101042 86 101057 95 101029 87 101043 97 101058 66 101030 86 101044 93 101059 82 101031 90 101045 92 101060 79 101032 91 101046 82 101061 76 101033 80 101047 80 101062 76 101034 81 101048 90 101063 68 101035 80 101049 88 101064 94 101036 83 101050 77 101065 83 要求: (1)对考试成绩按由低到高进行排序,求出众数、中位数和平均数。

(2)对考试成绩进行适当分组,编制频数分布表,并计算累计频数和累计频率。答案: (1)考试成绩由低到高排序: 62,66,68,70,70,75,76,76,76,76,76,77,78,79, 80,80,80,81,82,82,83,83,85,86,86,87,87,88, 88,90,90,90,91,91,92,93,93,94,95,95,96,97, 众数:76 中位数:83 平均数: =(62+66+……+96+97)÷42 =3490÷42 =83.095 (2) 按成绩 分组频数频率(%) 向上累积向下累积 频数频率(%) 频数频率(%) 60-69 3 7.143 3 7.143 42 100.000 70-79 11 26.190 14 33.333 39 92.857 80-89 15 35.714 29 69.048 28 66.667

统计学数据分析报告记录

统计学数据分析报告记录

————————————————————————————————作者:————————————————————————————————日期:

统计学数据分析报告 一、调查研究方案的设计与组织实施 (一)调查目的 (1)描述和反映本校商学院14级金融系学生对于毕业去向的意向,分析并 研究各意向的分布情况; (2)在专业,性别,家庭因素,个人因素等方面对毕业意向的分布进行研 究,探究这些因素对于毕业意向分布的影响。 (3)分析和解释形成毕业意向分布差异的因素和原因; (二) 调查对象和调查单位 本次调查的基本调查对象是本校商学院金融类的部分同学。 调查单位为此范围内的每一个同学。 在此基础上,在每个专业内随机抽取样本进行抽样调查,进而对整体进行推断。 (三)调查的组织和实施方法获取资料的方法:问卷法、文献法 本小组采用的基本方法为问卷法,发放问卷60份,收回问卷54份。 辅助方法为文献法,通过图书馆和网络获取相关背景资料,对研究素材进行丰富和补充。 调查方法:抽样调查 抽样方法:分层抽样 将调查对象按专业分为金融工程、金融学和信用管理三个类别,然后从各个类别中随机抽取组成样本,用于对整体进行推断。 数据资料整理结果如下:

在全部被调查对象中,男生23人,占43%,女生31人,占57%,金融学18人,占总体1/3,信用管理18人,占总体1/3,金融工程18人,占总体 1/3。选择考研的有14人,占总体的26%。选择出国深造的有1人,占总体的2%。选择自主创业的有3人,占总体6%。选择直接就业的有29人,占总体54%。选择考公务员的有7人,占总体12% 。 (四)调查时间和调查期限 调查时间:2016年5月9日 调查期限:2016年5月9日―2016年5月14日 (五)调查项目和调查表 调查项目:性别年级专业毕业意向家庭收入情况性格特点就业优势 调查表如下: 毕业意向 专业性别 考研出国深造自主创业直接就业考公务员金融工程男7 0 0 0 6 1 女11 2 0 0 8 1 金融学男8 2 1 0 4 1 女10 6 0 1 2 1 信用管理男8 1 0 1 5 1 女10 3 0 1 4 2 合计54 14 1 3 29 7 二、统计数据的整理和分析

(完整版)统计学复习题答案

一、主要术语 描述统计 ....:研究数据收集、处理和描述的统计学分支。 推断统计 ....:研究如何利用样本数据来推断总体特征的统计学分支。 观测数据 ....:在没有对事物进行人为控制的条件下,通过调查或观测而收集到的数据。 实验数据 ....:在实验中控制实验对象而收集到的数据。 异众比率 ....:非众数组的频数占总频数的比率。 四分位差 ....:也称为内距或四分间距,上四分位数与下四分位数之差. 。 显著性水平 .....:假设检验中发生第Ⅰ类错误的概率,记为 P-.值.:也称观察到的显著性水平或实测显著性水平,是根据样本观测值计算出来的概率。 拟合优度检验 ......:根据样本观测结果与原假设为真条件下期望结果的吻合程度,来检验总体是否服从某种分布。一般地,可以用于任何假设的概率分布。 独立性检验 .....:检验两个分类变量之间是否存在相关关系。 多个总体比例差异检验 ..........:检验多个总体比例是否都相等。 消费者物价指数 .......:又称居民消费价格指数,反映一定时期内城乡居民所购买的生活消费品价格和服务项目价格的变动程度的一种相对数。 生产者价格指数 .......:反映企业产品出厂价格变动趋势和变动程度的一种相对数。 股票价格指数 ......:是反映某一股票市场上多种股票价格变动趋势的一种相对 二.简答和计算P41—P42: 2.2比较概率抽样和非概率抽样的特点。举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。 概率抽样的特点:简单随机抽样、系统抽样(等距抽样)、分层抽样(类型抽样)和整群抽样。非概率抽样的特点:方便抽样、定额抽样、立意抽样、滚雪球抽样和空间抽样。 2.6你认为应当如何控制调查中的回答误差? 回答误差是指被调查者接受调查时给出的答案与实际不符。导致回答误差的原因有多种,主要有理解误差、记忆误差及意识误差。 调查一方在调查时可协助被调查者一方共同完成调查,被调查方不了解的调查方可帮助解释、阐明,这样可减少误差。 2.7怎样减少无回答?请通过一个例子,说明你所考虑到的减少无回答的具体措施。 可通过优选与培训采访人员、加强调查队伍管理、准确定位调查对象、保证问卷的送达率等加以预防,采取物质奖励、消除疑虑、提前告知和事中提醒等加以控制,采用多次访问、替换被调查单位、随机化回答技术等方法来降低无回答率。 2.8如何设计调查方案? 第一步:确定调查目的 第二步:确定调查对象和调查单位 第三步:确定调查项目和调查表 第四步:调查表格和问卷的设计 第五步:确定调查时间和调查方法等

统计学原理计算题及参考答案

"

}

| 1、某生产车间30名工人日加工零件数(件)如下: 30 26 42 41 36 44 40 37 37 25 45 29 43 31 36 36 49 34 47 33 43 38 42 32 34 38 46 43 39 35 要求:(1)根据以上资料分成如下几组:25—30,30—35,35—40,40—45,45—50,计算各组的频数和频率,编制次数分布表; (2) 根据整理表计算工人平均日产零件数。(20分) 解:(1)根据以上资料编制次数分布表如下:

则工人平均劳动生产率为: 17.3830 1145 == = ∑∑f xf x # 要求:(1)建立以产量为自变量的直线回归方程,指出产量每增加1000件时单位成本的平均变动是多少 、 (2)当产量为10000件时,预测单位成本为多少元(15分) x bx a y n x b n y a x x n y x xy n b c 5.28080 10703 125.232105.2615 1441502520250512503210128353)(2 2 2-=+==+=?+=-=-=-=--=-??-?= --= ∑∑∑∑∑∑∑因为,5.2-=b ,所以产量每增加1000件时, 即x 增加1单位时,单位成本的平均变动是:平均减少元 (2)当产量为10000件时,即10=x 时,单位成本为 — 55105.280=?-=c y 元

>课程的测试,甲班平均成绩为81分,标准差为分;乙班的成绩分组资料如下: 计算乙班学生的平均成绩,并比较甲.乙两班哪个班的平均成绩更有代表性 解:乙班学生的平均成绩∑∑=f xf x ,所需的计算数据见下表:

统计学调查报告

统计学课程设计大学生熬夜调查报告 班级:xxxx 学号:xxxx 姓名:xxxx

目录 一、引言 (3) 二、调查方案 (4) 三、问卷设计 (5) 四、问卷发放 (6) 五、数据分析 (7) 六、结论 (11)

一、引言 俗话说,“早睡早起身体好”,这是有一定科学道理的。人在睡眠的时候,意识相对不清楚,肌肉的随意运动停止,从而帮助大家恢复体能、巩固记忆力,其重要性仅次于呼吸和心跳,是维持健康不可缺少的。有了良好的睡眠,可以使第二天保持清醒和活力。 鉴于此,我们对身边的大一大二大三学生,进行了一次抽样问卷调查活动。本着了解如今大学生的作息基本情况,还有宣传熬夜的危害和早睡早起的良好作息习惯的目的,举行了这此调查。虽然调查持续了一个月,但颇有收益。研究目的:对于有些人,熬夜已经成为生活方式的一部分。但是,从健康的角度讲,熬夜还是害处多多的。熬夜会导致人疲劳,免疫力下降;头痛;皮肤干燥、长黑斑、青春痘等;长期熬夜还会慢慢地出现失眠、健忘、易怒、焦虑不安等神经、精神症状。通过这次探究,发现大学生熬夜状况及深层原因。这次调查包括熬夜的比例、原因等,希望以此为基础,探究大学生的熬夜现象,并且提出切实可行的解决措施,为大家的作息时间提出一点建议,减少大学生熬夜现象,同时也希望通过这份调查报告给大家带来提醒,希望大家能制定一个科学的休息时间,为生活和学习打好基础。

二、调查方案 (一)调查目的 我们想更加深入的了解与大学生的熬夜相关的一系列问题,并根据调查情况,并根据调查情况,做出调查报告。 (二)调查对象 身边的在校大学生 (三)调查单位 在校大学生共42名 (四)调查程序: 1.确定调查内容 2.设计调查问卷 3.确定调查对象及单位(采用分层抽样的方式,男生21份,女生21份),发放 问卷(采用留置调查法)并回收问卷 4.问卷整理并进行数据统计、数据分析、数据总结 5.对问卷总结分析得出结论 (五)调研期限 调研期限: 2019年12月1日—2019年12月30日 (五)调查方式 过问卷星在网上发布调查报告,对不同大学不同专业不同年级的大学生进行调查,并用统计学的方法处理数据,从而得到结果。 关键词:大学生熬夜健康 在大学,对于许多大学生来说,熬夜早已成为一种生活常态。每天的深夜 和凌晨都会看到这样的情景:宿舍的灯熄了,但是电脑的屏幕还是亮着的;校 园的街道是安静的,而宿舍的楼道依然是吵闹着的。这样的情景使大部分同学 的生活变得很不规律。或者是习惯于晚睡晚起。熬夜已成了一种习惯,不熬夜 反倒少见。因此作为一名大学生,在自己处于这种情况下,对大学生熬夜情况 很感兴趣。研究大学生熬夜情况有助于帮助大学生正确安排自己的作息时间,并 关注自己的健康。

统计学计算题答案(课后)

9. (1)工人日产量平均数: 45 60 55 140 65 260 75 150 85 50 660 =64.85(件 / 人) (2)通过观察得知,日产量的工人数最多为 260人,对应的分组为 60~70,则众数在60~70这一组中,则众数的取值范围在 60~70 之间。 利用下限公式计算众数: n x f i i i 1 n f i i 1 众数M ° (f m f m 1 )

=65.22 (件) (3)首先进行向上累计,计算出各组的累计频数: 10.(1)全距 只=最大的标志值一最小的标志值 =95—55=40 x f ⑵平均日装配部件数x ―」 55 4 65 12 75 24 85 6 95 4 50 =73.8 (个) n _ X i x f i i 1 n 260 140 (260 140 (260 15C) (70 60) 660 1 2 330.5 比较各组的累计频数和 330.5,确定中位数在60~70这一组 利用下限公式计算中位数: ~~2- S m 1 M e L 壬 60 660 200 2 (70 60) 65(件) 260 ⑷分析:由于x M e M o , 所以该数列的分布状态为左偏。 平均差 A.D

f i i 1 |55 73.8 4 |65 73.8| 12 |75 73.8| 24 |85 73.8 6 |95 73.8 4 4 12 24 6 4 =7.232 (件)

⑷标准差系数V -100% x 9.93 73.8 13.46% X i f i 30 4 50 25 70 84 90 126 110 28 267 =81.16 (件) 乙企业的平均日产量X 乙 xf j 30 2 50 8 70 30 90 42 110 18 2 (X i X) f i i 1 n f i i 1 2 2 2 2 2 (55 73.8) 4 (65 73.8) 12 (75 73.8) 24 (85 73.8) 6 (95 73.8) 4 ⑶方差 4 12 24 6 4 =98.56 (个) 标准差 n (x x)2 f i i 1 n 、、98.56 9.93(件) 13. 甲企业的平均日产量x 甲

统计学练习题及答案

第一章导论练习题 1.单选题 (1)统计研究对象的特点包括(C)。 A、总体性 B、具体性 C 、总体性和具体性D、同一性 (2)下列指标中不属于质量指标的是( D )。 A、平均价格 B 、单位成本 C 、资产负债率 D 、利润总额 (3)下列指标中不属于数量指标的是(C)。 C 、资产报酬率D、A、资产总额 B 、总人口 人口增加数 (4)描述统计和推断统计的之间的关系是( A )。 A、前者是后者的基础 B、后者是前者的基础 C 、两者没有关系 两这互为基础(5)一个统计总体(D ) A、只能有一个标志 B 、只能有一个指标 C 、可以有多个标志 D 、可以有多个指标 (6)若要了解某市工业生产设备情况,则总体单位是该市(D) A每一个工业企业 B 每一台设备 C 每一台生产设备 D 每一台工业生产设备 (7)某班学生数学考试成绩分别为65 分71 分、80 分和87 分,这四个数字是(D) A指标 B 标志C变量 D 标志值 (8)下列属于品质标志的是(B) A 工人年龄 B 工人性别C工人体重 D 工人工资 9)现要了解某机床厂的生产经营情况,该厂的产量和利润是( D )A 连续变量B 离散变量C 前者是连续变量,后者是离散变量者是连续 变量(10)劳动生产率是(B ) A 动态指标 B 质量指标 C 流量指标 D 强度指标 (11)统计规律性主要是通过运用下述方法整理、分析后得出的结论( B )D、 D 前者是离散变量,后

欢迎下载 2 A 统计分组法 B 大量观察法 C 综合指标法 D 统计推断法 (12) (C ) 是统计的基础功能 A 管理功能 B 咨询功能 C 信息功能 D 监督功能 (13) ( A )是统计的根本准则,是统计的生命线 A 真实性 B 及时性 C 总体性 D 连续性 (14)统计研究的数量是( B ) A 抽象的量 B 具体的量 C 连续不断的量 D 可直接相加的量 C ) (15 )数量指标 般表现为( A 平均数 B 相对数 C 绝对数 D 众数 (16 )指标是说明总体特征的,标志是说明总体单位特征的,所以( A ) A 指标和标志之间在一定条件下可以相互转换 B 指标和标志都是可以用数值表示的 C 指标和标志之间是不存在关系的 D 指标和标志之间的关系是固定不变 的 2. 多选题 (1) 统计学发展过程中经历的主要学派有( ABCD )。 (2) 下列标志中属于品质标志的有 ( AC )。 (3) 下列指标中属于质量指标的有( ABD )。 (4) "统计”一词含义有( BCD )。 A 统计研究 B 统计工作 C 统计资料 3?判断题 1、 现代统计学的核心是描述统计学。 ( F ) 2、 描述统计学是推断统计学的基础。 ( T ) 3、 统计指标可以分成数量指标和质量指标。 ( T ) 4、 所有标志都可以用数量表现。 ( F ) A 政治算术学派 B 国势学派 C 数理统计学派 D 社会统计学派 A 企业的经济类型 B 劳动生产率 C 企业所属的行业 D 企业的负债总额 A 平均亩产 数 B 人均钢产量 C 国民生产总值 D 存货周转次 D 统计学

相关文档
最新文档