统计学实验报告书频数分布图表等

合集下载

实验一 频数表的制作(示例)-

实验一 频数表的制作(示例)-

实验一:频数分布表的编制统计学的最基本工作是收集数据。

把原始数据收集上来之后,首先要对数据进行整理并分析这些数据的特性和变化规律。

生物统计学中经常遇到的数据有两种类型,一种是连续型数据(continuous data),又称为计量数据(measurement data);另一种是离散型数据(discrete data),又称为计数数据(count data)。

描述数据变化规律的最简单方法是将这些数据列成频数表(frequency table)。

1、离散型数据频数分布表的制作例1:检查200丛稻遗株,每丛内越冬三化螟幼虫的原始调查资料如下(见SAS程序),试编制频数分布表。

data freq_01; input x @@; cards;1 1 0 02 0 0 1 0 2 1 0 1 1 0 1 0 03 0 2 1 0 0 1 0 1 0 0 1 0 1 0 1 0 0 0 0 5 0 1 0 0 0 04 2 0 0 3 0 4 1 3 1 4 0 1 2 6 0 3 2 1 0 2 0 0 1 1 0 0 0 0 0 0 0 0 2 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 02 0 1 0 1 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1 1 1 0 0 0 1 1 1 0 0 1 1 1 0 1 0 0 0 1 1 0 0 0 0 0 1 0 1 1 1 0 0 0 0 0 0 0 1 1 0 0 0 0 1 0 0 0 0 1 0 1 1 0 0 0 0 0 1 0;proc freq; run;运行结果:2 连续型数据频数分布表的制作例2:在广州天河区称量106头越冬三化螟幼虫的体重(单位:毫克),根据原始资料(见SAS程序),以6毫克为组距,分成13组,第一组下限为10毫克,制作频数分布表。

统计学课内实验报告(详解+心得)1

统计学课内实验报告(详解+心得)1

一.实验目的与要求(一)目的实验一: EXCEL的数据整理与显示1. 了解EXCEL的基本命令与操作、熟悉EXCEL数据输入、输出与编辑方法;2. 熟悉EXCEL用于预处理的基本菜单操作与命令;3. 熟悉EXCEL用于整理与显示的基本菜单操作与命令。

实验二: EXCEL的数据特征描述、抽样推断熟悉EXCEL用于数据描述统计、抽样推断实验三: 时间序列分析掌握EXCEL用于移动平均、线性趋势分析的基本菜单操作与命令。

实验四: 一元线性回归分析掌握EXCEL用于相关与回归分析的基本操作与命令。

(二)要求1.按要求认真完成实验任务中规定的所有练习;2.实验结束后要撰写格式规范的实验报告, 正文统一用小四号字, 必须有页码;3、实验报告中的图表制作要规范, 图表必须有名称和序号;4、实验结果分析既要简明扼要, 又要能说明问题。

二、实验任务实验一根据下面的数据。

1.1用Excel制作一张组距式次数分布表, 并绘制一张条形图(或柱状图), 反映工人加工零件的人数分布情况。

从某企业中按随即抽样的原则抽出50名工人, 以了解该企业工人生产状况(日加工零件数):117 108 110 112 137 122 131 118 134 114 124 125 123127 120 129 117 126 123 128 139 122 133 119 124 107133 134 113 115 117 126 127 120 139 130 122 123 123128 122 118 118 127 124 125 108 112 135 5091.2整理成频数分布表, 并绘制直方图。

1.3 假设日加工零件数大于等于130为优秀。

实验二百货公司6月份各天的销售额数据如下(单位:万元)257 276 297 252 238 310 240 236 265 278271 292 261 281 301 274 267 280 291 258272 284 268 303 273 263 322 249 269295(1)计算该百货公司日销售额的均值、众数、中位数;(2)计算该百货公司日销售额的极差、标准差;(3)计算日销售额分布的偏态系数和峰度系数。

《医学统计学》统计描述 (1)

《医学统计学》统计描述  (1)

2500 2500 2500 420
500 500 500
甲 乙丙
例4-9,etc
1.极差(Range) (全距)
符号:R 意义:反映全部变量值的
R X max X min
变动范围。
580
优点:简便,如说明传染病、
560 540
食物中毒的最长、最短潜 520
伏期等。
500
缺点:1. 只利用了两个 极端值
表2-2 115名正常成年女子血清转氨酶(mmol/L)含量分布
转氨酶含量
人数
12~
2
15~
9
18~
14
21~
23
24~
19
27~
14
30~
11
33~
9
36~
7
39~
4
42~45
3
人数
25
20 15
10 5
0
13.5 19.5 25.5 31.5 37.5 43.5. 血清转氨酶(mmol/L)
图2-2 115名正常成年女子血清转氨酶的频数分布
lg 表示以10为底的对数;
lg 1表示以10为底的反对数
X 0,为正值 (0,负数?)
几何均数的适用条件与实例
适用条件:呈倍数关系的等比资料或对数正态分 布(正偏态)资料;如抗体滴度资料
例 血清的抗体效价滴度的倒数分别为:10、
100、1000、10000、100000,求几何均数。
XG
lg1
图 2-3 101 名 正 常 人 血 清 肌 红 蛋 白 的 频 数 分 布
2. 描述计量资料的分布特征
①集中趋势(central tendency):变量值集中 位置。本例在组段“4.7~4.9”。

统计学实验

统计学实验

统计学实验内容一、频数统计1.A公司在招聘时采用了综合能力测试(满分为100分),由于应聘的人数较多,现随机抽取了157名应聘者的测试成绩,其测试分数的数据如book1所示。

(1)根据上面的资料,进行分组,并确定组数和组距。

根据资料判断,进行分组,分为六组,组距为10。

(2)编制频率分布表上限成绩频数频率19 10~20 16 0.10191129 20~30 27 0.17197539 30~40 56 0.35668849 40~50 39 0.24840858 50~60 14 0.08917268 60~70 5 0.031847合计157接收频率累积 %19 16 10.19%29 27 27.39%39 56 63.06%49 39 87.90%59 14 96.82%69 5 100.00%其他0 100.00%(3)画出直方图。

2. 为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。

服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。

调查结果见book2。

(1) 指出表中的数据属于什么类型?定序型(2) 制作一张频数分布表;服务质量等级频数频率1 A 14 0.142 B 21 0.213 C 32 0.324 D 18 0.185 E 15 0.15合计100(3)绘制一张条形图,反映服务质量的分布。

等量质计数项:服务质量等级服务质量等级汇总A 14B 21C 32D 18E 15总计100二、参数估计1.已知灯管使用寿命服从正态分布,其标准差为50小时。

现从一批产品中抽取25个作为样本,测得其平均使用寿命为1600小时,要求在95%的概率保证下估计该批产品平均使用寿命的置信区间。

(运用CONFIDENCE函数)标准差50置信度0.95样本容量25平均值1600极限误差19.59964置信区间1580.4 1619.6抽样平均误差 19.59964,置信区间即(1580.4003~1619.59964)2.在一篇关于“通货紧缩”的文章中,作者考察了各种各样投资的收益情况。

统计学中的频数分布与频率分布

统计学中的频数分布与频率分布

统计学中的频数分布与频率分布统计学是一门研究数据收集、分析和解释的学科,而频数分布与频率分布是统计学中常用的数据展示方法。

它们能够帮助我们更好地理解数据的特征和分布规律。

一、频数分布频数分布是将数据按照不同数值进行分类,并统计每个数值出现的次数,从而得到一个数据表。

以下是一个关于某班级学生考试成绩的频数分布表:成绩范围频数60-69 570-79 880-89 1290-100 10通过这个表格,我们可以直观地看到学生在各个成绩范围内的分布情况。

例如,在80-89分数段内,有12个学生获得了这个分数范围内的成绩。

频数分布表不仅可以展示数据的分布情况,还能帮助我们计算各个分数段内学生人数的百分比。

二、频率分布频率分布是通过统计每个数值出现的次数,然后将次数转化为频率(占总数的比例),得到一个数据表。

以下是使用相同数据的频率分布表:成绩范围频率60-69 0.2570-79 0.480-89 0.690-100 0.5与频数分布表相比,频率分布表更加直观地展示了各个成绩范围内学生所占的比例。

例如,在80-89分数段内的学生占总人数的0.6,即60%。

频数分布和频率分布都能够帮助我们更好地理解数据的特征和分布规律。

它们的选择取决于我们想要表达的信息。

如果我们更关注每个数值出现的次数,那么使用频数分布表更为合适;如果我们更关注各个数值所占的比例,那么使用频率分布表更为合适。

总结起来,频数分布和频率分布是统计学中常用的数据展示方法。

通过这些分布表,我们可以更加直观地了解数据的特征和分布规律,从而做出更准确的统计和分析。

在实际应用中,我们可以根据具体情况选择合适的分布表来展示数据。

统计学实验报告

统计学实验报告

统计学实验报告姓名:田媛学号:20092771 班级:营销0901 成绩:一、实验步骤总结:成绩:实验一:数据的搜集与整理1.数据收集:(1)间接数据的搜集。

有两种方法,一种是直接进入网站查询数据,另一种是使用百度等搜索引擎。

(2)直接数据的搜集。

直接统计数据可以通过两种途径获得:一是统计调查或观察,二是实验。

统计调查是取得社会经济数据的最主要来源,它主要包括普查、重点调查、典型调查、抽样调查、统计报表等调查方式。

2.数据的录入:数据的录入是将搜集到的数据直接输入到数据库文件中。

数据录入既要讲究效率,又要保证质量。

3.数据文件的导入:Excel数据文件的导入是将别的软件形成的数据或数据库文件,转换到Excel工作表中。

导入的方法有二,一是使用“文件-打开”菜单,二是使用“数据-导入外部数据-导入数据”菜单,两者都是打开导入向导,按向导一步步完成对数据文件的导入。

4.数据的筛选:数据的筛选是从大数据表单中选出分析所要用的数据。

Excel中提供了两种数据的筛选操作,即“自动筛选”和“高级筛选”。

5.数据的排序:Excel的排序功能主要靠“升序排列”(“降序排列”)工具按钮和“数据-排序”菜单实现。

在选中需排序区域数据后,点击“升序排列“(“降序排列”)工具按钮,数据将按升序(或降序)快速排列。

6.数据文件的保存:保存经过初步处理的Excel数据文件。

可以使用“保存”工具按钮,或者“文件-保存”菜单,还可以使用“文件-另存为”菜单。

实验二:描述数据的图标方法1.频数频率表:(一)Frequency函数使用方法举例:假设工作表里列出了考试成绩。

这些成绩为79、85、78、85、83、81、95、88 和97,并分别输入到单元格A1:A9。

这一列考试成绩就是data_array。

Bins_array 是另一列用来对考试成绩分组的区间值。

在本例中,bins_array 是指C4:C6 单元格,分别含有值70、79 和89。

统计学(第三版课后习题答案) 贾俊平版

统计学(第三版课后习题答案) 贾俊平版

区分指标与标志,总量指标分类、分配数列、上限不在内原则、各种平均数之间的关系、平均发展指标!计算可能考的公式有:计划完成情况相对指标、结构(比例/比较/强度/动态)相对指标、各种平均数算法、众数、中位数、四分位数、平均差、标准差、标准差系数、偏态和峰度、发展速度和增长速度、总指数(很重要)、平均指标指数、重要经济指数的编制(上证指数、工业产品产量总指数、农副产品收购价格指数)统计学(第三版课后习题答案) 贾俊平版2.1 (1)属于顺序数据。

(2)频数分布表如下:服务质量等级评价的频数分布服务质量等级家庭数(频率)频率%A1414B2121C3232D1818E1515合计100100(3)条形图(略)2.2 (1)频数分布表如下:(2)某管理局下属40个企分组表按销售收入分组(万元)企业数(个)频率(%)先进企业良好企业一般企业落后企业11119927.527.522.522.5合计40 100.0 2.3 频数分布表如下:某百货公司日商品销售额分组表按销售额分组(万元)频数(天)频率(%)25~30 30~35 35~40 40~45 45~5046159610.015.037.522.515.0合计40 100.0 直方图(略)。

2.4 (1)排序略。

(2)频数分布表如下:100只灯泡使用寿命非频数分布按使用寿命分组(小时)灯泡个数(只)频率(%)650~660 2 2660~670 5 5670~680 6 6680~690 14 14690~700 26 26700~710 18 18710~720 13 13720~730 10 10730~740 3 3740~750 3 3合计100 100 直方图(略)。

2.5 (1)属于数值型数据。

(2)分组结果如下:分组天数(天)-25~-20 6-20~-15 8-15~-10 10-10~-5 13-5~0 120~5 45~10 7合计60(3)直方图(略)。

应用统计学实验报告

应用统计学实验报告

《应用统计学》实验报告班级:管121班姓名:学号:北京建筑大学2015年01月实验1 描述统计 (3)一、实验目的与要求 (3)二、实验原理 (3)三、实验步骤 (3)1.频数分析(Frequencies) (3)2.描述统计(Descriptives) (8)实验2 统计推断 (11)一、实验目的与要求 (11)二、实验原理 (11)三、实验演示内容与步骤 (11)1.单个总体均值的区间估计 (12)2.两个总体均值之差的区间估计 (14)4.两独立样本的假设检验(两独立样本T检验) (17)5.配对样本T检验 (19)实验1 描述统计一、实验目的与要求统计分析的目的在于研究总体特征。

但是,由于各种各样的原因,我们能够得到的往往只能是从总体中随机抽取的一部分观察对象,他们构成了样本,只有通过对样本的研究,我们才能对总体的实际情况作出可能的推断。

因此描述性统计分析是统计分析的第一步,做好这一步是进行正确统计推断的先决条件。

通过描述性统计分析可以大致了解数据的分布类型和特点、数据分布的集中趋势和离散程度,或对数据进行初步的探索性分析(包括检查数据是否有错误,对数据分布特征和规律进行初步观察)。

二、实验原理描述统计是统计分析的基础,它包括数据的收集、整理、显示,对数据中有用信息的提取和分析,通常用一些描述统计量来进行分析。

集中趋势的特征值:算术平均数、调和平均数、几何平均数、众数、中位数等。

其中均数适用于正态分布和对称分布资料,中位数适用于所有分布类型的资料。

离散趋势的特征值:全距、内距、平均差、方差、标准差、标准误、离散系数等。

其中标准差、方差适用于正态分布资料,标准误实际上反映了样本均数的波动程度。

分布特征值:偏态系数、峰度系数、他们反映了数据偏离正态分布的程度。

三、实验步骤1.频数分析(Frequencies)实验数据1:表2.7为某班级16位学生的身高数据,对其进行频数分析,并对实验报告作出说明。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
年份
t
y
ty
t*t
a
b
Yc=a+bt
2000
-4
217
-868
16
260.7778
14.26667
203.7111
2001
-3
230
-690
9
260.7778
14.26667
217.9778
2002
-2
225
-450
4
260.7778
14.26667
232.2444
2003
-1
248
-248
1
260.7778
1.进入excel系统,输入计算机系统的全部数据,再输入“计算指标”,“计算公式”
2.利用各公式计算相应的指标数值
3.按照区间估计的方法进行区间估计
五、原始数据记录
(一)制作频数分布图表(以40名学生的考试)
89、88、76、99、74、60、82、60、89、86
93、99、94、82、77、79、97、78、95、92
(三)长期趋势预测(某地区2000到2008年粮食产量资料,预测2011年的粮食产量)
1. 进入excel系统,输入试验项目的有关数据(年份、数量、序号)
2.建立直线形式方程Yc=a+bt,利用最小平方法原理分别计算a,b的参数
3.将a、b参数带入直线形式方程Yc=a+bt,预测所需年份的产量
(四)抽样调查与区间估计(某厂随机抽取40名工人的日产量,以此估计所有工人平均日产量的单位)
学号
学生实验报告书
2010~2011学年第2学期
教学单位:经管系
实验课程:统计学
实验地点:实验楼509
指导教师:肖荣太
专业班级:
学生姓名:
2011年5月19日
实 验 报 告
实验课程名称:统计学原理
实验项目名称
(一)制作频数分布图表
(二)计算描述统计量
(三)长期趋势预测
(四)抽样调查与区间估计
实验日期
2
280
2007
3
309
2008
4
343
(四)抽样估计(某厂随机抽取40名工人的日产量,以此估计所有工人平均日产量的单位)
日产量数据
97
88
123
115
119
158
112
146
117
108
105
110
107
137
120
136
125
127
142
118
103
87
115
114
117
124
129
138
100
303.5778
2008
4
343
1372
16
260.7778
14.26667
317.8444
2011
7
260.7778
14.26667
360.6444
合计
2347
856
60
2707.644
(四)抽样估计(某厂随机抽取40名工人的日产量,以此估计所有工人平均日产量的单位)
指标名称
计算公式
计算数据
样本指标个数
列1
平均
2214.033
标准误差
33.60355
中位数
2217
众数
2193
标准差
184.0542
方差
33875.96
峰度
-1.20563
偏度
-0.08495
区域
604
最小值
1900
最大值
2504
求和
66421
观测数
30
最大(1)
2504
最小(1)
1900
置信度(95.0%)
68.72698
(三):长期趋势预测(某地区2000年到2008年粮食产量资料,预测2011年粮食产量资料。)
(二)计算描述统计量(以某煤矿6月原煤日产量为例)
计算平均指标和标志变动度的原理和excel系统
(三)用最小平方法进行长期趋势预测的原理及excel系统
(四)抽样调查与区间估计:抽样推断的原理和excel系统
三、实验主要仪器设备及耗材
(一)制作频数分布图表:计算机和计算机互联网
(二)计算描述统计量(以某煤矿6月原煤日产量为例):计算机、互联网系统
14.26667
246.5111
2004
0
242
0
0
260.7778
14.26667
260.7778
2005
1
253
253
1
260.7778
14.26667
275.0444
2006
2
280
560
4
260.7778
14.26667
289.3111
2007
3
309
927
9
260.7778
14.26667
COUNT(A2:A41)
4
样本平均值
AVERAGE(A2:A41)
99.25
样本标准差
STDEV(A2:A41)
5.909032634
抽样平均误差
D4/SQRT(D2)
2.954516317
置信水平
0.95
0.95
自由度
D2-1
39
t值
TINV(1-D6,D7)
2.022690901
误差范围
D8*D5
2361、2345、2382、2282、2390、2450、2424、2468、2500、2504
(三)长期趋势预测(某地区2000到2008年粮食产量资料,预测2011年的粮食产量)
年份
t
y
2000
-4
217
2001
-3
230
2002
-2
225
2003
-1
248
2004
0
242
2005
1
253
2006
2011-5-19
2011-5-19
2011-5-20
2011-5-20
实验者
专业班级
组别
预习成绩
实验报告
成绩
总成绩
一、实验目的、意义
(一)制作频数分布图表
1.进一步熟悉次数分布的原理概念。
2.掌握计算机制作次数分布图表的方法。
(二)计算描述统计量(某煤矿六月份的原煤日产量为例)
1.熟悉计算平均数、标准差、方差等统计量的方法
5.976073272
置信下限
D3-D9
93.27392673
置信上限
D3+D9
105.2260733
教师签字:
103
92
95
113
126
107
108
105
119
127
104
六、数据处理及结果分析(可加页)
(一)制作频数分布图表(40名学生的考试成绩的分布表)
接收
频率
累积 %
60
4
10.00%
70
6
25.90
12
80.00%
100
8
100.00%
其他
0
100.00%
(二)计算描述统计量(以某煤矿6月原煤日产量为例)
(二)计算描述统计量(以某煤矿6月原煤日产量为例)
1.进入excel系统,输入试验项目的所有数据(以某煤矿6月原煤日产量为例)
2.选择工具,拉下菜单,选择数据分析。
3、在对话框中选择描述统计,选确定
4、在对话框中,输入区中键入试验项目输入的范围($A$2:$A$31)在输出区建任意行任意列,选择确定
2.掌握计算机计算平均数的标准差、方差等统计量的方法
(三)长期趋势预测
1.进一步熟悉,用最小平方法进行长期趋势预测
2.掌握计算机进行长期趋势预测的方法
(四)抽样调查与区间估计
1.进一步熟悉区间估计的方法
2.掌握计算机区间估计的方法
二、实验基本原理
(一)制作频数分布图表:利用次数分布的原理和excel系统。
(三)长期趋势预测:计算机,互联网系统
(四)抽样调查与区间估计:计算机,互联网系统
四、实验主要操作步骤
(一)制作频数分布图表
1.进入excel系统,输入试验项目的所有数据(以40名学生的考试)。
2.选择工具,拉下菜单,选择数据分析。
3. 在对话框中选择“直方图”,选择“确定”。
4.在对话框输入区域中键入试验项目数据的范围(A2——A41),在接受区键入分组范围(B2——B6),在输出区域键入任意列,在选择累计百分比和输出图表。
87、84、79、65、98、67、59、71、84、85
56、81、77、73、65、66、83、63、79、70
(二)计算描述统计量(以某煤矿6月原煤日产量为例)
2010、2025、2042、1910、1960、2101、2050、2130、2152、2103
2080、2193、2204、2230、1965、1900、2280、2300、2342、2338
相关文档
最新文档