试验统计学实验一

合集下载

辅修统计学实验课1要求与数据

辅修统计学实验课1要求与数据

辅修统计学实验课要求与数据时间地点11、13、14周周1 9-12节信息楼427实验1时间11周周一(2015.11.16)实验内容图表制作、描述性统计分析统计软件Excel, PHstat, Spss实验要求1.逐步熟悉统计软件(Excel, PHstat, Spss),掌握原始数据与统计分析结果的存储、调用和呈现方法。

2.掌握借助于统计软件进行描述性统计分析的方法:编制频数分布表,绘制直方图、茎叶图、箱线图、散点等图形,计算均值、标准差、分位数、峰度、偏度等数据数字特征。

3.完成并提交指定练习题。

试验方法详见《统计实验讲义》,周晓东。

练习题:1.为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。

服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。

调查结果见“直方图.xml”sheet2,用Excel制作一张频数分布表;以及条形图。

并同时使用SPSS绘制条形图。

2.某行业管理局所属40个企业2002年的产品销售收入数据(单位:万元)见“直方图.xml”sheet3。

要求:1) 根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率;2) 如果按规定:销售收入在125万元以上为先进企业,115~125万元为良好企业,105~115万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。

3.某百货公司连续40天的商品销售额(单位:万元)见“直方图.xml”sheet4。

要求:根据上面的数据进行适当的分组,编制频数分布表,并使用不同的工具绘制直方图。

4.为了确定灯泡的使用寿命(小时),在一批灯泡中随机抽取100只进行测试,所得结果见“茎叶图.xml”sheet3。

1)利用计算机对上面的数据进行排序;2)以组距为10进行等距分组,整理成频数分布表,并绘制直方图。

3)制做茎叶图,并与直方图作比较。

5.A,B两个班学生的数学考试成绩数据见“茎叶图.xml”sheet4。

《统计学》上机实验报告(一)

《统计学》上机实验报告(一)

《统计学》实验报告一姓名:王璐专业:财政学(税收方向)学号:2010128107日期:2012年10 月9 日地点:实验中心701实验项目一描述性统计、区间估计在EXCEL里的实现一、实验目的1、掌握利用EXCEL菜单进行数据的预处理;2、掌握利用EXCEL进行描述性统计;3、掌握利用EXCEL进行区间估计。

二、实验要求1、EXCEL环境与数据预处理的操作;2、描述性统计,包括统计图表的绘制;数据分组处理;集中趋势描述、离散程度描述、分布形状描述。

3、区间估计,包括总体均值、总体比例、总体方差的区间估计计算。

三、实验内容(一)分类数据的描述性统计实验数据:餐厅服务质量和价位评价.XLS顾客服务质量评价的频数表(按性别分)、条形图、饼图(二)数值性数据的描述性统计实验数据:城乡居民储蓄数据.XLS随着生活水平的逐渐提高,居民的储蓄存款也在日益增加,数据2.XLS是自1990年~2006年城乡居民人民币储蓄存款额,储蓄存款包括定期和活期(单位:元)。

利用EXCEL,对数据2.XLS作如下分析:1、城乡居民人民币活期存款的众数、中位数和均值是多少?2、城乡居民人民币定期存款的方差和标准差是多少?3、定期存款和活期存款相比,哪种数据的变动性更大?(三)总体参数的区间估计1、成绩分析。

实验数据:期末成绩.XLS1假设学生的各门期末考试成绩均服从正态分布,选定一门课程,并给出该门课程平均成绩的置信水平为95%的区间估计。

2、顾客满意度分析。

某超市为了了解顾客对其服务的满意度,随机抽取了其会员中的50个样品进行电话调查,如果有38个顾客对此超市的服务表示满意,试求对该超市服务满意的顾客比例的95%置信区间。

四、实验结果(一)分类数据的描述性统计A顾客服务质量评价频数表(按性别分)评价等级男女极好45 21很好98 52好49 35一般20 11差9 10B条形图C.饼状图2(二)数值性数据的描述性统计解答:1.众数:无中位数:11615.9 均值:18553.592.方差:887955495.60 标准差:29798.583.活期存款的离散系数=标准差/均值=0.963602定期存款的离散系数=标准差/均值=0.696094因为0.963602>0.696094 所以,活期存款的变动性更大(三)总体参数的区间估计解答:1.根据区间估计的计算公式:均值±半径由题可得,均值=71.89474,半径=1.312076,得出最终结果,置信区间为:(70.5827,73.2068)2.根据总体比例的区间估计公式:比例±半径由题可得,比例 p=38/50=0.76,半径=0.1184 ,得出最终结果,置信区间为:(0.6416,0.8784)五、实验心得我个人认为自己的动手能力比较差,所以在做上机实验前,心里略有担心。

统计学实验报告 一

统计学实验报告  一
⑤选中组距和频数,插入一个直方图,之后在柱形上右击,将分类间距改为0%。
⑥选中组距和频数,插入一个折线图,将名字改为灯泡耐用时间折线图。
(3)21--30学号同学绘制第二产业国内生产总值的线图。
本人学号为25,所以绘制第二产业国内生产总值的折线图。首先选中第二产业国内生产总值的数据区域,然后选中工具栏中的插入-图标,选择折线图,即可绘制线图。
3选中血型和出现的频数区域,点击工具栏中的插入,即可插入一个折线图。
(2)试将以上数据整理成组距数列,并绘制次数分布直方图和次数分布折线图。
①将题目中的表格复制到一个新的Excel中。
②选中表格中全部数据区域,在工具栏的“开始”一栏中点击“替换”,将表格中的空格全部替换掉。
③根据数据区域计算出合适的组距,并写下来。
我院任课教师有实验课的均要求有实验报告,每个实验项目要求有一份实验报告,实验报告按照格式书写完毕后,经辅
导实验的教师批改后按照实验室收集存档。
在第一节课时,觉得这门课对我来说应该不难,里边有很多内容早在大一时候便就已经学过了,因此便在不知不觉中不想再听老师的讲解,慢慢地却发现里边讲的好多内容我都不懂,老师在上课过程中的一系列操作问题我都不懂。渐渐地我终于意识到我该好好地听老师讲课,我虽然懂得一些操作,但都是平时经常用的一些基础的操作,很多的高级应用操作我都还没有接触到,而且缺乏实践经验。孰能生巧,一个人理论上再完善,没有通过大量的练习,在遇到问题时往往会不知所措。通过这门课的学习我意识到学习与实践的重要性,在以后的学习中我一定要多练习,多实践,以求自己对知识掌握得更好。以下是该门课程的主要学习内容和我的一点感悟。
3、能熟练地运用Excel创建统计表和统计图。
3.实验内容
练习一、数据的筛选与排序

统计学实验报告

统计学实验报告

统计学实验报告姓名:田媛学号:20092771 班级:营销0901 成绩:一、实验步骤总结:成绩:实验一:数据的搜集与整理1.数据收集:(1)间接数据的搜集。

有两种方法,一种是直接进入网站查询数据,另一种是使用百度等搜索引擎。

(2)直接数据的搜集。

直接统计数据可以通过两种途径获得:一是统计调查或观察,二是实验。

统计调查是取得社会经济数据的最主要来源,它主要包括普查、重点调查、典型调查、抽样调查、统计报表等调查方式。

2.数据的录入:数据的录入是将搜集到的数据直接输入到数据库文件中。

数据录入既要讲究效率,又要保证质量。

3.数据文件的导入:Excel数据文件的导入是将别的软件形成的数据或数据库文件,转换到Excel工作表中。

导入的方法有二,一是使用“文件-打开”菜单,二是使用“数据-导入外部数据-导入数据”菜单,两者都是打开导入向导,按向导一步步完成对数据文件的导入。

4.数据的筛选:数据的筛选是从大数据表单中选出分析所要用的数据。

Excel中提供了两种数据的筛选操作,即“自动筛选”和“高级筛选”。

5.数据的排序:Excel的排序功能主要靠“升序排列”(“降序排列”)工具按钮和“数据-排序”菜单实现。

在选中需排序区域数据后,点击“升序排列“(“降序排列”)工具按钮,数据将按升序(或降序)快速排列。

6.数据文件的保存:保存经过初步处理的Excel数据文件。

可以使用“保存”工具按钮,或者“文件-保存”菜单,还可以使用“文件-另存为”菜单。

实验二:描述数据的图标方法1.频数频率表:(一)Frequency函数使用方法举例:假设工作表里列出了考试成绩。

这些成绩为79、85、78、85、83、81、95、88 和97,并分别输入到单元格A1:A9。

这一列考试成绩就是data_array。

Bins_array 是另一列用来对考试成绩分组的区间值。

在本例中,bins_array 是指C4:C6 单元格,分别含有值70、79 和89。

卫生统计学第1-5次实验内容

卫生统计学第1-5次实验内容

卫生统计学第1-5次实验内容实验一统计表与统计图(一)实验目的1、掌握统计表的基本概念和列表原则;2、掌握统计图的基本概念和常用统计图的绘制方法。

(二)实验内容1、统计表常见错误的纠正。

2、常用统计图的绘制。

(三)实验资料的分析过程1. 某地调查脾肿大和疟疾临床分型的关系、程度与血片查疟原虫结果列表如下,此表有何缺点,请改进2.试根据下表资料绘制适当统计图形表某地1975年839例正常人发汞值分布资料(卩g/g)组段0〜0.2〜0.4〜0.6〜0.8〜 1.0〜 1.2〜 1.4〜1.6〜2.2 合计例数133 193 190 111 83 34 43 16 36 8393. 根据下表分别绘制普通线图和半对数线图,并说明两种统计图型的意义。

某地某年食管癌年龄别发病率(1/10万)年龄(岁)男女40〜 4.4 2.145〜7.2 3.350〜7.3 4.555〜 6.9 5.560〜19.3 6.765〜50.2 16.470〜68.5 12.575〜86.2 19.980〜97.0 15.2实验二计量资料的统计描述(一)实验目的1、掌握各种平均数指标的计算及其适用条件;2、掌握离散趋势指标标准差的计算及其适用条件;3、熟悉频数表和直方图的绘制方法。

(二)实验内容1、编制大样本定量资料的频数分布表,了解资料的分布规律;2、算术均数、几何均数、中位数、极差、标准差的计算,医学参考值范围的制订。

(三)实验资料的分析过程1、某地100例30-40岁健康男子血清总胆固醇值(mg/dl)测定结果如下:202 165 199 234 200 213 155 168 189 170 188 168 184147219 174 130 183178 174 228 156 171 199 185 195 230 232 191 210 195 165178172 124 150 211177 184 149 159 149 160 142 210 142 185 146 223 176 241164197 174 172 189174 173 205 224 221 184 177 161 192 181 175 178 172 136222113 161 131 170138 248 153 165 182 234 161 169 221 147 209 207 164 147210182 183 206 209201 149 174 253 252 156(1)编制频数分布表并画出直方图;(2)根据频数表计算均值和中位数,并说明用哪一个指标比较合适;(3)计算百分位数P5、P25、P75和P95。

统计学原理实验指导书

统计学原理实验指导书

百度文库- 让每个人平等地提升自我!统计学原理实验指导书经济学院编二○○八年二月统计学原理实验一数据的整理与显示一、实验目的通过本次实验,掌握用EXCEL对数据进行整理、加工、作图,以发现数据中的一些基本特征,为进一步分析提供思路。

二、实验性质必修,基础层次三、主要仪器及试材计算机及EXCEL软件四、实验内容1.数据的预处理2.品质数据的整理与显示3.数值型数据的整理与显示五、实验学时2学时六、实验方法与步骤1.开机;2.找到“统计学原理实验一数据”,打开EXCEL文件;3.按要求完成上机作业,并把文件用自己学号命名保存供老师检查;4.完成实验报告,注意要对每个习题的结论与统计学解释写在实验报告上。

七、上机作业演示题:A、B两个班学生的数学考试成绩数据见“统计学原理实验一”文件的“book3.演示”。

①将两个班的考试成绩用一个公共的分组体系编制分布表;并计算出累积频数和累积频率;②绘制复式条形图、环形图、雷达图;③分析比较两个班考试成绩的分布特点及差异;比较两个班考试成绩分布的特点3.01.某行业管理局所属40个企业2002年的产品销售收入数据(单位:万元):105 117 97 124 119 108 88 129 114 105 123 116 115 110 115 100 87 107 119 103 103 137 138 92 118 120 112 95 142 136 146 127 135 117 113 104 125 108 126 152 105 117 9711910888129114105123116115110115100871071191031031371389211812011295142136146127135117113104125108126见“统计学原理实验一”文件的“book3.01”。

要求:①根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率;②如果按规定:销售收入在125万元以上为先进企业,115~125万元为良好企业,105~115万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。

《统计学实验》课件

《统计学实验》课件
详细描述
描述性分析是对数据进行初步分析的方法,包括计算数据的频数、均值、中位数、众数、标准差等统计量,以及 制作直方图、箱线图、折线图等图表来展示数据特征。通过描述性分析,可以了解数据的分布情况、异常值和趋 势等。
03
实验数据分析方法
参数估计与假设检验
参数估计
通过样本数据对总体参数进行估计, 如使用均值、中位数、众数等统计量 来估计总体均值、中位数、众数等。
掌握统计学基本原理和方法
通过实验操作,深入理解统计学的基 本概念、原理和方法,为后续学习和 应用打下坚实基础。
培养数据分析思维
实验过程中,培养了独立思考和解决 问题的能力,提高了数据分析思维和 逻辑推理能力。
提升软件操作技能
熟练使用统计软件进行数据处理和分 析,提高工作效率和准确性。
增强团队合作意识
总结词
通过实际调查数据的分析,掌 握描述性统计和推断性统计的 基本方法。
数据清洗与整理
对数据进行预处理,包括缺失 值处理、异常值剔除等。
推断性统计分析
运用t检验、方差分析等方法, 对数据进行分析和推断。
案例二:金融数据的预测分析
总结词
利用金融数据,掌握时间序列分析和回归分 析的方法。
数据选取与预处理
描述性统计
数据收集、整理、图表展示
概率论基础
概率、随机变量、期望与方差 等
参数估计与假设检验
点估计、区间估计、假设检验 等
相关分析与回归分析
简单相关、多元相关、线性回 归等
实验要求与注意事项
01
实验前需预习相关理论知识
02 实验过程中需认真操作,记录数据和分析 结果
03
实验后需撰写实验报告,总结实验过程和 结果

统计学实验报告

统计学实验报告

统计学实验报告实验内容:Excel在描述统计中的应用Excel在相关与回归中的应用班级:组员:实验一、Excel在描述统计中的应用实验目的:通过实践训练,使学生能够利用“直方图”工具计算频率分布并制作直方图,利用“描述统计”工具对原始数据进行统计分析,计算分组数据的平均值和方差。

一、利用直方图工具计算频率分布并制作直方图资料:某班31名学生家庭人均纯收入与生活费支出如下:家庭人均纯收入如下:18000 2000 5000 100000 20000 7000 40000 30000 20000 9000 8000 40000 40000 30000 2500 30000 30000 30000 6000 6000 20000 7000 7000 8000 6000 36000 2500 10000 6000 7000 6000生活费支出如下:1000 500 600 1200 1000 650 1400 800 1000 800 1000 2000 2000 800 500 800 800 500 540 700 800 650 600 800 500 800 450 500 500 700 500 要求:1、以0、500、800、1000、1500为组限计算生活费支出的频数和累计频率;以0、5000、10000、20000、40000为组限计算家庭人均纯收入的频数和累计频率。

2、作出生活费支出、家庭人均纯收入的直方图3、计算生活费支出、家庭人均纯收入的平均值、中位数、方差、标准差、95%置信区间。

实验步骤:把生活费支出输入A1中,把组限输入B1中,将数据输入到表格。

1、执行菜单命令“工具”——“数据分析”2、选择“直方图”,单击“确定”按钮,弹出“数据分析”,输入区蜮:选择A1选项,按住左键不放拖到A32;接受区蜮:选择B1选项,按住左键不放拖到B6;选中“标志”复选框,选中“输出区蜮”并选择C1指定输出区蜮,选中“累计百分率”复选框和“图表输出”复选框3、单击“确定”按钮,得到各组频数和累计频率以及直方图。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

理论数 Ei 6.904088699 10.3948862 21.00685513 36.94372351 56.5410843 75.3070524 87.28870894 88.05071227 77.29655647 59.05254036 39.26137491 22.71626179 19.23615503
日期:
4、分析哪组数据更接近正态分布,为什么。 水稻 F2 代株高的峰值为-0.589380069,偏斜度为-0.6121756;玉米单交种株高的 峰值为-0.112906602,偏斜度为 0.005430104;可看出玉米单交种株高的峰值与偏 斜度均小于水稻 F2 代株高,因此玉米单交种的数据更接近正态分布。另从次数 分布图亦可看出玉米单交种株高的分布接近于正态分布。
600
卡方分量
0.525131401 8.875345944 37.30287827 4.614216965 21.10123142 40.61863992 5.192070472 0.289715935 47.67234433 15.18732866 0.356006828 6.042842416 12.06792208 199.8456747
华南农业大学实验报告
专业班次 13 草业科学 组别 201330800119
题目科学型计算器和 Excel 在数据 姓 名 熊姣
日期 2014.11.22
统计方面的使用方法
表 4 玉米单交种株高的次数分布表
组限
≤202.8 202.8~207.8 207.8~212.8 212.8~217.8 217.8~222.8 222.8~227.8 227.8~232.8 232.8~237.8 237.8~242.8 242.8~247.8 247.8~252.8 252.8~257.8
组概率 pi 0.011506814 0.01732481 0.035011425 0.061572873 0.09423514 0.125511754 0.145481182 0.146751187 0.128827594 0.098420901 0.065435625 0.037860436 0.032060258
最小值 min
24.4cm
极差 R
153.2cm
样本大小 n
600
峰值 g2
-0.589380069
偏斜度 g1
-0.6121756
分析:根据上表结果,在水稻 F2 代株高调查中,共抽取了 600 个样本。样本中
最 大 值 为 177.6cm, 最 小 值 为 24.4cm, 极 差 为 153.2cm; 变 异 系 数 为
1、数据分析结果如下表: 表 1 水稻 F2 代株高数据的基本特征数
基本特征数
计算结果
平均数 x
离均差平方和 SS
109.7131667cm 720022.226cm2
方差 S2
1202.040444cm2
标准差 S
34.67045492cm
变异系数 CV
31.6009974%
最大值 max
177.6cm
表 2 玉米单交种株高数据的基本特征数
计算结果
229.2075cm
68065.63625cm2
113.6321139cm2
10.65983649cm 4.6507363% 257.8cm 200.3cm 57.5cm 600 -0.112906602 0.005430104
分析:根据上表结果,在玉米单交种株高调查中,共抽取了 600 个样本。样本中 最 大 值 为 257.8cm, 最 小 值 为 200.3cm, 极 差 为 57.5cm; 变 异 系 数 为 4.6507363%;其峰值为-0.112906602,小于 0,说明其次数分布曲线比正态分布 低,为低润峰;其偏斜度为 0.005430104,大于 0,说明该次数分布曲线不对称,
且峰往左边偏。
2、比较两组数据变异程度的大小: 水稻 F2 代株高:CV1=31.6009974% 玉米单交种株高:CV2=4.6507363% 水稻 F2 代株高的变异比玉米单交种株高的变异大。
3、次数分布表与次数分布图
表 3 水稻 F2 代株高的次数分布表
组限
≤30.9 30.9~43.9 43.9~56.9 56.9~69.9 69.9~82.9 82.9~95.9 95.9~108.9 108.9~121.9 121.9~134.9 134.9~147.9 147.9~160.9 160.9~173.9
>257.8 合计
组中值(X) 200.3 205.3 210.3 215.3 220.3 225.3 230.3 235.3 240.3 245.3 250.3 255.3 260.3
次数( f ) 4 12 24 44 77 107 120 88 62 36 17 9 0 600
成 绩:
图 2 玉米单交种株高的次数分布图 教师:
>173.9 合计
组中值(X) 24.4 37.4 50.4 63.4 76.4 89.4 102.4 115.4 128.4 141.4 154.4 167.4 180.4
次数( f ) 5 49 50 22 20 66 83 138 89 43 11 4 600
图 1 水稻 F2 代株高的次数分布图
5、正态分布 2 适合性测验。
次数 Oi 5 20 49 50 22 20 66 83 138 89 43 11 4 600
表 5 水稻 F2 代株高的正态分布 2 适合性测验
累计概率 pi 0.011506814 0.028831625 0.06384305 0.125415923 0.219651063 0.345162817 0.490643999 0.637395186 0.76622278 0.86464368 0.930079305 0.967939742
31.6009974%;其峰值为-0.589380069,为一个小于 0 的值,说明其次数分布曲
线比正态分布低,为低润峰;其偏斜度为-0.6121756,小于 0,说明该次数分布
曲线不对称,且峰往右边偏。
基本特征数
平均数 x
离均差平方和 SS
方差 S2
标准差 S 变异系数 CV 最大值 max 最小值 min 极差 R 样本大小 n 峰值 g2 偏斜度 g1
相关文档
最新文档