统计学实验报告
统计学实训综合实验报告

一、实验目的通过本次统计学实训综合实验,旨在使学生熟练掌握统计学的基本理论和方法,提高学生运用统计学知识解决实际问题的能力。
实验内容主要包括数据收集、整理、描述、推断和分析等环节,通过实际操作,加深对统计学理论的理解,培养学生的统计学素养。
二、实验内容1. 数据收集本次实验以某地区居民消费水平为研究对象,通过查阅相关资料,收集了该地区居民在食品、衣着、居住、生活用品及服务、交通和通信、教育文化娱乐、医疗保健等方面的消费数据。
2. 数据整理对收集到的数据进行整理,将其分为食品、衣着、居住、生活用品及服务、交通和通信、教育文化娱乐、医疗保健七个类别。
3. 描述性统计(1)计算各类别消费的平均值、中位数、众数等集中趋势指标。
(2)计算各类别消费的标准差、极差等离散趋势指标。
(3)绘制各类别消费的直方图、饼图等图形,直观展示消费结构。
4. 推断性统计(1)对居民消费水平进行假设检验,判断各类别消费是否存在显著差异。
(2)运用方差分析等方法,探究各类别消费之间的相关性。
5. 相关性分析(1)运用相关系数分析各类别消费之间的线性关系。
(2)运用因子分析等方法,提取影响居民消费水平的关键因素。
6. 交叉分析(1)根据性别、年龄、收入等变量,分析不同群体在消费结构上的差异。
(2)运用卡方检验等方法,探究不同群体在消费结构上的显著差异。
三、实验结果与分析1. 描述性统计结果根据计算,该地区居民在食品、衣着、居住、生活用品及服务、交通和通信、教育文化娱乐、医疗保健等方面的消费平均分别为:3000元、1500元、2000元、1000元、1000元、500元、500元。
2. 推断性统计结果通过对居民消费水平的假设检验,发现食品、衣着、居住、生活用品及服务、交通和通信、教育文化娱乐、医疗保健等方面的消费存在显著差异。
3. 相关性分析结果运用相关系数分析,发现食品、衣着、居住、生活用品及服务等方面的消费与居民收入呈正相关,而交通和通信、教育文化娱乐、医疗保健等方面的消费与居民收入呈负相关。
统计学实验报告

一、实验目的1. 掌握统计学的基本概念和原理。
2. 熟悉统计软件的使用方法,如SPSS、Excel等。
3. 学习描述性统计、推断性统计等方法在数据分析中的应用。
4. 提高对数据分析和解释的能力。
二、实验内容本次实验分为以下四个部分:1. 描述性统计2. 推断性统计3. 统计软件应用4. 数据分析和解释三、实验步骤1. 描述性统计(1)收集数据:本次实验采用随机抽取的方式收集了某班级50名学生的数学成绩作为样本数据。
(2)数据整理:将收集到的数据录入SPSS软件,进行数据整理。
(3)计算描述性统计量:计算样本的均值、标准差、最大值、最小值、中位数、众数等。
(4)结果分析:根据计算结果,分析该班级学生的数学成绩分布情况。
2. 推断性统计(1)假设检验:假设该班级学生的数学成绩总体均值等于60分,进行t检验。
(2)方差分析:将学生按性别分组,比较两组学生的数学成绩差异。
(3)回归分析:以学生的数学成绩为因变量,其他相关因素(如学习时间、学习方法等)为自变量,进行回归分析。
3. 统计软件应用(1)SPSS软件:使用SPSS软件进行数据整理、描述性统计、假设检验、方差分析和回归分析。
(2)Excel软件:使用Excel软件绘制统计图表,如直方图、散点图、饼图等。
4. 数据分析和解释(1)描述性统计结果分析:从样本数据的均值、标准差、最大值、最小值、中位数、众数等指标可以看出,该班级学生的数学成绩整体水平较高,但成绩分布不均。
(2)推断性统计结果分析:假设检验结果显示,该班级学生的数学成绩总体均值与60分无显著差异;方差分析结果显示,男女学生在数学成绩上无显著差异;回归分析结果显示,学习时间对学生的数学成绩有显著影响。
四、实验结果1. 描述性统计:样本数据的均值、标准差、最大值、最小值、中位数、众数等指标。
2. 推断性统计:假设检验、方差分析和回归分析的结果。
3. 统计图表:直方图、散点图、饼图等。
五、实验结论1. 该班级学生的数学成绩整体水平较高,但成绩分布不均。
《统计学》实验报告

图做准备。
实验二:主要是要求学生利用Excel的数据处理功能,掌握Excel
制图方法,能够较为准确地显示统计数据的发布特征。
实验三:分解分析法是分析时间序列常用的统计方法。季节时间序列是趋
势变动(T)、季节变动(S)、循环变动(C)和随机变动(I)综合影响的结果,分解过程要从原始序列中消除随机变动,然后分别识别出季节变动和趋势变动的变化模式。
实验二:
(1)直方图的绘制
(2)折线图的绘制
(3)饼形图的绘制
掌握统计数据的整理方法和Excel的几种基本统计制图操作方法;进一步学习统计数据的整理方法和Excel的基本操作理论。
实验三:
1、计算一次移动平均,消除随机波动
2、中心化移动平均数。
3、计算各个季节指数
4、计算平均季节指数。
5、计算调整后的季节指数
b.“高级筛选”使用“数据-筛选-高级筛选”菜单,调用对话框来实现筛选
3、数据的排序:靠“升序排列”(“降序排列”)工具按钮和“数据-排序”菜单实现。在选中需排序区域数据后,点击“升序排列”(“降序排列”)工具按钮,数据将按升序(或降序)快速排列
4、Frequency函数
用途:以一列垂直数组返回某个区域中数据的频率分布。它可以计算出在给定的值域和接收区间内,每个区间包含的数据个数。
6、消除旅游人数序列中的季节变动。
7、对消除季节变动的旅游人数进行回归分析。
8、预测。
掌握时间序列的因素分解分析方法,将时间序列的分解分析方法理论与Excel的基本操作理论结合相结合。
实验四:
1、根据统计数据绘制散点图
2、计算相关系数
掌握实验的基本原理和方法:此分析可用于判断两组数据之间的关系。可以使用“相关系数”分析方法来确定两个区域中数据的变化是否相关,即一个集合的较大数据是否与另一个集合的较大数据相对应(正相关);或者一个集合的较小数据是否与另一个集合的较小数据相对应(负相关);还是两个集合中的数据互不相关(相关系数为零);结合使用相关分析的基本理论和Excel的基本操作理论。
统计学课内实验报告(详解+心得)1

一.实验目的与要求(一)目的实验一: EXCEL的数据整理与显示1. 了解EXCEL的基本命令与操作、熟悉EXCEL数据输入、输出与编辑方法;2. 熟悉EXCEL用于预处理的基本菜单操作与命令;3. 熟悉EXCEL用于整理与显示的基本菜单操作与命令。
实验二: EXCEL的数据特征描述、抽样推断熟悉EXCEL用于数据描述统计、抽样推断实验三: 时间序列分析掌握EXCEL用于移动平均、线性趋势分析的基本菜单操作与命令。
实验四: 一元线性回归分析掌握EXCEL用于相关与回归分析的基本操作与命令。
(二)要求1.按要求认真完成实验任务中规定的所有练习;2.实验结束后要撰写格式规范的实验报告, 正文统一用小四号字, 必须有页码;3、实验报告中的图表制作要规范, 图表必须有名称和序号;4、实验结果分析既要简明扼要, 又要能说明问题。
二、实验任务实验一根据下面的数据。
1.1用Excel制作一张组距式次数分布表, 并绘制一张条形图(或柱状图), 反映工人加工零件的人数分布情况。
从某企业中按随即抽样的原则抽出50名工人, 以了解该企业工人生产状况(日加工零件数):117 108 110 112 137 122 131 118 134 114 124 125 123127 120 129 117 126 123 128 139 122 133 119 124 107133 134 113 115 117 126 127 120 139 130 122 123 123128 122 118 118 127 124 125 108 112 135 5091.2整理成频数分布表, 并绘制直方图。
1.3 假设日加工零件数大于等于130为优秀。
实验二百货公司6月份各天的销售额数据如下(单位:万元)257 276 297 252 238 310 240 236 265 278271 292 261 281 301 274 267 280 291 258272 284 268 303 273 263 322 249 269295(1)计算该百货公司日销售额的均值、众数、中位数;(2)计算该百货公司日销售额的极差、标准差;(3)计算日销售额分布的偏态系数和峰度系数。
统计描述分析实验报告(3篇)

第1篇一、实验目的本次实验旨在通过统计描述分析,对一组实验数据进行分析,了解数据的分布情况、集中趋势和离散程度,为后续的数据分析和决策提供依据。
二、实验背景在某项实验中,我们收集了一组实验数据,包括实验对象的年龄、性别、实验结果等。
为了更好地了解这些数据,我们需要对其进行统计描述分析。
三、实验方法1. 数据收集:通过实验收集实验对象的年龄、性别、实验结果等数据。
2. 数据整理:将收集到的数据进行整理,确保数据的准确性和完整性。
3. 数据分析:采用统计描述分析方法,对数据进行描述性统计分析。
四、实验结果1. 数据分布情况(1)年龄分布:根据实验数据,将年龄分为以下几个区间:18-25岁、26-35岁、36-45岁、46-55岁、56岁以上。
统计各年龄区间的频数和频率,结果如下:年龄区间频数频率18-25岁 10 20.0%26-35岁 20 40.0%36-45岁 15 30.0%46-55岁 5 10.0%56岁以上 5 10.0%(2)性别分布:统计男女实验对象的频数和频率,结果如下:性别频数频率男 30 60.0%女 20 40.0%2. 集中趋势(1)年龄集中趋势:计算平均年龄、中位数和众数,结果如下:平均年龄:32.5岁中位数:35岁众数:35岁(2)实验结果集中趋势:计算实验结果的平均数、中位数和众数,结果如下:平均实验结果:85分中位数:86分众数:86分3. 离散程度(1)年龄离散程度:计算标准差和极差,结果如下:标准差:5.5岁极差:38岁(2)实验结果离散程度:计算标准差和极差,结果如下:标准差:4.2分极差:10分五、实验结论1. 年龄分布较为均匀,主要集中在26-35岁年龄段。
2. 男性实验对象占比60.0%,女性实验对象占比40.0%。
3. 实验对象的平均年龄为32.5岁,中位数为35岁,众数为35岁。
4. 实验结果的平均分为85分,中位数为86分,众数为86分。
5. 年龄和实验结果的离散程度相对较小,说明实验结果较为稳定。
《统计学》上机实验报告(一)

《统计学》实验报告一姓名:王璐专业:财政学(税收方向)学号:2010128107日期:2012年10 月9 日地点:实验中心701实验项目一描述性统计、区间估计在EXCEL里的实现一、实验目的1、掌握利用EXCEL菜单进行数据的预处理;2、掌握利用EXCEL进行描述性统计;3、掌握利用EXCEL进行区间估计。
二、实验要求1、EXCEL环境与数据预处理的操作;2、描述性统计,包括统计图表的绘制;数据分组处理;集中趋势描述、离散程度描述、分布形状描述。
3、区间估计,包括总体均值、总体比例、总体方差的区间估计计算。
三、实验内容(一)分类数据的描述性统计实验数据:餐厅服务质量和价位评价.XLS顾客服务质量评价的频数表(按性别分)、条形图、饼图(二)数值性数据的描述性统计实验数据:城乡居民储蓄数据.XLS随着生活水平的逐渐提高,居民的储蓄存款也在日益增加,数据2.XLS是自1990年~2006年城乡居民人民币储蓄存款额,储蓄存款包括定期和活期(单位:元)。
利用EXCEL,对数据2.XLS作如下分析:1、城乡居民人民币活期存款的众数、中位数和均值是多少?2、城乡居民人民币定期存款的方差和标准差是多少?3、定期存款和活期存款相比,哪种数据的变动性更大?(三)总体参数的区间估计1、成绩分析。
实验数据:期末成绩.XLS1假设学生的各门期末考试成绩均服从正态分布,选定一门课程,并给出该门课程平均成绩的置信水平为95%的区间估计。
2、顾客满意度分析。
某超市为了了解顾客对其服务的满意度,随机抽取了其会员中的50个样品进行电话调查,如果有38个顾客对此超市的服务表示满意,试求对该超市服务满意的顾客比例的95%置信区间。
四、实验结果(一)分类数据的描述性统计A顾客服务质量评价频数表(按性别分)评价等级男女极好45 21很好98 52好49 35一般20 11差9 10B条形图C.饼状图2(二)数值性数据的描述性统计解答:1.众数:无中位数:11615.9 均值:18553.592.方差:887955495.60 标准差:29798.583.活期存款的离散系数=标准差/均值=0.963602定期存款的离散系数=标准差/均值=0.696094因为0.963602>0.696094 所以,活期存款的变动性更大(三)总体参数的区间估计解答:1.根据区间估计的计算公式:均值±半径由题可得,均值=71.89474,半径=1.312076,得出最终结果,置信区间为:(70.5827,73.2068)2.根据总体比例的区间估计公式:比例±半径由题可得,比例 p=38/50=0.76,半径=0.1184 ,得出最终结果,置信区间为:(0.6416,0.8784)五、实验心得我个人认为自己的动手能力比较差,所以在做上机实验前,心里略有担心。
统计学实验报告心得(精选5篇)
统计学实验报告心得(精选5篇)统计学实验报告心得篇1统计学实验报告心得一、背景和目的本次实验旨在通过实际操作,深入理解统计学的原理和应用,提高数据处理和分析的能力。
在实验过程中,我们通过收集数据、整理数据、分析数据,最终得出结论,并对结果进行解释和讨论。
二、实验内容和方法1.实验内容本次实验主要包括数据收集、整理、描述性统计和推论统计等部分。
数据收集部分采用随机抽样的方式,选择了不同年龄、性别、学历、职业等群体。
整理部分采用了Excel等工具进行数据的清洗、排序和分组。
描述性统计部分使用了集中趋势、离散程度、分布形态等方法进行描述。
推论统计部分进行了t检验和方差分析等推断统计。
2.实验方法在实验过程中,我们采用了随机抽样的方法收集数据,并运用Excel进行数据整理和统计分析。
同时,我们还使用了SPSS软件进行t检验和方差分析等推论统计。
三、实验结果与分析1.实验结果实验数据表明,不同年龄、性别、学历、职业群体的统计特征存在显著差异。
集中趋势方面,中位数和众数可以反映数据的中心位置。
离散程度方面,方差和标准差可以反映数据的离散程度。
分布形态方面,正态分布可以描述多数数据的分布情况。
推论统计方面,t检验和方差分析可以推断不同群体之间是否存在显著差异。
2.结果分析根据实验结果,我们发现不同群体在年龄、性别、学历、职业等特征方面存在显著差异。
这可能与不同群体的生活环境、社会地位、职业特点等因素有关。
同时,集中趋势、离散程度和分布形态等方面的分析也帮助我们更全面地了解数据的特征。
四、实验结论与总结1.实验结论通过本次实验,我们深刻认识到统计学在数据处理和分析中的重要作用。
掌握了统计学的基本原理和方法,提高了数据处理和分析的能力。
同时,实验结果也表明,统计学方法在研究群体特征、推断差异等方面具有重要意义。
2.总结本次实验总结了以下几个方面的内容:(1)统计学实验有助于深入理解统计学的原理和应用。
(2)实验中,我们掌握了数据收集、整理、描述性统计和推论统计等方法。
统计学实验报告
统计实验一:数据的整理与显示一、实验目的及要求(一)目的⑴掌握EXCEL用于数据预处理的基本菜单操作及命令;⑵掌握EXCEL用于整理与显示的基本菜单操作及命令。
⑶能够根据实际中的数据特点选择最优的图形进行数据的展示。
(二)内容及要求1为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。
服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。
调查结果见book3.01。
要求:1)指出上面的数据属于什么类型?2)用Excel制作一张频数分布表;3)绘制一张条形图,反映评价等级的分布。
B EC C AD C B A ED A C B C DE C E EA DBC C A ED C BB ACDE A B D D CC B C ED B C C B CD A C B C DE C E BB EC C AD C B A EB ACDE A B D D CA DBC C A ED C BC B C ED B C C B C21978~2009年我国的国内生产总值数据如下(按当年价格计算,单位:亿元)见3.11。
1)制第一、二、三产业国内生产总值的线图;2)根据2009年的国内生产总值及其构成数据制图分析其构成状况.本表按当年价格计算。
单位:亿元年份国民国内生产人均国内总收入总值第一产业第二产业第三产业生产总值工业建筑业(元)1978 3645.2 3645.2 1027.5 1745.2 1607.0 138.2 872.5 381 1979 4062.6 4062.6 1270.2 1913.5 1769.7 143.8 878.9 419 1980 4545.6 4545.6 1371.6 2192.0 1996.5 195.5 982.0 463 1981 4889.5 4891.6 1559.5 2255.5 2048.4 207.1 1076.6 492 1982 5330.5 5323.4 1777.4 2383.0 2162.3 220.7 1163.0 528 1983 5985.6 5962.7 1978.4 2646.2 2375.6 270.6 1338.1 583 1984 7243.8 7208.1 2316.1 3105.7 2789.0 316.7 1786.3 695 1985 9040.7 9016.0 2564.4 3866.6 3448.7 417.9 2585.0 8581986 10274.4 10275.2 2788.7 4492.7 3967.0 525.7 2993.8 963 1987 12050.6 12058.6 3233.0 5251.6 4585.8 665.8 3574.0 1112 1988 15036.8 15042.8 3865.4 6587.2 5777.2 810.0 4590.3 1366 1989 17000.9 16992.3 4265.9 7278.0 6484.0 794.0 5448.4 1519 1990 18718.3 18667.8 5062.0 7717.4 6858.0 859.4 5888.4 1644 1991 21826.2 21781.5 5342.2 9102.2 8087.1 1015.1 7337.1 1893 1992 26937.3 26923.5 5866.6 11699.5 10284.5 1415.0 9357.4 2311 1993 35260.0 35333.9 6963.8 16454.4 14188.0 2266.5 11915.7 2998 1994 48108.5 48197.9 9572.7 22445.4 19480.7 2964.7 16179.8 4044 1995 59810.5 60793.7 12135.8 28679.5 24950.6 3728.8 19978.5 5046 1996 70142.5 71176.6 14015.4 33835.0 29447.6 4387.4 23326.2 5846 1997 78060.8 78973.0 14441.9 37543.0 32921.4 4621.6 26988.1 6420 1998 83024.3 84402.3 14817.6 39004.2 34018.4 4985.8 30580.5 6796 1999 88479.2 89677.1 14770.0 41033.6 35861.5 5172.1 33873.4 7159 2000 98000.5 99214.6 14944.7 45555.9 40033.6 5522.3 38714.0 7858 2001 108068.2 109655.2 15781.3 49512.3 43580.6 5931.7 44361.6 8622 2002 119095.7 120332.7 16537.0 53896.8 47431.3 6465.5 49898.9 9398 2003 135174.0 135822.8 17381.7 62436.3 54945.5 7490.8 56004.7 10542 2004 159586.7 159878.3 21412.7 73904.3 65210.0 8694.3 64561.3 12336 2005 185808.6 184937.4 22420.0 87598.1 77230.8 10367.3 74919.3 14185 2006 217522.7 216314.4 24040.0 103719.5 91310.9 12408.6 88554.9 16500 2007 267763.7 265810.3 28627.0 125831.4 110534.9 15296.5 111351.9 20169 2008 316228.8 314045.4 33702.0 149003.4 130260.2 18743.2 131340.0 23708 2009 343464.7 340506.9 35226.0 157638.8 135239.9 22398.8 147642.1 255753.表格数据为一公司在英美两国分公司销售人员获得的全年订单情况,见book3.12。
统计的实习报告六篇
统计的实习报告统计的实习报告六篇在生活中,报告使用的频率越来越高,我们在写报告的时候要注意涵盖报告的基本要素。
为了让您不再为写报告头疼,下面是小编收集整理的统计的实习报告6篇,欢迎阅读,希望大家能够喜欢。
统计的实习报告篇1一、实习目的实习是一项综合性的、社会性的活动,是一个由学校向社会接轨的环节,是学校学习向社会工作转型的一大模块。
搞好社会实习工作是很关键的,对一个学生来说是很重要的,从一个学生的成长过程来说,他经历了无事可做的孩童时代,到学校里忙碌的学生时代,再到以后的社会工作阶段,而实习就像一个链子连着学习和工作。
实习是学生把所学知识运用到实践中去的过程,学习的目的就是运用,就是去指导工作,而实习正好扮演了把学到的文化理论知识正确运用的工作中去的角色。
我们必须要做到用理论去指导实践,用实践去证明理论。
所学的知识只有运用到实践中去,才能体现其价值。
实习是一个锻炼的平台,是展示自己能力的舞台。
二、实习过程在三亚东方园中园景观有限公司的财务部实习了一个月,主要负责公司各类收入与支出的登记、统计核算和制作统计报表。
刚开始到公司的时候,负责带我的陈姐带我到财务部门熟悉了一下环境,认识了在接下来的一个月里将要朝夕相处、一起工作的同事,然后了解了公司的规模,发展历程及公司的现状等等。
接下来的任务是翻看了公司以前的账目,把账目上的数据练习着统计核算了几遍,熟悉统计报表的制作过程,模拟制作了几份统计报表。
这样练习了几天后陈姐开始让我着手公司最近的账目,虽然只是些小工作,但我心里既高兴又紧张。
高兴的是终于能把自己所学的知识运用于实践、能实际动手解决问题。
紧张的是怕在做的过程中出现错误,给公司带来不利的影响。
在接下来的几天里,我每天都战战兢兢地完成任务,数据的登记、统计、核算和统计报表的制作等等。
完成以后请教同事,反复的检查和修改,直到得到同事们的认可为止。
虽然有时候工作很累,但是看到同事们赞赏的眼神心里由衷的高兴。
统计学实验报告
统计学实验报告引言:统计学是一门研究如何收集、整理、分析和解释数据的学科。
统计学在各个领域中起着重要的作用,无论是商业领域中的市场调查,医学领域中的药物试验,还是科学研究中的数据分析,统计学都有其独特的价值。
本实验报告旨在探讨统计学在实际问题中的应用,并通过一个具体的实验案例,展示统计学的实际操作与方法。
实验目的:评估被试者对不同颜色字体的注意力分散程度。
实验设计:我们随机抽取了100名被试者,要求他们在一定时间内尽量记住显示在屏幕上的一系列单词。
实验采用两种字体颜色:红色和蓝色,并随机为每个被试者展示这些单词,以检测被试者对不同颜色字体的注意力分散程度。
结果分析:通过实验收集到的数据,我们将进行一系列统计分析和推断。
首先,我们计算出每个被试者在红色和蓝色字体下记住的单词数量,并计算出两个样本的平均值、标准差和标准误差等统计指标。
然后,我们使用双样本t检验来比较两组数据的均值是否存在显著差异。
通过计算p-value,我们可以得出结论是否拒绝原假设(即两组数据的均值无显著差异)。
实验结果显示,在红色字体下,被试者平均记住了30个单词,标准差为4;而在蓝色字体下,平均记住了35个单词,标准差为3。
通过双样本t检验,我们得出p-value为0.001,远小于显著性水平0.05,因此可以得出结论:在颜色字体的影响下,被试者的注意力在蓝色字体下相对于红色字体有更好的集中程度。
讨论与结论:通过这个实验,我们验证了颜色字体对被试者注意力分散程度的影响。
这个结果在实际生活中有重要意义,例如,网页设计师可以根据这个研究结果选择适合的字体颜色,以提高用户对重要提示的关注度。
此外,这个实验还可以启发新的研究方向,如探讨不同颜色字体对不同年龄段群体的影响是否存在差异等。
实验的局限性值得注意,我们仅考虑了红色和蓝色两种字体颜色,而在实际应用中还存在其他颜色的选择。
此外,实验中使用的单词也可能对被试者的注意力产生一定的影响,这个因素值得进一步研究和控制。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计学实验报告 实验一 数据的搜集与整理 一、数据的收集。 统计数据主要来源于两种渠道:一种是间接数据,这些数据来源于别人的调查或实验数据;另一种是直接数据来源于直接的调查获取,并进行相关的整理、研究得来的统计数据。 间接数据的搜集方法有两种: 第一是直接进入专业数据库网站查询数据,这种方法主要适用于目标明确并且能够找到对应专业数据库网站的一些数据; 例:1,进入浏览器 输入http://www.cdstats.chengdu.gov.cn/ 2,在统计数据 年度数据中 选择统计年鉴 2008年数据下载后即可得到数据。 第二种是使用搜索引擎,适用于目标不明确并且数据库网站又没有直接提供的统计数据。 例,1,在百度中输入所需输入的信息名称 2,在搜索项中点击第一项成都市的统计局,进入统计数据。 即可擦看到成都市统计局关于2008年成都人口数的下载表 直接数据。这一类数据的收集获得途径有:科学实验、观察实验或者是直接调查。 二、数据的整理 数据的整理包括:数据编码、数据录入、数据文件的导入、数据的筛选、数据的排序以及数据文件的保存。 (1) 数据的编码,数据编码是指把需要加工处理的数据库信息,用特写的数字来表示的一种技术是根据一定数据结构和目标特征,将数据转换为代码或码字符,在数据传输中表示数据组成,并作为送、接受和处理的一组规则和约定。 (2) 数据的录入,数据的录入是将搜集到的数据直接输入到Excel中。 (3) 数据的导入: 方法一:是使用“文件-打开”菜单, 方法二:是使用“数据-导入外部数据-导入数据”
(4)数据的筛选 数据的筛选是从大数据表单中选出分析所要用的数据。Excel中提供了两种数据的筛选操作,包括“自动筛选”和“高级筛选”。 (5)数据的排序 数据的排序主要依靠升序排列或者是降序排列工具按钮和数据-排序菜单实现。在选中排序的区域后,点击升序排列或者降序排列按钮,即可进行快速的排列。 (6)数据文件的保存 可以使用“保存”工具按钮,或者“文件-保存”菜单,还可以使用“文件-另存为”菜单。 实验二,描述数据的图表。 1,频数频率表 ferquency函数 意义:返回某一个选定区域中数据的频数分布,计算出给定的值域和接收与内,每个区间包含的数据个数。 实验操作步骤: 第一步:激活单元格并输入数据。第二布:选中未使用的单元格,点击函数调用卡片选择Frequency函数。 第三步:点击“插入函数”对话框确定按钮进入“函数参数”对话框。引用date-array用来计算频率的一个数组。 第四步:使用组合键“Ctrl+Shift+Enter”得到频数返回结果
直方图分析工具: “工具”—“数据分析”—“直方图” 直方图制作:第一步:将数据输入到单元格。 第二步:使用“工具——数据分析”菜单,打开“数据分析”对话框,选择“直方图”。 第三步:单击确定按钮,进入“直方图”分析工具库对话框,点击“输入区域”右侧箭头选中输入数据的单元格,点击“接受区域”右侧箭头选中分组数据分单元格,“输出区域”只需要激活一个右侧和下侧都没有数据的单元格,选中图标输出和累计百分比。 点即确定后就出现了统计图,再对统计图进行部分修改即可。 饼子图制作 第一步:选择组别按住crlt 点击图表导向。 第二步:点击“数据标志”选项卡,选中值和百分比。 最后点击确定即可。在工具-数据分析里选择饼图。 或者如直方图的制作, 各种统计图的各自特点。 1,直方图:不支持手工输入,用来卡分布装抗 2,折线图:用来比较分心两组即以上的数据。 3,散点图:用来观察数据之间共同的变化趋势。 实验三、统计数据的描述 统计指标中包括众多的函数,包括算数平均数,调和平均数,集合平均数,众数,中位数,标准差,方差,偏度,还有风度等。 1,均值。1算数平均数 激活一空白单元格,输入公式敲击回车 2 几何平均数 使用GEOMEAN语法 求目标的几何平均数 3 中位数 使用median函数 计算中位数 4 众数 使用mode 进行计算 2,离散程度。 1 极差 max 计算最大值 Min 计算最小值 通过max-min构建函数组算出极差 2方差和标准差 Varp 计算方差 Var 估算样本的方差 Stdevp 返回整个总体的标准差 Stdev 估计样本的标准差 操作步骤: 1算术平均数:第一步,激活空白单元格,点击函数卡片 选择该函数点即确定 第二部:点击选择区域按钮拖选区域 点击确定后就出现平均值。 其他如调和平均数,集合平均数,众数(MODE),中位数(MEDIAM),标准差(stdev),方差(var),偏度(skew),还有风度(kurt)等操作步骤相同,在点击函数卡片后选择对应的函数即可进行计算。 2 :描述统计 工具 第一步:工具—数据分析—描述统计—点击数据分析对话框 第二部:进入“描述统计”对话框,分别选中输入输出区域。 第三部:分组方式,选择“逐列”,输出区域选择一个右方和下方都没有数据的单元格,点“标志位于第一行”、“击汇总区域”、“平均数置信度”、“第K大值”、“第K小值”。 几点说明 (1)观测值,计算数组数据的个数,使用函数COUNT(values1,values2,…),其中只有数值型的数据才能被统计。(2)第k大值和第k小值,第k大值是对数据按将序排列,对数据按升序排列。 (2)标准误差,使用Count、Stdev和Sqrt三个函数组合套用来计算标准误差,返回某一正数的算术平方根,使用的函数是SQRT(number). (3)平均置信度,选中平均置信度复选框,手工输入置信度。 实验死、参数估计 1、抽样:“抽样”分析工具将输入区域视为总体,并使用总体来建立样本。当总体过大而无法处理或制成图表时,就可以使用代表样本。如果输入数据是周期性的,也可以建立只包含某个周期特定部分数值的样本。 第一步。在工具中选择数据分析到数据数发生器。 第二部,根据要求,进行随机数的发生。 第三步:打开“工具—数据分析—抽样”点击确定 第四步:选择索要数据的输入区域,样本单位个数,并在一个右方和下方没有数据的单元格确定输出数据,点击确定。
二、构建函数表单 在第一数列输入:样本统计量、样本个数、样本均值、用户输入、总体标准差、置信水平、计算结果、抽样平均误差、Z值、置信区间半径、置信区间下限、置信区间上限 第二部:在选择相对应的项目后。点击插入—名称—指定,然后选最左列复选框,再点击确定。 第三步:选中函数表中的所有单元格,点击插入—名称—指定,然后选最左列复选框, 第四步:样本个数=count(样本数据) 样本均值=average(样本数据) 抽样平均误差=总体标准差/sqrt(样本个数) Z值=(样本均值—总体均值假设值)/抽样平均误差) 置信区间下限(=Normsive((1-置信水平)/2)) 置信区间上限(=normsive((1-置信水平)/2)+置信水平)) 置信区间半径(100*(1-a)%,总体标准差,样本个数) 最后确定。 三、返回总体平均值的置信区间半径: 第一步:点击置信区间半径所在行的空白单元格,点击函数卡片,找到“confidence”函数,点击确定。
第二步:在Alpha中填入用于计算的置信度,在standard_dev中填入数据的总体标准差,size为样本容量。 四、返回标准正态累积分布函数 第一步:在“Z值”所在行选择空白单元格,点击函数卡片,找到normsinv函数,点击确定。 第二步:在“probability”中输入0.95(置信区间),然后点击确定 五、返回作为概率和自由度的函数的t分布的t值 第一步:在t值所在行选择空白单元格,点击函数卡片,找到“tinv”函数,点击确定。 第二步:在“probability”中填入显著性水平,在“deg_freedom”中填入比样本个数少一个的值,然后点击确定。 实验五 假设检验 一、总体标准差已知,总体均值的假设检验——Z检验 1,抽样。抽样:“抽样”分析工具将输入区域视为总体,并使用总体来建立样本。当总体过大而无法处理或制成图表时,就可以使用代表样本。如果输入数据是周期性的,也可以建立只包含某个周期特定部分数值的样本。 第一步。在工具中选择数据分析到数据数发生器。 第二部,根据要求,进行随机数的发生。 第三步:根据所需要的数据要求选择变一个数,总体单位,获得数据。
2构建函数表单 第一步:确定需进行假设检验的总体参数,确定抽样样本统计量及其服从的分布(正态分布、t分布、f分布、卡方分布等),进行双侧或单侧假设设计,确定置信水平。 第二部:抽样平均误差(=总体标准差/sqrt(样本个数)) 检验统计量(=(样本均值—总体均值假设值)/抽样平均误差) 检验区间下限(=Normsive((1-置信水平)/2)) 检验区间上限(=normsive((1-置信水平)/2)+置信水平)) 第三部:得出结论。 实验六,方差分析 1,单因素方差分析: 第一步:使用工具—数据分析菜单,打开数据分析,选择方差分析—单因素方差分析分析工具,确定 第二部:打开方差分析—单因素方差分析;输入区域要确定进行单因素方差分析数据所在单元格;分组方式的行、列单选框,确认分组总体数据是以行还是以列来划分;“标志位于”复选框确认输入区域数据是否包含标志;a框要求输入显著性系数,输出区域选择输出单元格。 第三部 点击方差分析:单因素方差分析 分析工具的返回结果由两部分构成:一部分是Summary(汇总),以表格的形式展示出每个组的观测数、求和、平均和方差结果;第二部分是方差分析表。 判断条件一:在一个给定的显著性水平a,如果计算的F检验统计量大于F的临界值就拒绝原假设,反之,不拒绝原假设。 判断条件二:在一个给定的显著性水平a,如果P值小于a就拒绝原假设,反之,不拒绝原假设。
2、无重复双因素方差分析 第一步:使用“工具—数据分析”菜单打开数据分析对话框,选择“方差分析—无重复双因素方差分析”分析工具,点击确定打开对话框。 第二部:输入区域要确认进行无重复交互作用的双因素方差分析数据所在的单元格;“标志”复选框确认输入区域是否包含标志复选框;a