数据分析实验指导书
数据结构实验-实验指导书

实验一线性表操作一、实验目的1熟悉并掌握线性表的逻辑结构、物理结构。
2熟悉并掌握顺序表的存储结构、基本操作和具体的函数定义。
3熟悉VC++程序的基本结构,掌握程序中的用户头文件、实现文件和主文件之间的相互关系及各自的作用。
4熟悉VC++操作环境的使用以及多文件的输入、编辑、调试和运行的全过程。
二、实验要求1实验之前认真准备,编写好源程序。
2实验中认真调试程序,对运行结果进行分析,注意程序的正确性和健壮性的验证。
3不断积累程序的调试方法。
三、实验内容基本题:1对元素类型为整型的顺序存储的线性表进行插入、删除和查找操作。
加强、提高题:2、编写一个求解Josephus问题的函数。
用整数序列1, 2, 3, ……, n表示顺序围坐在圆桌周围的人。
然后使用n = 9, s = 1, m = 5,以及n = 9, s = 1, m = 0,或者n = 9, s = 1, m = 10作为输入数据,检查你的程序的正确性和健壮性。
最后分析所完成算法的时间复杂度。
定义JosephusCircle类,其中含完成初始化、报数出圈成员函数、输出显示等方法。
(可以选做其中之一)加强题:(1)采用数组作为求解过程中使用的数据结构。
提高题:(2)采用循环链表作为求解过程中使用的数据结构。
运行时允许指定任意n、s、m数值,直至输入n = 0退出程序。
实验二栈、队列、递归应用一、实验目的1熟悉栈、队列这种特殊线性结构的特性2熟练掌握栈、队列在顺序存储结构和链表存储结构下的基本操作。
二、实验要求1实验之前认真准备,编写好源程序。
2实验中认真调试程序,对运行结果进行分析,注意程序的正确性和健壮性的验证。
3不断积累程序的调试方法。
三、实验内容基本题(必做):1分别就栈的顺序存储结构和链式存储结构实现栈的各种基本操作。
2、假设以带头结点的循环链表表示队列,并且只设一个指针指向对尾结点,不设头指针,试设计相应的置队空、入队和出队的程序。
加强题:3设线性表A中有n个字符,试设计程序判断字符串是否中心对称,例如xyzyx和xyzzyx都是中心对称的字符串。
数据库实验指导书

《数据库原理与应用》实验指导书主编:李正茂合肥学院计算机科学与技术系2017年7月前言数据库原理与应用课程实验作为课程实践性环节之一,是教学过程中必不可少的重要内容。
通过实验,使学生加深理解、验证巩固课堂教学内容;增强对数据库管理系统一些知识的感性认识;培养学生理论与实践相结合以及用所学知识分析和解决实际问题的能力。
本书是《数据库原理与应用》课程的实验配套书,实验分为课内必修内容。
指导教师在每次实验前应讲清实验目的、基本原理、实验要求等,并指导学生做好实验预习,并在规定的时间内完成相关课程实验。
在实践教学中着重培养运用所学知识分析和解决实际问题的能力,注重动手能力的提高。
实验课程教学中应在老师指导下,以学生为主体,充分调动学生的积极性和能动性,重视学生动手能力的培养。
课内实验后,学生将实验结果等内容写出实验报告,应符合实验教学的要求,并得到指导教师认可。
实验报告由个人独立完成,每人一份。
报告应字迹整齐,程序代码、运行结果等符合要求。
指导教师对每份实验报告进行审阅、评分。
该实验课程内容是对理论教学内容的应用与验证。
实验成绩=实验报告成绩(50%) +自主学习实验项目1(20%)+自主学习实验项目2(30%)。
本书根据理论课的教学进度,共开设12个课内实验项目(其中2个综合性实验项目)和2个自主学习实验项目。
目录实验准备熟悉上机环境 (4)实验一建立数据库 (19)实验二建立数据表 (22)实验三修改表和数据完整性 (26)实验四数据操作及完整性约束 (29)实验五 SQL数据查询一 (32)实验六 SQL数据查询二 (35)实验七视图的应用 (38)实验八游标的应用 (40)实验九存储过程及应用 (43)实验十触发器及应用 (46)实验十一用户管理和权限管理 (48)实验十二数据库概念数据模型和逻辑数据模型设计 (52)自主实验项目1:实验考核 (54)自主实验项目2:按照要求设计并实现实验方案 (55)实验准备熟悉上机环境一、安装前准备:1.SQL Server 2008 的版本SQL Server 2008 主要有三个版本:精简版(32位),SQL速成版(32位),工作组版(32位和64位),网络版(32位和64位),企业版和开发人员版(32位和64位)。
数据结构实验指导书

数据结构实验指导书一、实验目的数据结构是计算机科学中的重要基础课程,通过实验,旨在帮助学生更好地理解和掌握数据结构的基本概念、原理和算法,提高学生的编程能力和问题解决能力。
具体而言,实验的目的包括:1、加深对常见数据结构(如数组、链表、栈、队列、树、图等)的理解,掌握其特点和操作方法。
2、培养学生运用数据结构解决实际问题的能力,提高算法设计和程序实现的能力。
3、增强学生的逻辑思维能力和调试程序的能力,培养学生的创新意识和团队合作精神。
二、实验环境1、操作系统:Windows 或 Linux 操作系统。
2、编程语言:C、C++、Java 等编程语言中的一种。
3、开发工具:如 Visual Studio、Eclipse、Code::Blocks 等集成开发环境(IDE)。
三、实验要求1、实验前,学生应认真预习实验内容,熟悉相关的数据结构和算法,编写好实验程序的代码框架。
2、实验过程中,学生应独立思考,认真调试程序,及时记录实验过程中出现的问题及解决方法。
3、实验完成后,学生应撰写实验报告,包括实验目的、实验内容、实验步骤、实验结果、问题分析与解决等。
四、实验内容(一)线性表1、顺序表的实现与操作实现顺序表的创建、插入、删除、查找等基本操作。
分析顺序表在不同操作下的时间复杂度。
2、链表的实现与操作实现单链表、双向链表的创建、插入、删除、查找等基本操作。
比较单链表和双向链表在操作上的优缺点。
(二)栈和队列1、栈的实现与应用实现顺序栈和链式栈。
利用栈解决表达式求值、括号匹配等问题。
2、队列的实现与应用实现顺序队列和链式队列。
利用队列解决排队问题、广度优先搜索等问题。
(三)树1、二叉树的实现与遍历实现二叉树的创建、插入、删除操作。
实现二叉树的前序、中序、后序遍历算法,并分析其时间复杂度。
2、二叉搜索树的实现与操作实现二叉搜索树的创建、插入、删除、查找操作。
分析二叉搜索树的性能。
(四)图1、图的存储结构实现邻接矩阵和邻接表两种图的存储结构。
统计实验指导书(1)某企业职工收入抽样调查数据的描述性分析

实验1 数据的整理与显示
某企业职工收入抽样调查数据的描述性分析
一、实验目的
通过本次实验,使学生逐步熟悉EXCEL的基本操作,并学会利用EXCEL 进行统计数据的整理和描述性统计分析。
基本的数据整理包括录入统计数据、建立数据清单、按照关键字对数据进行排序,以及对排序结果加以分析。
学会统计分组的几种方法,尤其要掌握统计分组函数FREQUENCY的使用。
掌握常见统计表与统计图的绘制方法。
二、实验要求
1、数据录入
2、数据排序与数据分组
3、统计表与统计图
三、实验内容
假设你在某市场调研公司工作,现打算对某企业进行一次关于员工收入的调查。
调查的主要变量是年收入,被调查者的特征变量有性别、年龄、学历和职业等。
抽样调查的数据见附表1。
问题
(1)要求学生利用本案例的数据,利用描述统计方法对数据进行分组汇总和整理;
(2)根据数据的特点和类型,选择适当的图形展示数据。
(至少要有三种图形)
附表1:X公司员工收入基本状况调查表。
数据库原理课程设计实验指导书(通用)

数据库原理课程设计实验指导书(通⽤)《数据库原理课程设计》实验指导书实验名称:数据库原理课程设计实验类型: 综合性实验学时:⼀周适⽤对象: 计算机科学与技术⼀、实验⽬的这门课是为计算机科学与技术专业的学⽣在学习数据库原理B后,为培养更好的解决问题和实际动⼿能⼒⽽设置的实践环节。
通过这个环节,使学⽣拥有能够应⽤数据库原理对数据库系统进⾏设计的能⼒。
为后继课程和毕业设计打下良好基础。
⼆、实验要求设计⼀个基于数据库的综合数据库管理系统,包括后台数据库的设计和前台⽤户终端的设计,具体题⽬四年不重复,要求:1.准备⼯作:在课外安装相关的数据库管理系统软件和开发⼯具软件,并根据参考书熟悉DBMS 的功能、结构,为后期综合实验打好基础。
2.概念模型的设计:根据题⽬要求,列出实体集,并应⽤E-R图描述实体的属性和实体之间的联系。
3.逻辑模型的设计:根据已建⽴好的E-R图选⽤关系模型设计关系表,包括设计关系表的属性、主码等,要求关系表中的属性名必须使⽤英⽂,呈现给⽤户的视图时显⽰中⽂。
4.完整性设计:包括实体完整性、参照完整性和⽤户⾃定义完整性的设计;⽐如年龄的范围、考试成绩的范围、职务的范围等。
并设计多表间的联系,⽐如学⽣表和成绩表,要求根据E-R图的设计设计关系表的外码,并举例说明。
5.规范化设计:使⽤范式理论证明你所设计的关系⾄少属于3NF,写出证明过程;否则进⾏模式分解,直到该关系满⾜三范式,并写出分解过程;6.SQL语⾔的考察:使⽤DBMS所⽀持的SQL语⾔完成关系表的建⽴,数据的插⼊、修改和更新等功能,着种考查关系表的查询(单表查询、多表查询和组合查询等,跟关系代数⼀起考查);7.图形化⽤户界⾯的设计:完成题⽬所要求的各种功能,并⽤菜单或者⼯具栏的形式组织各种功能(如数据的录⼊、查询、更新维护等);8.权限管理的设计:所设计的系统应该有⼀定的权限管理,不同的⽤户登陆完成功能是不⼀样的,对数据表的权限也不同。
数据分析与可视化指导书

数据分析与可视化指导书一、引言数据分析与可视化已成为当今信息时代的关键技能。
在大数据时代,大量的数据被汇集和储存,但这些数据的价值仅限于我们能否从中提炼出有价值的信息。
数据分析与可视化指导书的目的是帮助读者了解数据分析与可视化的概念、方法和技巧,以及如何有效地进行数据分析与可视化。
二、数据分析概述数据分析是一种通过相关技术和工具对大量的数据进行挖掘、统计、整理和解释,以揭示数据背后的规律和隐藏的信息。
数据分析可以帮助我们了解数据的特征、趋势和关系,从而为决策提供依据和支持。
1. 数据收集与准备在进行数据分析之前,首先要收集并准备好相关的数据。
数据收集可以包括问卷调查、观察记录、实验数据等多种方法。
在数据收集过程中,要注意数据的完整性和准确性,确保数据的质量。
2. 数据清洗与转换数据清洗是指对收集到的原始数据进行处理,包括删除重复数据、处理缺失数据、纠正错误数据等。
数据清洗的目的是确保数据的一致性和可靠性,为后续的数据分析做好准备。
3. 数据探索与分析数据探索是指对数据进行可视化展示和统计分析,以发现数据的特征和规律。
数据探索可以通过绘制图表、计算描述性统计量、进行模型建立等多种方式进行。
通过数据探索,我们可以对数据有更全面的了解,并为后续的数据分析提供指导。
三、数据可视化概述数据可视化是将数据通过图表、图形、地图等可视化方式展示出来,以帮助人们更直观、更清晰地理解数据。
数据可视化可以将复杂的数据信息转化为可视化图像,使人们能够更容易地发现数据之间的关系和趋势。
1. 可视化工具与技术要进行数据可视化,可以使用多种图表和图形,如柱状图、折线图、散点图、地图等。
此外,还可以利用数据可视化工具和软件,如Tableau、Power BI等,来实现更复杂和个性化的数据可视化效果。
2. 可视化设计原则在进行数据可视化时,需要遵循一些设计原则,以确保可视化效果的直观和易懂。
例如,要选择合适的图表类型,保持图表简洁明了,注重色彩搭配和布局的美观性,同时要考虑受众的接受能力和阅读习惯。
实验指导书

实验指导书一、实验目的本实验旨在帮助学生掌握实验室基本操作技能,提高实验仪器的使用水平,培养实验设计和实验数据处理的能力。
二、实验器材本实验所需器材如下:1. 显微镜2. 高压电源3. 量筒4. 试剂瓶5. 称量瓶6. 烧杯7. 导线8. 静电仪9. 板卡三、实验步骤1. 实验前准备a. 检查所需实验器材是否准备齐全。
b. 清洗实验器材,确保没有污染物。
c. 与实验小组成员分工合作,确定实验计划和操作流程。
2. 实验操作a. 根据实验要求,配置实验所需试剂。
b. 根据实验要求,进行量筒、称量瓶等设备的校准工作。
c. 进行实验样品的制备或准备好实验样品,保证实验数据的准确性。
d. 启动实验仪器,根据仪器指南进行操作。
e. 记录实验过程中的操作步骤以及观察到的现象。
f. 根据实验数据,进行相应的统计和处理。
3. 实验结果分析a. 对实验结果进行详细的数据分析,包括数值计算和统计处理。
b. 根据实验结果,结合实验目的,进行合理的结论推理。
4. 实验报告编写a. 撰写实验报告,按照规定的格式进行排版。
b. 在实验报告中清晰地介绍实验目的、实验原理、实验步骤和实验结果。
c. 分析实验结果,展示数据处理方法和结果。
d. 提出实验中存在的问题和改进方案。
e. 根据实验所得结果,进行相关的讨论和思考。
四、实验注意事项1. 实验过程中要佩戴实验手套、实验眼镜等个人防护装备,确保实验安全。
2. 实验前请仔细阅读实验指导书,并熟悉实验原理和操作方法。
3. 操作实验仪器时要小心谨慎,避免操作失误和仪器损坏。
4. 实验过程中要注意环境卫生,保持实验台面的整洁。
5. 实验结束后,将实验器材进行清洗归位,保持实验室的整洁。
五、实验安全提示1. 实验过程中要避免接触有毒有害物品,如酸碱溶液等。
2. 实验操作时要注意电源的正确使用,以避免触电事故的发生。
3. 实验中如遇到异常情况,应立即停止操作并向实验室管理员报告。
六、实验评分标准1. 实验仪器的正确使用和操作流程的掌握程度。
统计学原理实验指导书

百度文库- 让每个人平等地提升自我!统计学原理实验指导书经济学院编二○○八年二月统计学原理实验一数据的整理与显示一、实验目的通过本次实验,掌握用EXCEL对数据进行整理、加工、作图,以发现数据中的一些基本特征,为进一步分析提供思路。
二、实验性质必修,基础层次三、主要仪器及试材计算机及EXCEL软件四、实验内容1.数据的预处理2.品质数据的整理与显示3.数值型数据的整理与显示五、实验学时2学时六、实验方法与步骤1.开机;2.找到“统计学原理实验一数据”,打开EXCEL文件;3.按要求完成上机作业,并把文件用自己学号命名保存供老师检查;4.完成实验报告,注意要对每个习题的结论与统计学解释写在实验报告上。
七、上机作业演示题:A、B两个班学生的数学考试成绩数据见“统计学原理实验一”文件的“book3.演示”。
①将两个班的考试成绩用一个公共的分组体系编制分布表;并计算出累积频数和累积频率;②绘制复式条形图、环形图、雷达图;③分析比较两个班考试成绩的分布特点及差异;比较两个班考试成绩分布的特点3.01.某行业管理局所属40个企业2002年的产品销售收入数据(单位:万元):105 117 97 124 119 108 88 129 114 105 123 116 115 110 115 100 87 107 119 103 103 137 138 92 118 120 112 95 142 136 146 127 135 117 113 104 125 108 126 152 105 117 9711910888129114105123116115110115100871071191031031371389211812011295142136146127135117113104125108126见“统计学原理实验一”文件的“book3.01”。
要求:①根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率;②如果按规定:销售收入在125万元以上为先进企业,115~125万元为良好企业,105~115万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
目录实验一描述性分析实验二正态总体的均值检验实验三非参数检验实验四方差分析实验五回归分析实验六判别、聚类分析实验七主成分分析实验八因子分析实验一描述性分析【实验目的】1.掌握数字特征的计算(A);2. 掌握相关矩阵计算(A)。
【实验原理】数据分析是指用适当的统计方法对收集来的大量第一手资料和第二手资料进行分析,以求最大化地开发数据资料的功能,发挥数据的作用;是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。
要对数据进行分析,当然要分析数据中包含的主要信息,即要分析数据的主要特征,也就是说,要研究数据的数字特征。
对于数据的数字特征,要分析数据的集中位置、分散程度。
数据的分布是正态的还是偏态等。
对于多元数据,还要分析多元数据的各个分量之间的相关性等。
【实验项目设计】1.给定一组单变量数据,分组计算均值、方差、Q1、Q3、偏度、峰度。
2.给定一组多变量数据,计算相关矩阵。
【实验内容】一、单样本的数字特征计算(习题1.4) 从某商店的营业日中随机抽取12天,得日营业额数据为(单位:万元):12.5, 17.2, 9.1, 25.4, 31.2, 20, 18.9, 22.8, 21.1, 17.8, 25.1, 27.7试求样本均值、样本方差、样本变异系数、样本中位数、上样本四分位数、下样本四分位数、样本四分位数间距和极差。
1. 建数据集Data d4;Input x @@;Cards;12.5 17.2 9.1 25.4 31.2 20 18.9 22.8 21.1 17.8 25.1 27.7;Run;2. 使用“SAS/ 分析家”菜单(1)打开“分析家”界面。
选择SAS界面的级联菜单:“解决方案”➢“分析”➢“分析家”。
(2)调出数据文件Work.D4 。
在界面的空白处,右键弹出菜单,选择级联菜单:“文件”➢“按SAS名称打开”。
依次选择逻辑库和文件对象,分别为“Work”、“D4”,单击“确定”按钮。
(3)确定分析方法。
选择界面上的级联菜单:“统计”➢“描述性统计”➢“分布”(4)输送变量。
首先选中变量“x”,然后单击“Analyst”按钮。
即完成变量的输送,确定变量“x”作为分析变量。
单击“OK”。
(5)得到输出结果上述使用“分析家”的调用过程等价于程序调用univariate过程:proc univariate data=d4;Var x;Run;3. 解答样本均值mean =样本方差Variance =样本变异系数Coeff Variation =样本上四分位数75% Q3 =样本中位数Median =样本下四分位数25% Q1 =极差Range =样本四分位数间距Interquartile Range =二、相关矩阵计算(例3.2.3) 今对31个人进行人体测试,考察或测试的七个指标是:年龄(x1)、体重(x2)、肺活量(x3)、1.5英里跑的时间(x4)、休息时的脉搏(x5)、跑步时的脉搏(x6)和跑步时记录的最大脉搏(x7)。
数据列于表3.2.1。
现欲对这些指标作一些相关分析。
1. 对于给定EXCEL数据文件,导入数据建数据集e323.sas7bdat2. 使用SAS/INSIGHT菜单【实验目的】1. 掌握单正态总体样本的均值检验(B );2. 掌握两独立组样本(服从正态总体)进行均值比较(A );3. 掌握两对照组样本(服从正态总体)进行均值比较(A );4. 了解两组样本均值差的置信区间计算(C )。
【实验原理】1. 单样本总体均值的t 检验()()00:20:~11H H x t t t n t t n μμαμμ===−−−−→->-统计量:拒绝域:2. 两独立组样本总体的方差比较()()()121220:112222121120:~1,11,1,1,1,H H s F F F n n s F F n n F F n n σσαασσ=-==−−−−→--≥--≤--统计量:拒绝域:【实验项目设计】1. 单个正态总体的均值检验;2. 两独立组样本(服从正态总体)进行均值比较检验;3. 两对照组样本(服从正态总体)进行均值比较检验。
【实验内容】一、单个正态总体的均值检验(习题1.4) 从某商店的营业日中随机抽取12天,得日营业额数据为(单位:万元):12.5, 17.2, 9.1, 25.4, 31.2, 20, 18.9, 22.8, 21.1, 17.8, 25.1, 27.7 试检验:μ0 = 10 。
1. 建数据集Data d4;Input x @@;Cards;12.5 17.2 9.1 25.4 31.2 20 18.9 22.8 21.1 17.8 25.1 27.7;Run;2. 使用“SAS/ 分析家”菜单(1)打开“分析家”界面。
(2)调出数据文件Work.D4 。
(3)确定分析方法。
选择界面上的级联菜单:“统计”➢“假设检验”➢“均值的单样本T检验”(4)输送变量。
确定变量“x”为分析变量。
(5)得到输出结果3. 解答H0: μ0=10 H1: μ0≠10检验方法:t检验统计量取值: t=____检验p值=_______结论:拒绝/接受H0.二、两独立组样本(服从正态总体)进行均值比较(习题1.22) 为比较甲、乙两种安眠药的疗效,将20名患者分成两组,每组10人,假定服药后延长的睡眠时间都近似服从正态分布且方差相等,测得其数据如下:1.9, 0.8, 1.1, 0.1, -0.1, 4.4, 5.5, 1.6, 4.6, 3.40.7, -1.6, -0.2, -1.2, -0.1, 3.4, 3.7, 0.8, 0, 2试问在显著性水平a=0.05下检验两种安眠药的疗效有无显著性差异,p值是多少?1. 建数据集前面的“分析家”界面不要关闭,切换到程序编辑窗口,输入程序。
Data d22;Input x y;Cards;1.9 0.70.8 -1.61.1 -0.20.1 -1.2-0.1 -0.14.4 3.45.5 3.71.6 0.84.6 03.4 2;Run;2. 使用“SAS/分析家”菜单(1)回到“分析家”界面,调出数据文件work.d22(2)确定分析方法。
选择级联菜单:“统计”➢“假设检验”➢“均值的双样本T检验”(3)设置数据集work.d22中,各样本分组数据对应的变量个数:“Two variables”。
(4)输送变量。
将变量“x”输送给“group1”,“y”输送给“group2”,单击“OK”(5)输出结果如下(6)涉及到两独立组的方差,继续检验两组方差是否相等。
回到“分析家”界面上,选择级联菜单“统计”➢“假设检验”➢“方差的双样本T检验”(7)输送变量。
将变量“x”输送给“group1”,“y”输送给“group2”,单击“OK”。
(8)输出结果如下3. 解答H0: σ1=σ2 H1: σ1≠σ2检验方法:F检验统计量取值:F=____检验p值=_______结论:拒绝/接受H0.两独立组的方差是/否相等。
H0: μ1=μ2 H1: μ1≠μ2检验方法:t检验统计量取值: t=____检验p值=_______结论:拒绝/接受H0. 两种安眠药的疗效有/无显著性差异三、两对照组样本(服从正态总体)进行均值比较(习题1.24)甲、乙两种稻种分别播种在10块试验田中,每块试验田甲、乙稻种各种一半。
假设同一块田中两种作物的产量之差服从正态分布。
现获10块田的成对产量如下表所示(单位:公斤),试问两种稻种产量有无显著性差异(a=0.05),p值是多少?1. 建数据集Data d24;Input x y @@ ;Cards;140 135 137 138 136 125 140 140 145 128148 131 140 130 135 140 144 131 141 125;Run;2. 使用“SAS/分析家”菜单(1)回到“分析家”界面,调出数据文件work.d24(2)确定分析方法。
选择级联菜单:“统计”➢“假设检验”➢“均值的双样本成对T检验”(3)输送变量。
设置各分组数据对应的变量个数:“Two variables”,并输送变量“x”“y”,单击“OK”,得到输出结果如下:3. 解答H0: μ1=μ2 H1: μ1≠μ2检验方法:t检验统计量取值:t=____检验p值=_______结论:拒绝/接受H0,两种稻种产量有/无显著性差异.实验三非参数检验【实验目的】1.掌握卡方检验(A);2.熟悉符合检验、符号秩和检验、秩和检验。
【实验原理】非参数统计是统计分析的重要组成部分。
可是与之很不相称的是它的理论发展远远不及参数检验完善,因而比较完善的可供使用的方法也不多。
在SAS中,非参数统计主要由UNIVARIATE过程、MEANS过程和NPAR1WAY过程来实现,使用SAS的“分析家”系统可以方便地进行界面操作。
【实验项目设计】1.对列联表,检验行变量与列变量的关联性;2.给定一组未知总体的样本数据,检验μ=μ0;3.给定两组未知总体的样本数据,检验μ1=μ2。
【实验内容】一、对列联表,检验行变量与列变量的关联性(习题4.7) 下表为某药治疗感冒效果的3x3列表。
疗效\年龄儿童成年老年合计显著58 38 32 128一般28 44 45 117较差23 18 14 55合计109 100 91 300试问:疗效与年龄是否关联(a=0.05)?1. 建数据集Data d0407;Do effect='显著', '一般','较差';Do age='儿童','成年','老年';input num @@;output;end;end;Cards;58 38 3228 44 4523 18 14;Run;2. 使用“SAS/ 分析家”菜单(6)打开“分析家”界面。
(7)调出数据文件Work.D0407。
(8)确定分析方法。
选择界面上的级联菜单:“统计”➢“表分析”得到列联表的空白界面。
(9)输送变量。
选中变量“effect”,单击“Row”按钮;选中变量“age”,单击“Column”按钮;选中变量“num”,单击“Cell Counts”按钮。
完成变量输送。
显示如下。
(10)选择附加的统计方法。
在列联表分析(Table Analysis)界面的右边下角,点击“statistics”按钮,打开选项设置页。
勾选“chi-square statistics”。
如图所示。
单击“OK”按钮。
值得一提的是,卡方检验默认使用近似计算,目的是为了节省时间。
当然也可以勾选中间的“Exact test ”选项卡,来指定精确检验,只是某些时候的运行时间无法控制。