SAS+8.2+Enterprise+Miner数据挖掘实例

合集下载

SAS+8.2+Enterprise+Miner数据挖掘实例

SAS+8.2+Enterprise+Miner数据挖掘实例

SAS 8.2 Enterprise Miner数据挖掘实例目录1.SAS 8.2 Enterprise Miner简介 (2)2.EM工具具体使用说明 (2)3.定义商业问题 (3)4.创建一个工程 (4)4.1调用EM (4)4.2新建一个工程 (5)4.3应用工作空间中的节点 (6)5.数据挖掘工作流程 (6)5.1定义数据源 (6)5.2探索数据 (8)5.2.1设置Insight节点 (8)5.2.2察看Insight节点输出结果 (9)5.3准备建模数据 (11)5.3.1建立目标变量 (11)5.3.2设置目标变量 (13)5.3.3数据分割 (21)5.3.4替换缺失值 (22)5.4建模 (23)5.4.1回归模型 (23)5.4.2决策树模型 (25)5.5评估模型 (28)5.6应用模型 (30)5.6.1抽取打分程序 (30)5.6.2引入原始数据源 (31)5.6.3查看结果 (32)6.参考文献: (34)1.SAS 8.2 Enterprise Miner简介数据挖掘就是对观测到的庞大数据集进行分析,目的是发现未知的关系和以数据拥有者可以理解并对其有价值的新颖方式来总结数据。

[1]一个数据挖掘工程需要足够的软件来完成分析工作,为了计划、实现和成功建立一个数据挖掘工程,需要一个集成了所有分析阶段的软件解决方案,包括从数据抽样到分析和建模,最后公布结果信息。

大部分专业统计数据分析软件只实现特定的数据挖掘技术,而SAS 8.2 Enterprise Miner是一个集成的数据挖掘系统,允许使用和比较不同的技术,同时还集成了复杂的数据库管理软件。

SAS 8.2 Enterprise Miner把统计分析系统和图形用户界面(GUI)集成在一起,并与SAS协会定义的数据挖掘方法——SEMMA方法,即抽样(Sample)、探索(Explore)、修改(Modify)建模(Model)、评价(Assess)紧密结合,对用户友好、直观、灵活、适用方便,使对统计学无经验的用户也可以理解和使用。

sas数据分析案例

sas数据分析案例

sas数据分析案例SAS数据分析案例。

在实际工作中,数据分析是一项非常重要的工作。

SAS作为一种常用的数据分析工具,被广泛应用于各个行业中。

本文将通过一个实际案例来介绍SAS在数据分析中的应用。

案例背景:某电商公司希望了解其用户的购物行为,以便更好地制定营销策略和提升用户体验。

为了实现这一目标,他们收集了大量的用户购物数据,包括用户的基本信息、购买记录、浏览记录等。

数据准备:首先,我们需要对收集到的数据进行清洗和整理。

这包括去除重复数据、处理缺失值、统一数据格式等工作。

在SAS中,我们可以使用数据步和PROC SQL等工具来完成这些任务。

数据分析:一、用户购买行为分析。

我们可以通过对用户购买记录的统计分析,来了解用户的购买习惯和偏好。

比如,我们可以计算用户的购买频次、购买金额分布、购买时间分布等指标,从而找出用户的消费特点。

二、用户行为路径分析。

除了购买行为,用户在网站上的浏览行为也是非常重要的。

我们可以利用SAS的数据挖掘功能,对用户的浏览记录进行分析,找出用户的行为路径,了解用户在网站上的行为轨迹。

三、用户画像分析。

通过对用户的基本信息进行分析,我们可以建立用户的画像,包括用户的性别、年龄、地域分布等特征。

这些信息对于制定个性化营销策略非常有帮助。

结果呈现:在数据分析完成后,我们需要将分析结果进行可视化呈现。

SAS提供了丰富的图表和报表功能,可以将分析结果直观地展现出来,帮助决策者更好地理解数据。

结论与建议:通过对用户购物数据的分析,我们可以得出一些结论和建议,比如哪些产品更受用户欢迎、哪些时段用户购物活跃度更高、哪些地区的用户消费能力更强等。

这些结论可以为公司的营销策略和产品推广提供参考。

总结:本文通过一个实际案例,介绍了SAS在数据分析中的应用。

SAS作为一种强大的数据分析工具,可以帮助企业更好地理解和利用数据,从而实现商业目标。

以上就是关于SAS数据分析案例的全部内容,希望对大家有所帮助。

sas数据挖掘实例

sas数据挖掘实例

sas数据挖掘实例数据挖掘是从大数据中获取有价值的信息的过程。

SAS作为业内领先的数据分析软件,具有强大的数据挖掘功能。

本文将通过一个SAS数据挖掘实例,来介绍SAS数据挖掘的相关知识和技术。

实例简述本次实例选取了一个经典的数据集:鸢尾花数据集(Iris Dataset)。

该数据集是由英国统计学家和生物学家Ronald Fisher在1936年收集而来,由三种不同的鸢尾花,每种鸢尾花各50个样本,共计150个样本。

每个样本都有四个特征:花萼长度、花萼宽度、花瓣长度、花瓣宽度。

我们的目标是使用SAS对该数据集进行数据挖掘,从中分析出不同鸢尾花的数据模式和特征。

数据预处理在进行数据挖掘之前,我们需要对原始数据进行处理,使其符合数据挖掘的要求。

首先,我们需要将数据导入到SAS软件中。

SAS支持导入多种类型的数据,如CSV、Excel、TXT等。

由于我们的鸢尾花数据集为CSV格式,因此我们可以使用以下代码将其导入SAS:```SASproc import datafile='iris.csv'out=irisdbms=csv;getnames=yes;run;```代码中,我们使用了`proc import`命令,将CSV格式的`iris`文件导入到SAS中,并将其保存为SAS数据集`iris`。

同时,我们使用了`getnames=yes`参数,表示将文件的第一行作为变量名导入。

接下来,我们需要查看数据集的基本信息。

SAS提供了多种查看数据集信息的方法,此处我们使用`proc contents`命令可以查看数据集的变量名、变量类型、样本数等信息。

```SASproc contents data=iris;run;```运行后,SAS会在日志窗口输出数据集的基本信息。

我们发现该数据集共有150个样本,每个样本有四个连续型变量:花萼长度、花萼宽度、花瓣长度和花瓣宽度。

数据可视化在进行数据挖掘之前,我们还可以使用SAS提供的可视化工具对数据集进行探索分析。

应用SASEM进行数据挖掘

应用SASEM进行数据挖掘
03
成本较高:由于SAS EM是商业软件,其价格相对较高,可能不适合 小型企业和个人用户。
04
开放性不足:与其他开源工具相比,SAS EM的开放性较低,限制了 用户对其进行定制和扩展的能力。
SAS EM的未来发展前景
1 2 3
持续优化与升级
随着技术的不断发展,SAS EM将继续优化算法 和界面,提高数据挖掘的效率和准确性。
案例三:销售预测
总结词
利用SAS EM进行销售预测,通过分析历 史销售数据和市场趋势,预测未来的销 售情况,帮助企业制定合理的生产和销 售计划。
VS
详细描述
在销售预测中,SAS EM通过时间序列分 析方法,分析历史销售数据和市场趋势, 预测未来的销售情况。通过对不同产品、 地区、销售渠道的销售数据进行整合和分 析,SAS EM能够发现销售规律和市场变 化趋势,为企业制定合理的生产和销售计 划提供依据,提高企业的市场竞争力。
应用SAS EM进行数据挖掘
目录
• SAS EM简介 • 数据挖掘流程在SAS EM中的实现 • 案例分析 • SAS EM与其他数据挖掘工具的比较 • 结论
01
SAS EM简介
SAS EM是什么
SAS Enterprise Miner(EM)是SAS公司开发的一款数据挖掘 软件,它提供了一套完整的数据挖掘解决方案,包括数据预处 理、模型构建、模型评估和部署等。
它基于图形化界面,用户可以通过拖放节点的方式进行数据 挖掘任务的构建,无需编写复杂的代码,大大降低了数据挖 掘的门槛。
SAS EM的特点与优势
易用性
高效性
SAS EM提供了直观的图形化界面,用户可 以通过简单的拖放操作完成数据挖掘流程 的构建,无需具备深厚的编程基础。

sas数据仓库与数据挖掘

sas数据仓库与数据挖掘

SAS数据仓库与数据挖掘介绍SAS(Statistical Analysis System)是一种常用于数据分析和数据挖掘的软件。

它包含一系列模块,其中包括了强大的数据仓库和数据挖掘工具。

本文将介绍SAS数据仓库和数据挖掘的概念、特点和应用场景,并提供一些使用SAS进行数据仓库和数据挖掘的示例。

数据仓库数据仓库是存储和管理大量数据的集中式数据库系统。

它具有以下特点:•集成性:数据仓库从不同的数据源中收集、组织和储存数据,实现了数据的集成。

•主题性:数据仓库按照特定的主题进行组织,例如客户、销售、库存等,方便用户进行针对性的分析。

•时态性:数据仓库储存的数据是历史数据,可以追溯到不同的时间点,用户可以进行历史数据的分析和比较。

•稳定性:数据仓库的数据一般是只读的,不会频繁更新,保证了数据的稳定性和一致性。

•冗余性:数据仓库通过冗余存储数据,提高了查询和分析的效率。

SAS数据仓库通过SAS软件来构建和管理。

用户可以使用SAS的数据集和库来组织数据,并使用SAS的数据整理和转换工具来处理数据。

SAS还提供了丰富的数据分析和报告工具,方便用户从数据仓库中获取需要的信息。

数据挖掘数据挖掘是从大量数据中发现隐含模式、规律和知识的过程。

它结合了统计学、、机器学习等多个领域的技术和方法。

数据挖掘可以帮助用户发现数据中的趋势、关联规则、异常点等,并预测未来的趋势和行为。

SAS提供了丰富的数据挖掘工具和算法,帮助用户进行数据挖掘分析。

例如,SAS Enterprise Miner是一个常用的数据挖掘工具,提供了多种算法和模型,包括聚类、分类、回归、关联规则等。

用户可以使用SAS Enterprise Miner来构建数据挖掘流程,并对数据集进行挖掘和分析。

SAS数据仓库与数据挖掘的应用场景SAS数据仓库和数据挖掘在各个行业和领域都有广泛的应用,以下是一些常见的应用场景:零售业零售业可以使用SAS数据仓库来集成和分析各种销售数据、库存数据、客户数据等。

SAS数据挖掘方法

SAS数据挖掘方法

SAS 数据挖掘的方法一、基本概念那么什么是数据挖掘呢?简单地说,数据挖掘是从大量的数据中,抽取出潜在的、有价值的知识、模型或规则的过程。

对于企业而言,数据挖掘有助于发现业务的趋势,揭示已知的事实、预测未知的结果。

从这个意义上讲,知识是力量,数据挖掘是财富。

二、SAS 数据挖掘的方法(SEMMA) 作为智能型的数据挖掘集成工具,SAS/EM 的图形化界面、可视化操作可引导用户(即使是数理统计经验不太多的用户)按SEMMA 原则成功地进行数据挖掘,用户只要将数据输入,经过SAS/EM 运行,即可得到一些分析结果。

有经验的专家还可通过修改数据调整分析处理过程。

SAS/EM 可实现同数据仓库和数据集市、商务智能及报表工具的无缝集成,它内含完整的数据获取工具、数据取样工具、数据筛选工具、数据变量转换工具、数据挖掘数据库、数据挖掘过程以及数据挖掘评价工具。

「Sample ---- 数据取样当进行数据挖掘时,首先要从企业大量数据中取出一个与你要探索问题相关的样板数据子集,而不是动用全部企业数据。

通过数据取样,要把好数据的质量关,一定要保证取样的代表性、真实性、完整性和有效性。

这样才能通过此后的分析研究得出反映本质规律性的结果。

2. Explore 据特征探索、分析和予处理当我们拿到了一个样本数据集后,它是否达到我们原来设想的要求;其中有没有什么明显的规律和趋势;有没有出现你所从未设想过的数据状态;因素之间有什么相关性;它们可区分成怎样一些类别……这都是要首先探索的内容。

进行数据特征的探索、分析,最好是能进行可视化的操作,如SAS 的SAS/INSIGHT 和SAS/SPECTRAVIEW 。

这两个产品给你提供了可视化数据操作的最强有力的工具、方法和图形。

它们不仅能做各种不同类型统计分析显示,而且可做多维、动态、甚至旋转的显示。

应用这两个工具对样本数据进行预分析、推测主要的数据、异常趋势和规律性。

3. Modify ——问题明确化、数据调整和技术选择通过Sample 和explore 两步之后,对原来要解决的问题可能会有了进一步的明确,这时要尽可能对问题解决的要求能进一步的量化。

SAS EM实例进阶

SAS EM实例进阶

SAS EM实例进阶Created by:Ning Gang****************HP GDCC GAPSE2008-12-29 1.SAS Enterprise Miner简介1.1. 数据挖掘简介数据仓库的发展,为分析人员提供了在各种层次上、历史回溯的数据信息。

对未来的信息要进行预测,这就演化出来数据挖掘技术。

数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。

目前数据挖掘应用于很多行业中,来解决众多的商业问题,如数据库营销(Database Marketing)、客户群体划分(Customer Segmentation & Classification)、背景分析(Profile Analysis)、交叉销售(Cross-selling)等市场分析行为,以及客户流失性分析(Churn Analysis)、客户信用记分(Credit Scoring)、欺诈发现(Fraud Detection)等等。

1.2. EM简介SAS Enterprise Miner简称EM,它把统计分析系统和图形用户界面(GUI)紧密结合,对用户友好、直观、灵活、使用方便,使对统计学无经验的用户也可以理解和使用。

SAS定义了数据挖掘方法——SEMMA方法,即抽样(Sample)、探索(Explore)、修改(Modify)、建模(Model)、评价(Assess)。

以下SEMMA方法从SAS Help文档中拷贝,不再翻译以求理解准确。

∙Sample the data by creating one or more data tables. The sample should be large enough to contain the significant information, yet smallenough to process.∙Explore the data by searching for anticipated relationships, unanticipated trends, and anomalies in order to gain understanding and ideas.∙Modify the data by creating, selecting, and transforming the variables to focus the model selection process.∙Model the data by using the analytical tools to search for a combination of the data that reliably predicts a desired outcome.Assess the data by evaluating the usefulness and reliability of the findings from the data mining process.EM建立分析流程中,不必包含SEMMA方法每一步,同时其中的步骤可以重复出现。

数据挖掘主要工具软件简介

数据挖掘主要工具软件简介

数据挖掘主要工具软件简介Dataminning指一种透过数理模式来分析企业内储存的大量资料,以找出不同的客户或市场划分,分析出消费者喜好和行为的方法。

前面介绍了报表软件选购指南,本篇介绍数据挖掘常用工具。

市场上的数据挖掘工具一般分为三个组成部分:a、通用型工具;b、综合/DSS/OLAP数据挖掘工具;c、快速发展的面向特定应用的工具。

通用型工具占有最大和最成熟的那部分市场。

通用的数据挖掘工具不区分具体数据的含义,采用通用的挖掘算法,处理常见的数据类型,其中包括的主要工具有IBM 公司Almaden 研究中心开发的QUEST 系统,SGI 公司开发的MineSet 系统,加拿大Simon Fraser 大学开发的DBMiner 系统、SAS Enterprise Miner、IBM Intelligent Miner、Oracle Darwin、SPSS Clementine、Unica PRW等软件。

通用的数据挖掘工具可以做多种模式的挖掘,挖掘什么、用什么来挖掘都由用户根据自己的应用来选择。

综合数据挖掘工具这一部分市场反映了商业对具有多功能的决策支持工具的真实和迫切的需求。

商业要求该工具能提供管理报告、在线分析处理和普通结构中的数据挖掘能力。

这些综合工具包括Cognos Scenario和Business Objects等。

面向特定应用工具这一部分工具正在快速发展,在这一领域的厂商设法通过提供商业方案而不是寻求方案的一种技术来区分自己和别的领域的厂商。

这些工具是纵向的、贯穿这一领域的方方面面,其常用工具有重点应用在零售业的KD1、主要应用在保险业的Option&Choices和针对欺诈行为探查开发的HNC软件。

下面简单介绍几种常用的数据挖掘工具:1. QUESTQUEST 是IBM 公司Almaden 研究中心开发的一个多任务数据挖掘系统,目的是为新一代决策支持系统的应用开发提供高效的数据开采基本构件。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

SAS 8.2 Enterprise Miner数据挖掘实例目录1.SAS 8.2 Enterprise Miner简介 (2)2.EM工具具体使用说明 (2)3.定义商业问题 (3)4.创建一个工程 (4)4.1调用EM (4)4.2新建一个工程 (5)4.3应用工作空间中的节点 (6)5.数据挖掘工作流程 (6)5.1定义数据源 (6)5.2探索数据 (8)5.2.1设置Insight节点 (8)5.2.2察看Insight节点输出结果 (9)5.3准备建模数据 (11)5.3.1建立目标变量 (11)5.3.2设置目标变量 (13)5.3.3数据分割 (21)5.3.4替换缺失值 (22)5.4建模 (23)5.4.1回归模型 (23)5.4.2决策树模型 (25)5.5评估模型 (28)5.6应用模型 (30)5.6.1抽取打分程序 (30)5.6.2引入原始数据源 (31)5.6.3查看结果 (32)6.参考文献: (34)1.SAS 8.2 Enterprise Miner简介数据挖掘就是对观测到的庞大数据集进行分析,目的是发现未知的关系和以数据拥有者可以理解并对其有价值的新颖方式来总结数据。

[1]一个数据挖掘工程需要足够的软件来完成分析工作,为了计划、实现和成功建立一个数据挖掘工程,需要一个集成了所有分析阶段的软件解决方案,包括从数据抽样到分析和建模,最后公布结果信息。

大部分专业统计数据分析软件只实现特定的数据挖掘技术,而SAS 8.2 Enterprise Miner是一个集成的数据挖掘系统,允许使用和比较不同的技术,同时还集成了复杂的数据库管理软件。

SAS 8.2 Enterprise Miner把统计分析系统和图形用户界面(GUI)集成在一起,并与SAS协会定义的数据挖掘方法——SEMMA方法,即抽样(Sample)、探索(Explore)、修改(Modify)建模(Model)、评价(Assess)紧密结合,对用户友好、直观、灵活、适用方便,使对统计学无经验的用户也可以理解和使用。

Enterprise Miner简称EM,它的运行方式是通过在一个工作空间(workspace)中按照一定的顺序添加各种可以实现不同功能的节点,然后对不同节点进行相应的设置,最后运行整个工作流程(workflow),便可以得到相应的结果。

2.EM工具具体使用说明EM中工具分为七类:⏹Sample类包含Input Data Source、Sampling、Data Partition⏹Explore类包含Distribution Explorer、Multiplot、Insight、Association、Variable Selection、Link Analysis(Exp.)⏹Modify类包含Data Set Attribute、Transform Variable、FilterOutliers、Replacement、Clustering、SOM/Kohonen、Time Series(Exp.)⏹Medel类包括Regression、Tree、Neural Network、Princomp/Dmneural、User Defined Model、Ensemble、Memory-Based Reasoning、Two Stage Model⏹Assess类包括Assessment、Reporter⏹Scoring类包括Score、C*Score⏹Utility类包括Group Processing、Data Mining Database、SASCode、Control point、Subdiagram每个节点的具体使用方法可以在EM打开界面,选择SAS主菜单中帮助子菜单中的“EM参考资料”选项,进一步查看各个节点的具体使用方法。

下面我们将以客户商品信息为例来建立如下的工作流程,从而引导我们学会使用EM(Enterprise Miner)。

3.定义商业问题假设有一家目录服务公司每个月都要向发出一份服饰用品和家用器皿的商品目录。

为了更好的面对商品战,公司打算发出一张主要宣传厨房用品(dining),包括厨具(kitchenware)、器皿(dishes)和餐具(flatware)的目录。

由于对所有的客户发送目录的成本是公司无法承受的,所以公司需要把目标锁定在那些有购买倾向的客户。

我们可以通过EM来建立一个倾向模型来完成这个任务,从而得到一个邮寄对象列表。

要完成这个任务我们需要准备好关于客户购买产品记录的数据库表,表中应该包含近两年内客户是否购买了厨具(kitchenware)、器皿(dishes)和餐具(flatware)的数据,以及其他与客户购买倾向相关的变量。

我们这里根据客户购买的历史数据建立起来了数据集(数据库表)CUSTDET1,它包含了49个变量。

上表中的Total Dining (kitch+dish+flat)变量是我们新建的变量,它的值等于Kitchen Product、Dishes Purchase和Flatware Purchase三个变量的值的和,这个变量可以用来预示客户购买厨房用品(dining)的倾向,同时也是建模的基础。

当建立好这个数据集以后,相当于我们已经为我们的挖掘准备好了数据源,接下来我们就可以在EM的工作空间(workspace)里建立我们的挖掘工作流程(workflow)了。

4.创建一个工程4.1调用EM启动SAS系统后,有两种方式调用EM,一种是通过菜单调用,一种是通过在命令窗口输入命令调用。

菜单方式在SAS系统主菜单中选择“解决方案—〉分析—〉企业数据挖掘”命令方式在SAS命令窗口输入miner后按回车。

4.2新建一个工程在EM窗口打开后,建立一个新数据挖掘工程的步骤如下:(1)在SAS主菜单中选择“文件—〉新建—〉项目”,会出现建立新项目的对话框,在Create new project窗口中的Name域输入Dining List。

(2)单击Create按钮后,Dining List工程名将显示在EM窗口的左侧,下面是默认的工作流的名称Untitled,单击Untitled输入新的工作流名称Propensity,如下图所示,则一个名为Propensity的工作流程就建立起来了。

4.3应用工作空间中的节点EM中的挖掘程序需要通过设置相应的节点的方式实现,节点是EM的一个重要组成部分,在EM中的挖掘任务都是通过拖拽、右单击、双击节点等操作实现的。

在图3中单击左下方的tools标签,所有可以使用的带名称的节点分组列表显示。

部分工具也可以通过EM窗口顶部的菜单栏来选择,将鼠标在相应的节点上停留1-2秒钟可以显示节点的名称。

5.数据挖掘工作流程EM工作流程主要包括六个环节:定义数据源(Input Data Source)、探索数据(Explore data)、为建模准备数据(Prepare data for modeling)、建立模型(Build model)、评价模型(Evaluate model)和应用模型(Apply model),每个环节可能由一个或多个节点来完成。

5.1定义数据源EM定义数据源的工具是Input Data Source节点,利用Input Data Source 节点引入一个数据源的过程如下:(1)在名为Input Data Source的节点上按住鼠标左键,将其拖拽到EM 窗口右侧的空白工作区中释放,则工作区中会出现一个新的InputData Source节点。

双击该节点会出现Input Data Source窗口(2)单击select按钮,会出现SAS Data Set窗口,其中SASUSER为默认数据集库。

tables下面是SASUSER库中所有可以选择的数据集,这里我们选择CUSTDET1作为我们的数据源。

(3)选择CUSTDET1后单击OK按钮可以返回到Input Data Source窗口可以看到当选择完数据源以后,EM会自动创建节点输出数据和元数据样本。

元数据样本的默认容量(size)是2000,当数据源的记录小于2000时,元数据容量会等于数据源的大小。

如果需要改动元数据样本大小可以通过单击change 按钮实现。

(4)选择完数据源后关闭Input Data Source会弹出对话框,(5)单击“是”按钮保存修改返回到EM工作区,EM会自动将Input Data Source节点名称改为所选数据集的名称。

5.2探索数据数据源中的缺失值、边界值、不规则分布都可能会影响到挖掘得建模甚至歪曲挖掘得结果。

所以,清楚的了解数据源的内容和结构对于建立一个数据挖掘项目来说是非常重要的。

5.2.1设置Insight节点EM实现探索数据的步骤如下:(1)将Insight节点拖拽到工作区中方在名为SASUSER.CUSTDET1的Input Data Source节点下方。

(2)连接Input Data Source节点和Insight节点:A.单击空白工作区B.将鼠标箭头移动到Input Data Source 节点边缘,使鼠标箭头变为十字形状C.按住鼠标左键滑动到Insight节点后释放,单击空白工作D.出现从Input Data Source到Insight的一个箭头(3)双击Insight节点,出现Insight Settings窗口由于不同的数据源的数据量可能不同,而且有些数据源的数据量可能是非常巨大的,所以Insight节点默认抽取2000条数据记录来探索数据源,当数据源的记录数小于2000时,可以选择Insight Based On设置中的Entire data set 来改变探索数据的样本数量。

(4)单击Entire data set后关闭Insight Settings窗口,在弹出对话框中单击“是”保存设置5.2.2察看Insight节点输出结果当设置完Insight节点之后,通过运行该节点可以查看探索数据的结果,其过程如下:(1)右单击Insight节点,在弹出菜单中选择Run运行该节点,运行过程中节点的四周会变成绿色,运行完毕会有运行结果的提示对话框(2)单击“是”可以察看运行结果。

Insight运行结果将数据源以二维表视图的形式显示(3)单击SAS主菜单中的“分析”,选择下拉菜单中的“分布”,将弹出选择察看分布的变量的窗口(4)单击第一个变量PURCHASE后将滚动条拖到最后一个变量,按住Shift键单击最后一个变量SEX,当所有的变量都被选择上后单击“Y”按钮,然后确定,会出现所有变量的分布窗口。

其中包括每个变量的分布图和一些重要的统计变量以及一组分位数。

相关文档
最新文档