数据挖掘实验报告 超市商品销售分析及数据挖掘

合集下载

数据挖掘技术在超市销售中的创新应用案例

数据挖掘技术在超市销售中的创新应用案例

数据挖掘技术在超市销售中的创新应用案例随着社会信息化的快速发展,数据挖掘技术在各行各业的应用也越来越广泛。

超市作为零售行业的重要一环,积累了大量的销售数据,如何利用这些数据以提升销售效益成为了超市经营者的重要课题。

本文将介绍数据挖掘技术在超市销售中的一些创新应用案例,以期为读者提供一些思路和启示。

1. 基于购物篮分析的商品搭配推荐超市销售的商品种类繁多,消费者在购物时经常遇到选择困难。

通过数据挖掘技术,超市可以根据消费者的购物篮分析出商品之间的关联性,从而向消费者推荐适合搭配购买的商品。

例如,通过分析购买了牛奶的顾客常常同时购买面包,超市可以在牛奶货架附近放置面包,以刺激消费者的购买欲望。

2. 客户细分与个性化推荐超市通过分析顾客的购买行为和偏好,可以将顾客分为不同的细分群体。

例如,通过聚类算法可以将消费者分为对价格敏感的群体和对品牌敏感的群体。

超市可以根据不同群体的特点,采取不同的营销策略,提供个性化的推荐和服务,以提高销售和顾客忠诚度。

3. 库存预测与供应链优化数据挖掘技术可以帮助超市预测商品的销售趋势,从而合理安排库存,并与供应商进行良好的合作和拓展。

通过分析历史销售数据、季节性变化、促销活动等因素,超市可以预测未来商品的需求量,避免库存积压或断货现象的发生,提高库存周转率和利润。

4. 欺诈侦测与风险管理超市在销售过程中也常常面临诸如退货欺诈、偷盗等问题。

数据挖掘技术可以通过对大量数据的分析,识别出异常行为模式,并及时采取相应措施。

例如,通过对顾客购买行为的模式分析,可以发现频繁退货的消费者,从而减少退货造成的损失。

5. 营销活动效果评估与优化超市为了促进销售,常常进行各种营销活动,如打折、促销等。

通过数据挖掘技术,超市可以对不同活动的效果进行评估与分析,优化营销策略。

例如,可以通过对促销活动的销售数据进行分析,了解该促销活动对销售额、顾客流量等的影响,以便调整活动方案,提高活动的效果。

总结:数据挖掘技术在超市销售中的应用呈现出了丰富的创新案例。

超市销售数据分析报告范文

超市销售数据分析报告范文

超市销售数据分析报告范文引言本报告旨在对某超市的销售数据进行分析,并通过对数据的细致剖析,为超市管理团队提供有关业务运营的关键洞察和决策支持。

通过深入了解超市的销售情况和消费趋势,我们可以探索潜在的市场机会,并制定相应的策略来提高超市的销售业绩。

数据来源与方法本报告的数据来源于某超市过去一年的销售记录。

我们收集了包括销售额、销售量、销售日期、商品品类、商品定价等关键信息的数据。

为了对该数据进行分析,我们采用了常用的数据分析方法,其中包括基本统计分析、趋势分析和市场细分等。

销售额分析首先对超市的总销售额进行分析。

根据数据统计,超市在过去一年的销售额为XX万元。

我们进一步将销售额按月进行分析,结果显示超市的销售额呈现出明显的季节性变化。

特别是在假日季节,如圣诞节和感恩节,超市销售额明显增加。

此外,我们还发现周末的销售额较工作日更高,这可能与人们在休闲时间购物的趋势有关。

对销售额按品类进行分析,我们发现食品类和家居用品类是超市的主要销售项。

尤其是食品类的销售额占总销售额的XX%。

通过对销售额的细致分析,超市可进一步优化食品类产品的布局和促销策略,以提高整体销售额。

销售量分析除了销售额,我们还分析了超市的销售量。

销售量的分析可以帮助我们确定哪些商品在超市中销售量较高,以及销售量的趋势和变化。

根据数据统计,某超市在过去一年中总计销售了XX万件商品。

我们进一步将销售量按照不同的时间维度进行分析。

结果显示,超市的销售量呈现出明显的周末和假日效应,与销售额趋势相一致。

此外,我们还发现某些商品在特定季节或假日的销售量明显增加,超市管理团队可以根据这些趋势制定相应的促销计划。

顾客购买行为分析为了更好地了解顾客的购买行为,我们对超市的数据进行了进一步的分析。

根据数据,我们可以确定顾客的购买频次、购买力度以及购买时间段。

这些洞察对于制定精确的市场策略至关重要。

通过对顾客的购买频次进行分析,我们发现超市拥有一大批忠实顾客,他们会经常光顾超市进行购物。

超市收银数据挖掘分析与应用研究

超市收银数据挖掘分析与应用研究

超市收银数据挖掘分析与应用研究随着科技的不断发展和进步,数码化时代的到来,大数据已经成为当代经济社会运行最重要的资源之一,超市收银数据作为其中的一种典型数据,在经营分析、营销策略等方面具有重要意义。

本文将探讨超市收银数据的挖掘分析与应用研究。

一、超市收银数据的重要意义在超市日常经营过程中,收银数据是不可避免的一种数据形式,经过收银机扫描,可以清晰准确地记录下每个顾客的消费信息,包括商品品类、数量、单价等信息,这些数据对于超市的经营管理和市场营销具有较重要的作用。

首先,超市收银数据可以帮助经营者了解顾客购物行为,比如顾客购买力、购买偏好、购买力度等,这些信息可以为经营者提供商业选择和调整商品结构的依据。

例如,顾客对某些商品有较大的购买兴趣,同类商品应进行重点推广和营销。

同时,通过挖掘超市收银数据,可以基于历史数据构建商品购买预测模型,以此为基础推断出未来某一时间段内的销售需求,从而进行合理的备货和安排。

此外,利用数据挖掘技术可以优化超市商品布局,使得商品摆放更加合理,便于顾客更好地了解、选购商品并提高顾客满意度。

二、超市收银数据的挖掘方法超市收银数据一般包括消费者信息、商品名称、数量、价格等关键信息。

针对这些数据,可以通过梳理、清洗和整合等过程,提取出有效数据,建立相应的数学模型,进行数据挖掘和分析。

1.数据梳理和清洗对于超市收银数据而言,最基础的工作就是通过数据机读或数据输入的方式归纳整理出原始数据。

通过横向比较和纵向归类,初步筛选出有用数据和无用数据。

之后,对数据进行清洗操作,如去掉冗余数据、数据填补、数据衍生、数据合并等,从而得到可用于建模的数据集。

2.数据建模基于准备好的数据集,建立数据模型。

常用的建模方法有聚类分析、关联规则挖掘、分类、预测建模等。

其中,聚类分析是将相似项聚集在一起的一种方法,关联规则挖掘是寻找数据中的相关性,分类是将数据按照规定的标准分组,预测建模是基于历史数据预测未来的行为和趋势。

数据挖掘超市案例

数据挖掘超市案例

数据挖掘超市案例本文通过数据挖掘超市案例的实际操作,介绍了数据挖掘在超市运营中的应用。

该超市拥有大量销售数据,其中包括了客户的购买记录、商品的销售情况以及顾客的信息等。

通过对这些数据进行处理和分析,可以发现一些规律和特点,从而为超市的运营管理提供有力的支持。

数据挖掘步骤一、数据预处理该超市的销售数据包括购买记录、商品信息和顾客信息等,但数据之间存在冗余、缺失或者错误等问题,因此需要进行数据预处理。

数据预处理的步骤包括:1、数据清洗:排除异常数据和错误数据,通过统计分析和可视化技术发现缺失数据。

2、数据变换:将数据转换成可处理的形式,比如将类别数据转换成数值型数据。

3、数据集成:将多个数据源中的数据整合到一个数据集中,以便进行分析。

4、数据采样:对数据集进行采样以达到更好的分析速度和准确度。

二、数据分析1、关联规则分析关联规则分析是一种有效的方法,用于识别销售数据中的有用关系。

在该超市的销售数据中,例如一个客户买了 A 和 B,那么他有多大的可能会买 C?这些统计结果可以帮助超市了解哪些商品相互配合销售得最好,进而优化商品陈列和促销策略。

2、分类分析分类分析是一种用于将数据分类为不同类别的技术,比如根据客户购买历史和偏好将客户分类。

基于这些分类结果,超市可以定制促销和广告策略,有针对性的推销相关商品,从而提高销售额。

聚类分析是一种将数据分为相似群组的技术,在该超市的销售数据中,可以帮助将顾客分为不同群组,从而更好地理解顾客的需求。

聚类分析还可以用于发现商品之间的关联关系,为商品组合和定价提供参考。

三、预测分析预测分析可以为超市预测未来的销售趋势,识别潜在的规律和影响因素,比如商品的时令性和周边环境的变化等。

预测分析可以为超市提供制定未来发展方向的重要指导,有助于提高超市产品的竞争力。

综上所述,通过数据挖掘技术,超市可以更好地理解客户需求,优化商品陈列和促销策略,提高销售额,并为未来的发展提供有力支持。

数据挖掘实验报告结论(3篇)

数据挖掘实验报告结论(3篇)

第1篇一、实验概述本次数据挖掘实验以Apriori算法为核心,通过对GutenBerg和DBLP两个数据集进行关联规则挖掘,旨在探讨数据挖掘技术在知识发现中的应用。

实验过程中,我们遵循数据挖掘的一般流程,包括数据预处理、关联规则挖掘、结果分析和可视化等步骤。

二、实验结果分析1. 数据预处理在实验开始之前,我们对GutenBerg和DBLP数据集进行了预处理,包括数据清洗、数据集成和数据变换等。

通过对数据集的分析,我们发现了以下问题:(1)数据缺失:部分数据集存在缺失值,需要通过插补或删除缺失数据的方法进行处理。

(2)数据不一致:数据集中存在不同格式的数据,需要进行统一处理。

(3)数据噪声:数据集中存在一些异常值,需要通过滤波或聚类等方法进行处理。

2. 关联规则挖掘在数据预处理完成后,我们使用Apriori算法对数据集进行关联规则挖掘。

实验中,我们设置了不同的最小支持度和最小置信度阈值,以挖掘出不同粒度的关联规则。

以下是实验结果分析:(1)GutenBerg数据集在GutenBerg数据集中,我们以句子为篮子粒度,挖掘了林肯演讲集的关联规则。

通过分析挖掘结果,我们发现:- 单词“the”和“of”在句子中频繁出现,表明这两个词在林肯演讲中具有较高的出现频率。

- “and”和“to”等连接词也具有较高的出现频率,说明林肯演讲中句子结构较为复杂。

- 部分单词组合具有较高的置信度,如“war”和“soldier”,表明在林肯演讲中提到“war”时,很可能同时提到“soldier”。

(2)DBLP数据集在DBLP数据集中,我们以作者为单位,挖掘了作者之间的合作关系。

实验结果表明:- 部分作者之间存在较强的合作关系,如同一研究领域内的作者。

- 部分作者在多个研究领域均有合作关系,表明他们在不同领域具有一定的学术影响力。

3. 结果分析和可视化为了更好地展示实验结果,我们对挖掘出的关联规则进行了可视化处理。

通过可视化,我们可以直观地看出以下信息:(1)频繁项集的分布情况:通过柱状图展示频繁项集的分布情况,便于分析不同项集的出现频率。

数据挖掘技术在超市销售中的创新应用探索

数据挖掘技术在超市销售中的创新应用探索

数据挖掘技术在超市销售中的创新应用探索超市作为零售行业的主要组成部分,在消费者和商品之间扮演着重要的角色。

随着信息技术的快速发展,数据挖掘技术在超市销售中的应用也得到了广泛关注。

本文将探讨数据挖掘技术在超市销售中的创新应用,并分析其对超市业务决策的影响。

一、市场篮子分析市场篮子分析是数据挖掘技术在超市销售中最常见的应用之一。

通过挖掘顾客购物篮中的商品组合,超市可以了解不同产品之间的关联性,发现潜在的购买规律,并利用这些规律进行营销推广。

例如,当一位顾客购买了牛奶和面包时,超市可以推送优惠券给该顾客购买黄油,从而提高商品的销售量。

二、个性化推荐系统个性化推荐系统是数据挖掘技术在超市销售中的另一个创新应用。

通过对顾客历史购买记录、个人信息和购物偏好进行分析,超市可以为每位顾客提供个性化的商品推荐。

个性化推荐系统不仅有助于提升顾客购物体验,还能增加超市的销售额。

例如,当一位顾客购买了一瓶红酒,超市可以向该顾客推荐相似类型的葡萄酒或配套的美食,以提高交叉销售率。

三、库存管理与预测数据挖掘技术在超市销售中的另一个创新应用是库存管理与预测。

通过对历史销售数据进行分析,超市可以预测不同商品的需求量,并合理安排库存。

这有助于避免库存过剩或缺货的情况,提高超市的运营效率。

同时,超市还可以利用数据挖掘技术对商品进行分类,根据不同商品的销售情况进行定价和促销策略的优化。

四、顾客行为分析数据挖掘技术在超市销售中还可以用于顾客行为分析。

通过对顾客购买行为的挖掘,超市可以分析不同顾客的购买偏好、消费能力和购物习惯等,并据此制定针对不同顾客群体的营销策略。

例如,对于高消费能力的顾客,超市可以提供更高档次的商品和专属的会员服务;对于高频率购买的顾客,超市可以通过积分系统激励他们保持忠诚度。

综上所述,数据挖掘技术在超市销售中的创新应用为超市提供了更多的商业机会和竞争优势。

通过市场篮子分析、个性化推荐系统、库存管理与预测以及顾客行为分析,超市可以更加精细化地管理和运营自己的业务,提高销售效果和顾客满意度。

foodmart数据挖掘文档

foodmart数据挖掘文档

Foodmart数据挖掘实验报告组员:胡海 2007215016雷海 2007215056张娟 2007215032余星 2007215006田竞波 2007215068彭锐 2007215064实验环境:OS:windows7 RAM:2G目录1.为什么要进行数据挖掘 02.实验对象 03.挖掘方法 04.挖掘的详细过程 (1)5.挖掘的结果 (1)总结 (6)1.为什么要进行数据挖掘通过对foodmart数据库的挖掘,掌握基本的数据挖掘方法;大部分的企业营销问题能够通过数据挖掘获得帮助;从海量数据中发掘出有助于销售的规则、模式或者概念;能为商业决策提供关键性数据;根据挖掘出的结果进行精细化的营销。

2.实验对象Foodmart数据库,里面包含了一家超市3年的详细销售记录。

在这个数据库中包含了以下表顾客详细信息表、种类表、货币表、顾客账户表、星期表、公司部门表、职员表、消费表?、存货清单表、产品详细信息表、产品类别表、促销表、地区表、后备员工详细信息表、工资表、销售事实表、仓库表、时间表(以天做单位)、商店表、仓库等级表。

3.挖掘方法找出购买产品总价值排名前20%的人,并对他们进行分析。

从地址、收入、性别、家中小孩数、教育水平、职业中找出占比例最大的共同特点。

其中找出排名前20%的人的方法是对1997年的销售数据进行汇总,从高到低进行排列。

数据库的执行语句是:SELECT TOP (20) PERCENT SUM(store_sales) AS 总消费, customer_id FROM dbo.sales_fact_1997GROUP BY customer_idORDER BY 总消费 DESC4.挖掘的详细过程新建项目→创建数据源→新建数据源→选择数据源视图→建立挖掘结构→选择聚类分析挖掘技术→根据系统的建议选择相关的列→选择“提供相关建议”中分数大于0.1的列→完成向导→运行数据挖掘模型.5.挖掘的结果图1分类关系图:由该图可以看出分类1、4、2、3、5、7关系逐渐减弱图2:分类关系图图3:分类剖面图2图4:分类特征图图5:分类特征图2图6:分类对比图1图7:分类对比图2在第一挖掘的基础上,我们选择了出现几率较大的几种特征再次进行挖掘图8:分类关系图图9:分类剖面图图10:分类特征图11:分类对比图总结分类剖面图:占比重最大的是学士以上的教育水平,绝大多数的人是住房的拥有者,几乎都没有小孩,职业中为专家和技术工人最多,年收入集中在3万-5万美元分类特征图:显示了总体和个体的特征概率分布总体的概率分布前几位是1、拥有住房2、年收入3万-5万的高收入人群3、职业为专家4、教育水平为:partial school degree此外还可以对每个分类的概率进行查看分类对比图:分类特征图里面的结果不一定能准确的反应结果,在分类对比里面可以查看对应分类和非对应分类的对比情况、这样就更能说明结论。

数据分析与挖掘实验报告

数据分析与挖掘实验报告

数据分析与挖掘实验报告1 引言1.1 实验背景及意义随着信息技术的飞速发展,数据已经渗透到各行各业,成为企业的核心资产之一。

如何从海量的数据中提取有价值的信息,为决策提供支持,成为当前研究的热点问题。

数据分析与挖掘作为一门跨学科的技术,旨在通过数学、统计、计算机等技术手段,从大量复杂的数据中发现潜在的规律和知识。

本实验通过对某企业销售数据的分析与挖掘,旨在为企业提供销售预测和客户分群,为市场策略制定提供科学依据。

1.2 实验目的本实验的主要目的如下:1.掌握数据分析与挖掘的基本方法和流程;2.应用描述性统计分析和探索性数据分析,揭示数据的内在规律;3.利用分类和聚类算法进行数据挖掘,为企业提供有价值的业务洞察;4.分析实验结果,为企业市场策略制定提供依据。

1.3 实验数据来源及预处理本实验所采用的数据来源于某企业的销售数据,包括客户基本信息、购买行为、商品信息等。

为保护企业隐私,数据已经过脱敏处理。

数据预处理主要包括以下步骤:1.数据清洗:去除数据中的空值、重复值和异常值,保证数据质量;2.数据整合:将不同来源的数据进行合并,形成可用于分析的数据集;3.数据转换:将数据转换为适当的格式和类型,便于后续分析。

经过预处理,数据集共包含10000条客户记录,200种商品信息,时间跨度为2019年至2021年。

接下来,我们将基于这些数据展开深入的数据分析与挖掘。

2 数据分析方法与工具2.1 数据分析方法概述2.1.1 描述性统计分析描述性统计分析是数据分析的基础,通过对数据进行汇总和描述,揭示数据的中心趋势和离散程度。

在本实验中,我们采用了均值、中位数、标准差等统计量来描述数据的基本特征,以便对数据集有初步的了解。

2.1.2 探索性数据分析探索性数据分析(EDA)旨在挖掘数据中的潜在规律和关系。

我们通过绘制散点图、直方图、箱线图等,观察数据分布、异常值以及变量之间的关系,为后续的分析和建模提供依据。

2.2 数据挖掘算法介绍2.2.1 分类算法分类算法是基于已有的数据集,通过建立分类模型,对新数据进行分类预测。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

通信与信息工程学院
课程设计说明书
课程名称: 数据仓库与数据挖掘课程设计题目: 超市商品销售分析及数据挖掘专业/班级: 电子商务(理)
组长:
学号:
组员/学号:
开始时间: 2011 年12 月29 日完成时间: 2012 年01 月 3 日
目录
1.绪论 (1)
1.1项目背景 (1)
1.2提出问题 (1)
2.数据仓库与数据集市的概念介绍 (1)
2.1数据仓库介绍 (1)
2.2数据集市介绍 (2)
3.数据仓库 (3)
3.1数据仓库的设计 (3)
3.1.1数据仓库的概念模型设计 (4)
3.1.2数据仓库的逻辑模型设计 (5)
3.2 数据仓库的建立 (5)
3.2.1数据仓库数据集成 (5)
3.2.2建立维表 (8)
4.OLAP操作 (10)
5.数据预处理 (12)
5.1描述性数据汇总 (12)
5.2数据清理与变换 (13)
6.数据挖掘操作 (13)
6.1关联规则挖掘 (13)
6.2 分类和预测 (17)
6.3决策树的建立 (18)
6.4聚类分析 (22)
7.总结 (25)
8.任务分配 (26)
数据挖掘实验报告
1.绪论
1.1项目背景
在商业领域中使用计算机科学与技术是当今商业的发展方向,而数据挖掘是商业领域与计算机领域的乔梁。

在超市的经营中,应用数据挖掘技术分析顾客的购买习惯和不同商品之间的关联,并借由陈列的手法,和合适的促销手段将商品有魅力的展现在顾客的眼前, 可以起到方便购买、节约空间、美化购物环境、激发顾客的购买欲等各种重要作用。

1.2提出问题
那么超市应该对哪些销售信息进行挖掘?怎样挖掘?具体说,超市如何运用OLAP操作和关联规则了解顾客购买习惯和商品之间的关联,正确的摆放商品位置以及如何运用促销手段对商品进行销售呢?如何判断一个顾客的销售水平并进行推荐呢?本次实验为解决这一问题提出了解决方案。

2.数据仓库与数据集市的概念介绍
2.1数据仓库介绍
数据仓库,英文名称为Data Warehouse,可简写为DW或DWH,是在数据库已经大量存在的情况下,为了进一步挖掘数据资源、为了决策需要而产生的,它并不是所谓的“大型数据库”。

........
2.2数据集市介绍
数据集市,也叫数据市场,是一个从操作的数据和其他的为某个特殊的专业人员团体服务的数据源中收集数据的仓库。

.......
3.数据仓库
3.1数据仓库的设计
3.1.1数据库的概念模型
3.1.2数据仓库的模型
数据仓库的模型主要包括数据仓库的星型模型图,我们创建了四个
维表和一个事实表。

四个维表为:item维表,time维表,branch维表,location维表。

事实表为:sales事实表。

其中,
3.2数据仓库的建立
3.2.1数据仓库数据集成
我们小组粗略的统计了超市一年的销售记录,并建立了数据库。

其....
当然,这只是最初的表,后面还要进行数据清理与转换,对其进一步改进,以便于数据挖掘。

3.2.2建立维表
item维表
branch维表
location维表
sales事实表
4.OLAP操作
按时间上卷:
切块:
按片查询:
整个数据立方体:
5.数据预处理
5.1描述性数据汇总
【saleID】S*:销售号(笔数)
【customerID】C*:顾客编号
【productID】P*:购买的商品号
【timeID】T*:时间号(月)
5.2数据清理与变换
数据清理:(1)初始表格在前面已经给出,每笔交易中购买的商品不止一
....
数据变换:对不同的数据类型做不同的变换。

比如男女分别用1,0表示;高中档商品用1,0表示;收入统一除以10000。

6.数据挖掘操作
6.1关联规则挖掘
6.1.1频繁一项集筛选
I1支持度的代码及结果为:
输出结果为:24
其他一项候选集同理
6.1.2、频繁二项集筛选
频繁二项集候选集为(I1,I18),(I1,I2),(I1,,I3),(I1,I4),(I1,I5),(I1,I7),
(I18,I2),(I18,I3),(I18,I4),(I18,I5),(I18,I7),
(I2,I3),(I2,I4),(I2,I5),(I2,I7),
(I3,I4),(I3,I4),(I3,I5),(I3,I7),
(I4,I5),(I4,I7),
(I5,I7)
(I1,I18)的支持度代码和结果为:
输出结果为:15
I3和I18支持度的代码和结果为:
输出结果为:14
I1和I3支持度的代码和结果为:
输出结果为:18
同理可得:
6.1.3、频繁三项集筛选
频繁三项集候选集为:(I1,I3,I18)
(I1,I3,I18)的支持度代码和结果为:
输出结果为:13
综上可得I1、I3和I18的支持度和置信度为:
[]c s
(
)1
,
)2
(
,
(



,⇒
)3
,
X
buys
item
buys
X
item
item
X
transcatio
x,
buys
n
[]%
buys
I
X
buys
buys
I
X


X

x⇒
transcatio
n
%,
18
,
)
12
93
(
)3
,
(
)1
(
,
,I
[]%
I
X
buys
X
buys
I
buys
n

X

x⇒
transcatio

%,
,
(
)3
12
87
)
18
,
(
)1
(
,
,I
[]%
buys
I
X
I
X
buys
X
buys


x⇒
transcatio
n

,I
)1
,
12
%,
72
(
)
)3
,
(
,
18
(
由上可知:1.顾客习惯一起购买商品I1,I3,I18,即牛奶面包和电视机
2.所以超市可以将牛奶面包电视机摆放在一起
6.2分类和预测
预测的结果可以用关联规则的结果和OLAP的结果来说明。

预测结果如下:1.根据OLAP从日到月上卷操作,1月为销售旺季,商店可以在此期间加大供应量,以获得更大利润。

2.顾客对牛奶的需求很大,且为蒙牛牛奶
3.顾客对面包的需求也很大,且为安琪面包
4. 对步步高电视机的需求也很大。

6.3决策树的建立:
通过研究顾客的属性,分析这些属性对顾客购买商品档次的影响,建立决策树,预测顾客购买商品的档次。

6.3.1.选择最佳分裂点:
1)源数据:(部分展示)
数据转换后数据:(部分展示)
2)选取过程具体操作:
3)经比较gain()的值得出,选取sex。

6.3.2.继续寻找下一个分裂点:
1)源数据:(部分展示)(按sex分类)
F:(49条记录)
M:(51条记录)
2)选取过程具体操作:
F:
M:
M中找到的分裂点为income
6.3.3.分裂的数据结果部分如图:
F:
M的操作以此类推,得到的结果如下:
由此可得出决策树为:
6.4 聚类分析
6.4.1原始数据:
6.4.2数据转换:
6.4.3使用欧几里得距离,K=3,K均值:第一次聚类分析:
第二次聚类分析:
第三次聚类分析:
(4)三次聚类分析结果:
第一次聚类结果为:
new1:C1,C3,C5,C8,C9,C10,C11,C15,C16,C18,C20 new2:C2,C4,C6,C9,C14,C19
new3:C7,C12,C13,C17
平方误差:8.82
第二次聚类结果为:
n1:C1,C7,C8,C10,C11,C15,C16,C20
n2:C2,C3,C4,C5,C6,C9,C14,C18,C19
n3:C12,C13,C17
平方误差:6.25
第三次聚类结果为:
n1:C1,C7,C8,C10,C11,C15,C16,C20
大体为年轻、收入低,买中等品的一类人群
n2:C2,C3,C4,C5,C6,C9,C14,C18,C19
大体为年龄、收入于购买商品成反向的人群
n3:C12,C13,C17
其他人群
平方误差:4.79
7.总结
8.任务分配。

相关文档
最新文档