大型超市“购物篮”分析资料报告
2024年超市购物篮市场调查报告

超市购物篮市场调查报告1. 引言超市购物篮是人们购买商品时常用的工具之一。
本报告旨在通过对超市购物篮市场进行调查研究,分析市场现状、竞争格局和消费者需求,为超市购物篮的生产、销售和设计提供参考和建议。
2. 调查方法本次市场调查采用了问卷调查和实地观察相结合的方法。
共计发放了500份问卷,覆盖了不同年龄、性别和经济状况的超市顾客。
此外,我们还在多家超市进行了实地观察,观察超市购物篮的种类、质量和使用情况。
3. 市场现状分析3.1 购物篮种类根据实地观察,市场上主要有塑料购物篮和金属购物篮两种类型。
其中,塑料购物篮更加常见,占据超市购物篮市场的主导地位。
塑料购物篮广泛应用于各类超市,因其轻便、耐用、易清洗的特点备受消费者欢迎。
3.2 购物篮质量在实地观察中发现,购物篮的质量参差不齐。
一些购物篮质地坚固,使用寿命长,而另一些购物篮可能存在抗压性差、易断裂等问题。
购物篮质量的差异可能与生产商的技术水平、原材料选用有关。
3.3 购物篮价格调查数据显示,超市购物篮的价格普遍较为合理。
不同超市的购物篮价格差异并不大,主要与购物篮的材质和大小有关。
大多数消费者对购物篮的价格表示满意。
4. 消费者需求分析4.1 购物篮容量根据问卷调查,消费者的购物篮容量需求有所差异。
一部分消费者倾向于选购容量较大的购物篮,以便将更多商品放入购物篮;另一部分消费者则更偏好容量较小的购物篮,以便携带更便利。
在实际观察中,容量合适的购物篮更受欢迎。
4.2 购物篮舒适性问卷调查显示,购物篮的舒适性对消费者来说也是一个重要考虑因素。
尤其是对于那些购买较多商品的消费者来说,购物篮的舒适度能够对减轻购物压力起到积极的作用。
因此,购物篮设计应考虑增加手柄的抓握舒适度和减少重压对顾客手部的影响。
4.3 购物篮的环保性调查结果显示,消费者对购物篮的环保性越来越重视。
他们期望购物篮能够采用可再生材料制造,减少对环境的损害。
此外,购物篮的可回收性和易清洁性也是一些消费者关注的焦点。
2024年超市购物篮市场规模分析

2024年超市购物篮市场规模分析1. 引言超市购物篮是指在购物超市中提供给消费者用于装载和携带商品的篮子或购物车。
随着人们对便利性和舒适性的要求不断提高,购物篮在超市购物中扮演着重要的角色。
本文将对超市购物篮市场规模进行分析,探讨其发展趋势与影响因素。
2. 市场规模分析2024年超市购物篮市场规模分析主要从以下几个方面展开:2.1 市场概况超市购物篮市场的发展受到人们购物行为和超市发展状况等多方面因素的影响。
当前,随着城市化进程的加速和人们消费水平的提高,购物超市逐渐成为民众购买生活必需品的主要场所,进一步推动了超市购物篮市场的发展。
2.2 市场规模及增长趋势超市购物篮市场规模可以通过销售额、销售数量、增长率等指标进行衡量。
根据市场调研数据,过去几年超市购物篮市场呈现稳步增长的态势。
预计未来几年内,随着超市业态的升级和消费需求的不断增长,该市场规模将继续扩大。
2.3 地区分布超市购物篮市场在全国范围内都有着广泛的影响。
大中城市由于人口数量庞大且经济发达,超市购物篮市场规模较大。
此外,一些新兴城市和乡村地区也不断涌现出新的超市,推动了超市购物篮市场的进一步发展。
3. 影响因素分析超市购物篮市场规模的发展受到多个因素的影响,主要包括:3.1 经济因素经济因素是影响超市购物篮市场规模的重要因素之一。
经济的稳定与发展能够提升人们的购买力,促使他们在超市购物时更倾向于使用购物篮。
因此,经济的繁荣与超市购物篮市场规模的增长密切相关。
3.2 消费者需求消费者对于购物体验和便利性的要求也对超市购物篮市场规模产生重要影响。
超市购物篮的设计和功能能够满足消费者在购物过程中的需求,提升其购物体验和便利性,进而推动市场规模的增长。
3.3 超市布局与管理超市购物篮市场规模还受到超市布局和管理的影响。
合理的超市布局能够提高购物篮的使用率,进而促使市场规模扩大。
同时,超市管理的规范和效率也能够增加购物篮的需求量,并推动市场规模的增长。
大型超市“购物篮”分析

题 目 大型超市“购物篮”分析摘 要本文根据顾客购买记录,通过“购物篮”分析,运用多种模型得出结果,并给出促销方案。
问题一要求构建能表达多种商品关联程度的数学模型。
根据4717个顾客对999中商品的购买记录,先用Matlab 对数据进行预处理,将其转化为0-1模型,然后求出购买j 商品的集合j s 和购买k 商品的集合k s ,考虑到同时购买两种商品占购买人数的频率,即相关性,存在购买人数少但相关性大的缺陷。
在改进的模型中,因为存在购买商品数少但也会使相关性大的情况,所以对两种情况进行综合考虑,得出最优模型:j k i k i k s s s s p n s s ⋂⋂=⨯⋃用Matlab 求解0-1矩阵,求出两商品间关联系数较大的前八位,有相关系数的值在0-1范围之内,与所得模型函数的范围一致,可知,该模型是准确可靠的。
问题二要求出有效方法来找出最频繁被购买的商品记录,且越多越好。
根据问题一所得0-1矩阵,将其代入Excel 运用Aprior 模型,先算出单项商品的频繁项集,将支持度较小的数据剔除后,最后选取被购买次数最多的前18个商品,其中最畅销的为368号商品。
根据这18个畅销品,运用同样方法将其转化为两两商品的组合,得到被同时购买次数200次以上的商品;根据此算法依次迭代,得到同时购买3种商品和同时购买4种商品的数据,更多商品被同时购买次数较少因此不予考虑,最后得出:两件商品被同时购买次数最高的是368和529号;三件商品被同时购买次数最高的是368、489和682;四件商品被同时购买次数最高的是68、937、895和413。
问题三要求给出方案使效益最大。
根据问题一中0-1模型和问题二中Aprior 模型,将得到的购买次数最多的商品信息和题中所给利润表相比较,将利润小数量多的商品作为赠品和利润大数量多的商品一同销售;将共同购买次数多且利润大的两商品组合作为促销品进行销售,以进一步提高超市的综合效益。
2024年购物篮市场分析报告

2024年购物篮市场分析报告1. 介绍购物篮分析是一种通过分析消费者在购物时所购买的商品组合来了解消费者行为和市场趋势的方法。
本报告旨在对购物篮市场进行分析,为商家提供决策支持和市场发展策略。
2. 数据来源本次分析所使用的数据来自于一家超市的购物篮交易记录。
数据包括交易时间、购买商品、商品数量等信息。
3. 分析结果3.1 常见商品组合通过分析购物篮数据,我们可以发现一些常见的商品组合,这些组合可以帮助商家优化商品陈列和促销策略。
以下是一些常见的商品组合示例: - 牛奶、面包、黄油 - 水果、蔬菜、肉类 - 可乐、薯片、巧克力商家可以将这些商品组合放置在一起,以便提高销售量。
3.2 促销策略根据购物篮数据,我们可以了解不同商品之间的搭配关系,进而制定针对性的促销策略。
以下是一些建议: - 如果顾客购买了牛奶,可以为其推荐面包或黄油,以增加销售额。
- 针对购买蔬菜的顾客,可以提供肉类或水果的优惠券,促使他们购买更多商品。
3.3 市场趋势通过对购物篮数据的分析,我们可以了解市场的趋势和消费者偏好。
以下是一些发现: - 周末购物篮的商品数量较平日要高,这可能是因为消费者在周末有更多的时间进行购物。
- 某些特定商品在特定日期有较高的销售量,如糖果在万圣节前夕的销售量会增加。
4. 总结购物篮分析是一种了解消费者行为和市场趋势的重要工具。
通过分析购物篮数据,我们可以发现商品组合、制定促销策略以及了解市场趋势。
商家可以根据这些分析结果来优化商品陈列、制定促销策略,并提高销售额。
随着数据科学的发展,购物篮分析将在市场研究领域发挥更大的作用。
大型超市购物篮问题分析_数学建模推荐

⼤型超市购物篮问题分析_数学建模推荐⼤型超市“购物篮”分析摘要本⽂是针对如何充分利⽤顾客购物习惯问题,通过对题⽬的分析,运⽤运筹学的知识,为超市经理提供⼀个能使利润最⼤化的促销⽅案。
⾸先运⽤10-变量的⽅法对数据进⾏预处理,将顾客有意愿购买的商品记为1,没有意愿购买的商品记为0.针对问题⼀:根据10-变量的聚类⽅法,建⽴模型⼀:定量模型,利⽤Matlab 编程,得出{}{}∑∑==>+==n i ik ij n i ik ij jk x xI x x I s 110是表达超市中多种商品间的关联关系的密切程度的定量模型。
针对问题⼆:⾸先根据apriori 计算⽅法,建⽴模型⼆:最畅销商品模型,运⽤Matlab 编程,得出当假设认为⼤于700为购买频繁时得出这些被最频繁购买的商品每2种和每3种商品被同时购买的次数,观察发现其结论与问题⼀得出的商品种类基本⼀致,则说明apriori 计算⽅法是是⼀种快速有效的能从购买记录中分析出哪些商品是最频繁被同时购买的⽅法。
同时通过对运⽤apriori 计算⽅法计算出的结果的观察,发现当产品数量增⼤时商品被同时购买的次数急剧下降。
所以商品数量再增加已经没有研究意义,故只讨论商品数量为2和3的情况。
最终得出最频繁被同时购买的商品组合共有37组,其中商品数量为2的商品组合数有33组且被同时购买时次数最多的是368和529两种商品的组合,次数为334次。
商品数量为3的商品组合数有4组且被同时购买时次数最多的是368,489,682三种商品的组合,次数为124次。
针对问题三:基于消费者理性消费的原则,建⽴模型三:最优促销⽅案模型,运⽤Matlab 编程商品进⾏筛选,将其分为畅销⾼利润G ,畅销低利润D ,⾮畅销⾼利润g ,⾮畅销低利润d 四类,然后通过分析得出可以购买368,956,529,368,692等G 商品分别送106,954,425,761等d 商品。
将g 类商品进⾏打折,最后将G 和D 类商品⽤问题⼆得出的组合⽅案进⾏商品组合然后直接放在同⼀货架中进⾏出售。
超市购物篮市场分析报告

超市购物篮市场分析报告1.引言1.1 概述超市购物篮是每个顾客在超市购物时必不可少的装备,它们承载着购物者的需求和购买意向。
因此,了解超市购物篮市场的发展趋势和消费者偏好对于超市和品牌具有重要意义。
本报告旨在对超市购物篮市场进行深入分析,包括超市购物篮市场概况、消费者购物篮偏好分析以及竞争对手分析,并根据分析结果提出市场趋势展望和相关建议和策略。
通过本报告的研究,有望为超市和品牌在购物篮市场的发展提供有益的参考和指导。
1.2 文章结构本文将分为三个主要部分:超市购物篮市场概况、消费者购物篮偏好分析和竞争对手分析。
首先,将对超市购物篮市场的整体情况进行概述,包括市场规模、增长趋势和主要参与者。
接下来,将深入分析消费者对购物篮的偏好,包括购物篮的设计、功能和购物体验。
最后,将对竞争对手进行分析,包括他们的产品特点、市场定位和市场份额。
通过这三个部分的分析,将为读者提供一个全面的了解超市购物篮市场的市场情况和竞争格局。
1.3 目的目的部分的内容为:本报告的目的是对超市购物篮市场进行全面分析,包括市场概况、消费者购物篮偏好分析以及竞争对手分析。
通过对市场趋势展望和提出建议和策略,为超市购物篮行业的发展提供参考,帮助企业制定更有效的营销和经营策略。
同时,我们还将总结报告中的重要观点和结论,以便立即应用并作为未来研究的基础。
1.4 总结总结:本报告对超市购物篮市场进行了深入分析,通过对市场概况、消费者购物篮偏好和竞争对手的分析,我们了解到了这一市场的发展趋势和潜在机会。
在市场趋势展望部分,我们提出了未来市场可能出现的变化和发展方向。
最后,根据对市场的分析,我们提出了一些建议和策略,以供相关企业参考。
希望本报告能够帮助读者更好地了解超市购物篮市场,并为相关企业的发展提供一定的参考价值。
2.正文2.1 超市购物篮市场概况超市购物篮是指消费者在购物时用来装载商品的篮子或推车。
随着人们生活水平的提高和消费习惯的改变,超市购物篮已经成为人们日常生活中不可或缺的一部分。
大型超市购物篮分析

题目大型超市“购物篮”问题分析摘要本文对于大超市商品的关联度以及商品最频繁同时购买问题进行分析,构建合理的数学模型,并给出可操作的商品销售方案。
问题一要求统计处理4717个顾客对999中商品的购买记录数据,建立数学模型,定量表达超市中多种商品间的关联关系的密切程度。
首先建立遗传算法,利用SPSS统计得出各个商品购买数量,并计算出标准差。
再对影响关联度的另一度量指标进行分析,将数据分类利用Matlab处理数据,得出商品间的欧氏距离。
最后加上实际影响因素,建品572,商品797,购买次数最高,102次,组合利润最高1485.399,总利润最高151510.698。
因此,将这组商品作为最优组合。
问题三要求根据问题1、问题2中建立的模型,对附件2中999种商品的利润进行分析,给出一种初步的促销方案。
对数据运用Matlab进行拟合,得出商品利润与商品之间的关联度符合线性关系。
对附件2中利润数据分类,分别计算结果。
最后,给出促销方案。
关键词遗传算法欧氏距离关联度贪婪算法一、问题背景和重述1.1问题背景超市购物属于日常生活,而每天来超市购物的顾客和购买的商品都具有不稳定性。
商品的销量会因顾客的喜好或时间的影响不断变化,又因商品购买存在随机性、多元性等特点,必须估测好每种商品的需求量。
如处理不当,很可能造成仓库囤积量增多,甚至造成超市利润损失过大。
商品购买是不确定的,但某种或某些商品会获得大多数人的认可,被顾客频繁购买。
在大型超市中,商品繁多、复杂,正确分析并估算顾客对某种或某些商品的喜好,将为超市经理合理设计进货方案、处理仓库、获得最大利润、搞推销、促销活动和购物赠送活动等提供理论依据。
商品市场分析和顾客购物习惯分析,作为超市一项基础性任务,不仅可以确定超市进货合理模式及合理促销方式,还可以为各大型超市确定今后整体规划、超市规模、商品购买后评估等提供更为科学的理论依据。
1.2问题重述现给出超市进一个星期的所有顾客购买物品的清单和相应商品的价格,分析所给数据,研究以下问题,并建立合理的数学模型:1、附件1 中的表格数据显示了该超市在一个星期内的4717 个顾客对999 种商品的购买记录,表格中每一行代表一个顾客的购买记录,数字代表了其购买商品的超市内部编号。
大型超市“购物篮”分析

题 目 大型超市“购物篮”分析摘 要本文根据顾客购买记录,通过“购物篮”分析,运用多种模型得出结果,并给出促销方案。
问题一要求构建能表达多种商品关联程度の数学模型。
根据4717个顾客对999中商品の购买记录,先用Matlab 对数据进行预处理,将其转化为0-1模型,然后求出购买j 商品の集合j s 和购买k 商品の集合k s ,考虑到同时购买两种商品占购买人数の频率,即相关性,存在购买人数少但相关性大の缺陷。
在改进の模型中,因为存在购买商品数少但也会使相关性大の情况,所以对两种情况进行综合考虑,得出最优模型:j k i k i k s s s s p n s s ⋂⋂=⨯⋃用Matlab 求解0-1矩阵,求出两商品间关联系数较大の前八位,有相关系数の值在0-1范围之内,与所得模型函数の范围一致,可知,该模型是准确可靠の。
问题二要求出有效方法来找出最频繁被购买の商品记录,且越多越好。
根据问题一所得0-1矩阵,将其代入Excel 运用Aprior 模型,先算出单项商品の频繁项集,将支持度较小の数据剔除后,最后选取被购买次数最多の前18个商品,其中最畅销の为368号商品。
根据这18个畅销品,运用同样方法将其转化为两两商品の组合,得到被同时购买次数200次以上の商品;根据此算法依次迭代,得到同时购买3种商品和同时购买4种商品の数据,更多商品被同时购买次数较少因此不予考虑,最后得出:两件商品被同时购买次数最高の是368和529号;三件商品被同时购买次数最高の是368、489和682;四件商品被同时购买次数最高の是68、937、895和413。
问题三要求给出方案使效益最大。
根据问题一中0-1模型和问题二中Aprior 模型,将得到の购买次数最多の商品信息和题中所给利润表相比较,将利润小数量多の商品作为赠品和利润大数量多の商品一同销售;将共同购买次数多且利润大の两商品组合作为促销品进行销售,以进一步提高超市の综合效益。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
题 目 大型超市“购物篮”分析摘 要本文根据顾客购买记录,通过“购物篮”分析,运用多种模型得出结果,并给出促销方案。
问题一要求构建能表达多种商品关联程度的数学模型。
根据4717个顾客对999中商品的购买记录,先用Matlab 对数据进行预处理,将其转化为0-1模型,然后求出购买j 商品的集合j s 和购买k 商品的集合k s ,考虑到同时购买两种商品占购买人数的频率,即相关性,存在购买人数少但相关性大的缺陷。
在改进的模型中,因为存在购买商品数少但也会使相关性大的情况,所以对两种情况进行综合考虑,得出最优模型:j k i k i k s s s s p n s s ⋂⋂=⨯⋃用Matlab 求解0-1矩阵,求出两商品间关联系数较大的前八位,有相关系数的值在0-1围之,与所得模型函数的围一致,可知,该模型是准确可靠的。
问题二要求出有效方法来找出最频繁被购买的商品记录,且越多越好。
根据问题一所得0-1矩阵,将其代入Excel 运用Aprior 模型,先算出单项商品的频繁项集,将支持度较小的数据剔除后,最后选取被购买次数最多的前18个商品,其中最畅销的为368号商品。
根据这18个畅销品,运用同样方法将其转化为两两商品的组合,得到被同时购买次数200次以上的商品;根据此算法依次迭代,得到同时购买3种商品和同时购买4种商品的数据,更多商品被同时购买次数较少因此不予考虑,最后得出:两件商品被同时购买次数最高的是368和529号;三件商品被同时购买次数最高的是368、489和682;四件商品被同时购买次数最高的是68、937、895和413。
问题三要求给出方案使效益最大。
根据问题一中0-1模型和问题二中Aprior 模型,将得到的购买次数最多的商品信息和题中所给利润表相比较,将利润小数量多的商品作为赠品和利润大数量多的商品一同销售;将共同购买次数多且利润大的两商品组合作为促销品进行销售,以进一步提高超市的综合效益。
关键词 0-1模型 Aprior 模型 数据预处理 相关系数一、问题背景和重述1.1问题背景随着信息技术的发展,通过分析大量历史数据来发现模式和利用规律的数据挖掘技术应运而生,然而大多数商家并不是数据挖掘技术领域的专家,如何使数据挖掘技术平民化,成为当代很多学者研究的热点之一。
购物篮分析是数据挖掘技术应用在零售业中的一种有效方式,其目的就是在顾客的购买交易中分析能够同时购买一类产品或一组产品的可能性,利于商品的摆放,也利于提高促销活动的效果。
随着人们生活水平的提高,特别是城市,基本物质生活已满足,人们有更高的追求并呈现多样性,从企业角度看,了解和掌握顾客消费的特征和规律,有利于提高企业利润,同时也能提高消费者的满意度。
本文以一个面向大型超市的购物篮问题,构建数学模型。
1.2问题重述作为超市的经理,经常关心的问题是顾客的购物习惯。
他们想知道:“什么商品组或集合顾客多半会在一次购物时同时购买?”。
现在假设我们是某超市的市场分析员,已经掌握了该超市近一个星期的所有顾客购买物品的清单和相应商品的价格,需要给超市经理一个合理的“购物篮”分析报告,并提供一个促销计划的初步方案。
问题1:题目中表格数据显示了该超市在一个星期的 4717 个顾客对 999 种商品的购买记录,表格中每一行代表一个顾客的购买记录,数字代表了其购买商品的超市部编号。
建立一种数学模型,该模型能定量表达超市中多种商品间的关联关系的密切程度。
问题2:根据在问题1中建立的模型,寻找一种快速有效的方法能从表格的购买记录中分析出哪些商品是最频繁被同时购买的。
超市经理希望得到尽可能多的商品被频繁同时购买的信息,所以找到的最频繁被同时购买的商品数量越多越好。
例如:如果商品1、商品2、商品3在 4717 个购物记录中同时出现了200次,则可以认为这三个商品同时频繁出现了200次,商品数量是3。
问题3:题目给出了这999中商品的对应的利润,根据在问题1、问题2中建立的模型,给出一种初步的促销方案,使超市的效益进一步增大。
二、问题分析2.1问题一的分析要求构建模型定量表达超市多种商品间的关联关系的密切程度,根据4717个顾客对999种商品的购买记录,令i x 表示第i 个顾客的购买情况,当第i 个顾客购物篮里有第j 个商品,1ij x =;没有购买,则0ij x =。
这就把复杂繁多的数据化为了简单易求的0-1模型。
根据购买记录,求出购买j 商品的顾客集合和购买k 商品的顾客集合,两集合的交集(同时购买)所代表的人数与购买人数的比值即为频率,此频率表示两商品的相关程度,考虑到购买人数较少也会造成频率较大的情况,对模型进行改进,将同时购买的人数与至少买一种商品的人数的比值作为相关系数,转化后的模型仍存在缺陷,购买次数较少时也会造成系数较大但不能反映商品相关性的问题。
综上两种考虑,将两个模型结合起来,得到最优模型,用此模型来定量表达商品间的关联关系的密切程度。
由题目可知,此模型所得结果必定大于0小于1,为验证模型的可靠性,本文运用Matlab 对数据进行预处理,将数据转化为0-1矩阵后,再根据公式编程筛选出两商品相关系数较大的前八位,由所得系数与函数大于0小于1的性质相比,若符合,则模型是可靠的;若不符合,则再求新的定量模型。
2.2问题二的分析要求我们寻找一种快速有效的方法从购买记录中找出被最频繁购买的商品,并且被同时购买的数量越多越好。
根据问题一Matlab对数据进行的0-1矩阵处理,并在Excel 中对数据进行求和以及排序处理,得到一次购买一次商品的次数最多的前18个商品。
由于数量的繁多,我们将从这18种商品中求出两件被同时购买以及三件、四件商品被同时购买的信息。
因此我们调出这18种商品的0-1矩阵,并用Matlab编程得到两件商品同时被购买的频数,并用Apriori算法的原理提出支持度s,用其来筛选得到的众多数据,修改程序以得到三件商品、四件商品被同时购买的数据。
2.3问题三的分析对于问题三,要求根据问题一和问题的模型给出一种促销的方案,促使效益进一步增大。
首先我们定义f为超市的收益,商品的数量为n,商品的利润为w。
则f w n=⋅。
我们考虑将数据中卖出数量多的商品且利润大的商品附赠以卖出商品数量多但是收益较小的商品来进一步提高它们卖出的数量以获得更大的利润。
而对于那些卖出数量以及能够获得的利润都适中的商品,根据问题二求得的两件商品被同时购买的数量将它们放在一起促销,这样也会获得较高利润。
三、模型假设1、超市货源充足最大限度满足顾客需求;2、短时期,商品的销售情况保持不变;3、每位顾客的购物行为都是理性的,真实反映当地的消费情况;4、假设两商品同时被购买次数大于200的为高销量商品;5、假设商品收益只考虑销售所得收入,不考虑商品成本;四、符号说明和名词解释4.1符号说明4.2名词解释1、布尔量:本题中所指的是购买或未购买,购买时布尔量=1,未购买布尔量=0;五、模型建立与求解5.1模型的准备5.1.1问题一模型的准备由于本题是针对大型超市购物篮的问题,数据繁多,且只考虑顾客的购买记录,即买或不买,并以此研究商品间的关联程度,因此本题先对所给数据进行预处理,将4717位顾客对999种商品的购买转化为0-1模型,方便问题的求解。
首先以i x 表示第i 个消费者的某次购物行为,如果在消费者的购物篮中发现了第j 种商品,则有1ij x =,否则0ij x =(同时ik x 表示第i 个消费者购买第k 种商品)。
5.2问题一模型的建立与求解 5.2.1模型的建立本题消费者购买只有两种情况,即购买或不购买,因此可以用到0-1模型。
为表达超市中多种商品间的密切关联程度,本题建立了定量模型。
首先,用i x 来描述第i 个消费者的购物情况,1ij x =表示第i 个消费者购买了第j 个商品,反之,0ij x =表示未购买。
因为是根据顾客对商品的购买记录来求解,因此本文对购买某种商品的顾客进行分类,设购买j 的人的集合为j s ,购买k 的人的集合为k s ,则j k s s ⋂表示同时购买j 商品和k 商品的顾客。
由此可将两种商品的相关联程度表示为:1j ks s p n⋂=此公式表示同时购买两种商品的频率,频率越高,相关性越大,但若购买人数少,也会导致频率值较大,显然这样的表达不能准确反映两商品间的关联程度,因此对此模型还应进一步改进。
对购买人数n 进行改进,考虑到有顾客在两种商品中至少购买一种的情况,将n 化为k j s s ⋃,则两种商品的相关联程度转化为:2i ki ks s p s s ⋂=⋃ 此公式表示两种商品都买的情况占至少购买一种情况的比值,即频率,也能反映两商品间的关联程度,但其同第一个公式类似,存在购买商品次数少但导致频率较大,而不能反映两商品相关性的缺陷,因此,综合两种情况,得到最优模型:j ki k i ks s s s p ns s ⋂⋂=⨯⋃p 表示两商品的相关性,若p 较大,剔除购买次数较小的情况,即可反映当消费者购买一种商品时,对另一种商品的购买可能性很大,两种商品的关联相关性密切。
5.2.2模型的求解对上述模型进行具体求解,其中i k s s ⋂表示同时购买j 商品和k 商品的人数,公式为:1*nj k ij ik i s s x x =⋂=∑i k s s ⋃表示两种商品中至少购买一种商品的人数,其具体公式为:111=*nnnj k ij ik ij ik i i i s s x x x x ===⋃+-∑∑∑j k s s ⋂小于购买人数n ,同时小于至少购买一种商品的人数,所以p 小与1。
将题目中所给数据运用Matlab 进行预处理,将其转化为0-1矩阵,由于数据过多,则将所得矩阵放在附录中,详见附录1。
根据所得关联函数公式,用Matlab 编程求出两商品间关联系数较大的前八位,如下图所示:围之,与所得模型函数的围一致,可知,该模型是准确可靠的。
5.3问题二模型的建立与求解分析最频繁被同时购买的商品,且越多越好。
首先我们要找出单独一项商品被购买的频数,根据频数较高的单项商品集,通过筛选得出两种商品被同时购买的频数,以此类推,层层迭代,找出多种商品被同时购买的频数。
Aprior 算法使用频繁项集的先验性质,通过逐层搜索的迭代方法,先扫描数据库,再累积每个项的计数,并收集满足最小支持度的项,找出频繁项集的集合,直到所求条件。
因此本文运用Aprior 算法,对此题作出分析并求出最佳结果。
其具体算法过程如下:此算法体现出若A 是一个频繁项集,则A 的每一个子集都是一个频繁项集。
首先我们提出支持度s 的概念,支持度是D 中包含A 和B 的事务数与总的事务数的比值。
可以利用支持度的大小来筛选数据。