基于Apriori算法的智慧商场模型

发布时间:

第14卷第5期 
无锡职业技术学院学报 
2015年9月 
VoI.14 No.5 
J0URNAL OF WUXI INSTITUTE OF TECHNOLOGY 
Sep.2015 
DOI:10.13750/j.cnki.issn.1671—7880.2015.05.014 
基于Apriori算法的智慧商场模型 
郑佳敏, 钱鹏江  余梦巧  杨 
(江南大学数字媒体学院,江苏
无锡
214122) 
摘 要:随着顾客的消费水平日益提高,实现商场的智能化管理成为能够刺激消费,实现利润增长 
的重要手段和必然趋势。为此,针对智慧商场的商品摆放位置优化需求,该文分析数据挖掘中关联 规则挖掘领域的Apriori算法,并基于该算法提出可行的智慧商场存储位置优化模型,实现对顾客 购物历史数据的相关性分析,进而实现相关商品位置摆放优化以促进商场的利润增长。 
关键词:数据挖掘;关联规则;Apriori算法;存储位置优化;智慧商场 中图分类号:TP 301 
文献标志码:A 
文章编号:1671-7880(2015)05—0045-04 
ntel ectual zed mal  model based on Apriori algorithm 
ZHENG Jiamin,QIAN Pengjiang, 
Mengqiao,YANG Yi 
(School of Digial Media,Jiangnan University,Wuxi 214122,China) 
Abstract:With customers’consumption increasing day by day,it has become an important way and inevi— 
able tendency to realze the intelectualzed management in shopping centers in order to expand consump— on and obtain profi growth.To meet乙 
 the optmization requirement of product storage location in intelec— tualzed mail,the Apriori algorithm in the field of association rules in data development is analyzed in this paper,and based on this algorithm,by performing the correlation analysi on historical customers’consu— ming data,this paper proposes a feasible,storage location optimization model SO as to optimize the storage locations of correlative products and further achieve the maximum profits. 
Keywords:data development;association rules;Apriori algorithm;storage location optimization;intellec— t1la1jzed mal1 
随着经济和科技的发展,人们的生活方式以及 智能化发展中的一个重要需求。 
消费方式也在发生改变,消费者在追求物质上的消 
本文着眼于当前市场存在的根据顾客购物信 
费满足的同时,对于商场提供的消费服务也更加重 
息中所存在的商品相关性对商品位置摆放进行优 视。如何对庞大的消费人群进行有效的刺激消费, 
化的功能需求,具体讲述应用关联规则挖掘领域的 
提供智能化的服务已经成为各大商场发展的主要 频繁项集发现算法——Apriori算法进而实现相关 问题。因此针对顾客的消费习惯,优化商品摆放位 商品位置排放优化,并促进商场利润增长,为打造 置,进而刺激顾客的潜意识消费,则是目前商场在 
智慧商场、提高商场竞争力提供技术支持。 
收稿日期:2015-07-07 
项目来源:国家自然科学基金(61202311);江苏省自然科学基金(BK201221834);江苏省产学研前瞻性研究项目(BY2013015—02);江苏省 大学生创新创业训练计划项目(201510295019Y) 
作者简介:郑佳敏(1995一
),女,浙江台州人,研究方向:软件技术; 
钱鹏江(1979一
),男,江苏泰州人,副教授,博士,硕士生导师,研究力向:软件技术。 

46 无锡职业技术学院学报http://wx,j.cbpt.cnki.net 第14卷 
研究背景和意义 
提高顾客对关联商品的购买率,从而刺激消费,提 
高商场的竞争力。 
目前,我们正处于信息爆炸的时代,电子商务 数据挖掘技术的应用能够有效地缓解大量信 
正以令人咋舌的速度快速发展,传统零售业商场等 息与数据分析之间的矛盾,应用Apriori算法的重 也在不断地发展和创新自己的管理模式和营销手 
要性也十分明显。 
段。与此同时,不断增大的信息量与数据分析处理 
之间的矛盾也日益凸显。因此,商家开始对每日产 
关联规则和Apriori 
生的庞大的购物信息进行及时分析处理,也就是如 
◇关联规则:指在日志数据、关系数据或者其 何对这些信息进行数据挖掘,得到有利于商家进行 他信息载体中,存在于项目集合或对象集合之间的 
正确营销决策的信息。这也是美国零售业巨头沃 
频繁模式、相关性或因果结构。关联规则的获取主 尔玛创造的“啤酒与尿布”的成功案例给商家带来 要是通过数据挖掘的方法从大量的事件记录数据 的启示。 
库中找出那些频繁模式[]。 
数据挖掘公认的定义是由Fayyad给出的:数 
◇假设 一{, ,I , ,…I )是所有项目的集 
据挖掘是一个用以去认定数据中有效地、未知的、 合。设A是一个由项目构成的集合,称为项集。 
新颖的、具有潜在可用性并且最终可被理解的模式 事物T是一个项目子集,每一个事物具有唯一的 
的重要处理过程。同时数据挖掘也指从数据库中 
事务标识TID。事务T包含一个项集A当且仅当 
发现知识、数据分析、数据融合以及决策支持等。 A T。 
关联规则挖掘是数据挖掘领域成果颇丰而且比较 
◇支持度:表示发现规则的有用性。D为事 
活跃的研究分支L]。 
务数据库,A和B两个项集的并集A U B在D中出 近年来,越来越多的数据挖掘软件被应用于商 
现的概率。(Support)=(AUB).count/D.count。 
业,其中比较著名的有SPSS Clementine、SAS En— 
◇置信度:在出现了A项集的事务D中,项集 
terprise Miner、IBM Intelgent Miner、SQL Server 
B也同时出现的概率。 
Data Mining、0racle DM等[]。 
(Confidenee)一(AUB).count/A.COUnt。 
在数据挖掘技术迅速发展应用的同时,关联规 
◇Apriori算法: 
则也被越来越多的应用于市场销售智能管理、购物 
Apriori算法是挖掘布尔型关联规则频繁项集 
数据相关信息的分析中。 
的最为经典的,最有影响力的算法 ]。 
在上述数据挖掘软件中就有着不同的关联挖 
Apriori算法采用的是逐层搜索迭代的方式, 掘模型供选择,而Apriori算法作为关联规则挖掘 
其过程由连接和剪枝组成。先不断地寻找候选项 领域的最基本有效的算法,被广泛地应用于电子商 集,再剪枝去掉包含非频繁子集的候选集。在 
务平台。通过建立关联挖掘模型,商家可以在众多 
Apriori算法中,K项集用于探索K+1项集。首先 的购物信息中获得不同商品之间的关联信息。 
统计出频繁1项集也就是含有一个元素项目的项 数据挖掘技术的关联规则算法在应用于传统 集的支持度,去除低于既定支持度的项目集,得到 
零售业的同时,也被广泛有效地应用于电子商务领 

维最大项目集,记作L1。再利用L1项集得到能 
域。通过电子商务网站向购买者提供相关购物建 
够存在的所有包含两个元素项目的项集,并统计支 
议的电子商务推荐系统则很好地利用了关联规则 
持度,同样删去低于既定支持度的项目,得到二维 算法_]。在我国家喻户晓的电子商务平台天猫商 
最大项目集。如此进行逐步循环,得到更高维的最 
城中同样也应用了数据挖掘技术对网络购物交易 
大项目集。直到产生的包含K个元素项目的项目 数据进行分析。 
集的支持度与既定支持度比较后,均小于既定支持 
Apriori算法作为关联规则挖掘领域的最基本 
度,因而不存在候选项集,此时停止查找,得到K 有效的算法,被广泛应用在电子商务平台,分析挖 
维最大项目集。 
掘网络购物交易信息中的商品相关性。我们将 为了提高相关频繁项集的处理效率,Apriori A priori算法应用于实体零售业,即商场。对商场 
算法在处理过程中,用到了几个重要性质: 
逐日积累的顾客购物信息,进行分析获得关于顾客 ◇频繁项集的所有非空子集也必须是频繁的 
购物习惯的信息,从而进行货物摆放的位置优化, ◇非频繁项集的任一超集必定是费频繁项集 
相关商品智能推荐等,通过对强关联规则的使用, 
◇如果K一1维频繁项集集合L 一 中包含单 

基于Apriori算法的智慧商场模型

相关推荐