摘 要: 利用聚类的基本知识,根据不同顾客购买商品的相似性的大小,提出了运用K-means聚类算法。利用相似度代替欧氏距离,对该网络进行聚类分析,划分出相似性大的顾客群体,并根据每个群体中顾客购买每类商品占总商品数的比例进行排序,从而为商品陈列提供依据。
关键词: 聚类;K-means聚类算法;相似性;商品陈列
随着经济的发展,商品的种类越来越多,作为顾客自由购物场所的商店,可利用有限的营业空间,在顾客浏览商品时,刺激顾客的购买欲望,达到扩大销售的目的。商品的陈列在销售过程中扮演者重要的角色,是商品沉默的推销员[1]。因此如何合理地对商品进行陈列[2],成为商店推销过程的一个必须要考虑的问题。由于不同顾客购买的商品之间具有一定的相似性,可以根据不同商品间的相似性,构造具有关联性的商品网络[3]形成聚类,并根据不同顾客购买商品的相似性的大小,运用K-means聚类算法,利用相似度代替欧氏距离,对该商品网络进行聚类分析[4],划分出相关性大的顾客群体,并根据每个群体中顾客购买每类商品的均值占总商品数得比例进行排序[5],从而得到商品陈列的依据,这样顾客在浏览商品时,便会刺激其购买欲望,进而达到扩大销售的目的。如图1所示。
1 聚类分析的理论基础
1.1 聚类简介
聚类[6](Clustering)是数据挖掘中一种重要的挖掘方法,它是将物理或抽象对象进行分组并将相似的对象归为一类的过程。聚类分析将物理或抽象对象分为几个群体,在每个群体内部,对象之间具有较高的相似性,而在群体之间相似性则比较低。聚类算法大体可以划分为:划分方法、层次方法、基于密度的方法、基于网格的方法和基于模型的方法[7]。
1.2 K-means聚类算法简介
K-means算法[8]属于聚类方法中的一种划分方法,该算法具有较好的可伸性和很高的效率,适合处理大文档集。K-means算法将一组物理的或抽象的对象,根据它们之间的相似程度分为若干组,其中相似的对象构成一组。它采用欧式距离作为相似性的评价指标,即认为两个样本的距离越近,其相似度越大。其以最大欧式距离原则选取新的聚类中心,以最小欧式距离原则进行模式归类。
4.2 商品的陈列算法
依据上面算法分成的k个顾客群体,在每类群体中,计算每种商品占商品总数的比例,依据比例的大小,由近到远对商品进行排列,从而得到商品的排列次序。
本文根据顾客的购买记录,根据其购买的商品间的相似性,划分出相似性大的顾客群体,再根据每个群体中的每种商品占商品总数的比例大小进行排序,从而得到商品排序的理论依据,进而使商品得到合理排序,这样顾客在浏览商品时,便会刺激其购买欲望,达到扩大销售的目的。但是每种商品,由于其品牌不同,知名度、信誉度等也不同,并且商品陈列时还要考虑场地位置,颜色搭配等,从而为商品陈列带来新的问题,因此在为其提供基础的同时为下一步工作指明了方向。
参考文献
[1] 傅强.超市商品陈列对消费心理的影响[J].中国商贸,2010(3).
[2] 朱海红,江庭友,司丹丹,基于数据挖掘技术的商品陈列研究[J].商场现代化,2010(12).
[3] 王金龙,徐从富,徐娇芬,等.利用销售数据的商品影响关系挖掘研究[J].电子科技大学学报,2007(2).
[4] 崔春生,吴祈宗,王莹,用于推荐系统聚类分析的用户兴趣度研究[J].计算机工程与应用,2011(7).
[5] 刘金岭.数据挖掘技术在商品销售预测方面的应用[J].商场现代化,2008(2).
[6] BERRY M, LINOFF G. Data mining techniques for marketing, sales, and customer relationship management[M]. 2nd ed. [S.l.]: John Wiley & Sons, Inc, 2004.
[7] 黄韬,刘胜辉,谭艳娜.基于k-means聚类算法的研究[J].计算机技术与发展,2011(7).
[8] 安建成,德增.一种改进的K-means算法[J].电脑开发与应用,2011(4).
[9] 韩瑞凯,孟嗣仪,刘云,等.基于兴趣相似度的社区结构发现算法研究[J].计算机应用,2010(10).
[10] Han Jiawei, KAMBER M.数据挖掘概念与技术[M].北京:机械工业出版社,2001.
[11] 王德荣,李卫华.网络号百用户兴趣模型挖掘算法[J].现代计算机,2010(4).
[12] 赵凤霞、福鼎,基于K-means聚类算法的复杂网络社团发现新算法[J].计算机应用研究,2009(6).
[13] 樊宁.K均值聚类算法在银行客户细分中的研究[J],.计算机仿真,2011(3).