信息化进销存网络体系产生的巨大数据流,使企业很难对这些数据进行准确、高效的收集和及时处理。为了帮助决策者快速、准确地做出决策,实现对进销存过程的控制,提高企业的运作效率,降低整个过程的进销存成本、增加收益,就需要一种新的数据分析技术来处理数据。
数据挖掘技术就是利用机器学习统计数学和可视化技术,从大量的数据库中确认出有效的、新颖的、潜在的、有用的以及最终挖掘出可理解模式的高级处理过程,数据挖掘实际上是数据库中的知识发现过程。
数据挖掘:过程与方法
数据挖掘是将人工智能技术(神经网络,模糊逻辑,遗传算法等)应用到大规模数据中,从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。
数据挖掘作为知识发现的一个特定步骤,是知识发现的核心。它的目标是利用算法,从数据中抽取模式,将大容量数据转换为有用的知识和信息。
这里所提的模式包括模型或结构。数据挖掘的过程一般由三个主要的阶段组成:数据准备、数据采集、结果表达和解释。数据挖掘方法有很多种,其中比较典型的有关联分析、序列模式分析、分类分析、聚类分析等。
关联分析是利用关联规则进行数据挖掘,目的是挖掘出隐藏在数据间的相互关系,关联规则是描述事物之间同时出现的规律的知识模式。序列模式分析和关联分析相似,是把数据之间的关联性与时间性联系起来,侧重点在于分析数据间的前后或因果关系,为了发现序列模式,不仅需要知道事件是否发生,而且需要确定事件发生的时间。分类分析就是分析示例数据库中的数据,为每个类别做出准确的描述、建立分析模型或挖掘出分类规则,把集中的数据映射到某个给定的类上,其输入集是一组记录集合和几种标记。与分类分析不同,聚类分析法的输入集是一组未标定的记录,也就是说此时输入的记录还没有进行任何分类,其目的是根据一定的规则,合理地划分记录集合,使组之间的差别尽可能大、组内的差别尽可能小。
现代进销存的新理念包括反应快速化、服务系列化、作业规范化、目标系统化、手段现代化、组织网络化、经营市场化,这些都离不开完善的信息系统的支撑。随着数据量的剧增,数据挖掘技术将成为深化进销存信息管理的最有效方法,在解决选址、仓储和配送等基础进销存问题方面可以发挥出很大的作用。
选址问题
进销存中心的选址属于最小成本问题,即求解为运输成本、变动处理成本和固定成本等之和的最小化问题。选址需要考虑到中心点数量和中心点如何分布等情况,尤其是多中心选址的问题。多中心选址是指在一些已知的备选地点中选出一定数目的地点来设置进销存中心,使形成的进销存网络的总费用最小。在实际操作中,当问题规模变得很大,或者要考虑一些市场因素(比如顾客需求量)时,数学规划就存在一些困难。针对这一问题,可以用数据挖掘中的分类树方法来加以解决。
分类树的目标是连续的划分数据,使依赖变量的差别最大。分类树的真正的目的是将数据分类到不同组或分支中,在依赖变量的值上建立最强划分。用分类树的方法解决这个问题时,通常需要以下四个方面的数据:中心点的位置、每个中心点的业务需求量、备选点的位置、在中心点和备选点之间的距离。
通过分类树的方法,不仅确定了中心点的位置,同时也确定每年各个地址间物品的运输量,使整个企业必要的销售量得到保证,企业长期折现的总成本也会达到最小值。
配送问题
配送问题,包括配送计划的编制、配送路线的设计优化以及配送过程中的配载(混载)问题。在许多配送体系中,管理人员需要采取有效的配送策略以提高服务水平、降低货运费用。其中首要的难题,就是车辆的路径问题。车辆路径问题是为一些车辆确定一些客户的路径,每一客户只能被访问一次,且每条路径上的客户需求量之和不能超过车辆的承载能力。
要合理解决这个问题,需要进销存设计人员考虑到车辆的利用能力,如果车辆在运输过程中的空载率过高或整车的运力不完全利用,这些无疑会增加企业的运输成本。另外还涉及到车辆的运输能力,这就必须考虑到货品的规格大小和利润价值的大小。
在采取有效的配送策略时这些因素都必须同时考虑,这时如果能够对顾客的需求和运输路径综合起来进行分类,对整个配送策略中车辆的合理选择分派会有较好的作用。
仓储问题
现代进销存管理在电子商务、供应链合作、全球化、及时反应的影响下,对仓库的要求越来越高了:交易更频繁、处理和存储更多货品、提供更多客户自定义产品和服务以及提供更多的增值服务,等等。
仓库问题包括存储货物、中转运输、顾客服务三方面的内容。在这三方面的成本计算中,仓储成本无疑在企业总的成本核算中占很大一部分,如何合理安排货品的存储、压缩货品的存储成本,正成为现代进销存管理者不断思考的问题。哪些货品放在一起可以提高拣货效率?哪些货品放在一起却达不到这样的效果呢?这时就可以采取数据挖掘中的关联模式分析来帮助解决这方面的问题。
关联模式分析的目的,是为了挖掘出隐藏在数据间的相互关系。即通过量化的数字,描述产品A的出现对产品B的出现有多大影响。关联分析就是给定一组Item和一个记录集合,通过分析记录集合,推导出Item间的相关性。
可以用四个属性来描述关联规则:可信度,即在产品集A出现的前提下,B出现的概率;支持度,即产品集A、B同时出现的概率;期望可信度,即产品集B出现的概率;作用度可信度,即对期望可信度的比值。目前大多数的关联分析都基于“支持度—置信度”的框架,其目的是抽取形如“if A then B”的规则。上述规则的支持度用S表示,置信度用C表示。
通过上述关联分析可以得出一个关于同时购买商品的简单规则,以及每条规则的置信度和支持度。支持度高表示规则经常被使用,置信度高表示规则比较可靠。通过关联分析后可以得到关于产品A、B的关联程度,从而决定这两种货品在货架上的配置。
沃尔玛公司就是一个成功应用数据挖掘技术的大公司。一个典型例子,是客户的菜篮子分析,从客户购买的记录中得出客户会同时购买哪些产品。其中最著名的结论是,一个生病的消费者的购买篮包括橙汁和咳嗽糖浆——如果一个消费者购买了咳嗽糖浆,他就有30%的可能会同时购买橙汁。这些结论可以战略性的布置货品在仓库中的位置,以促进交叉销售和某类交易模式。
目前已有多项与计算机相关的技术在进销存领域得到广泛应用,这些技术包括电子数据交换、人工智能和专家系统、互联网技术和通信技术等。随着数据量的剧增,深化进销存信息管理的最有效的方法是在其中引进数据挖掘技术,以从数据中发现趋势和模式,并将新发现转变为经营上的成果,提高利润,降低成本。
文章来源:秘奥软件网,中小企业信息化领跑者!全国咨询热线:400-9908-527_www.misall.com
Copyright @ 2007 MISALL Corporation. All Rights Reserved. All Powered By
粤ICP备07050206号
地址:广州天河区大观南路26号长盛商务大厦B713、715 电话:020-28269517