数据挖掘是对大量数据的分析,以发现模式和知识。实际上,数据挖掘也称为数据发现或知识发现。
数据挖掘使用统计学,机器学习原理(ML),人工智能(AI)和大量数据(通常来自数据库或数据集)来以尽可能自动化和有用的方式识别模式。
数据挖掘有什么作用?
数据挖掘有两个主要目标:描述和预测。首先,数据挖掘描述了从分析数据模式中获得的见解和知识。其次,数据挖掘使用已识别数据模式的描述来预测未来模式。
例如,如果您花时间在购物网站上浏览有关如何识别不同类型植物的书籍,则该网站幕后工作的数据挖掘服务会记录与您的个人资料相关的搜索说明。两周后再次登录时,网站的数据挖掘服务会使用您之前搜索的描述来预测您当前的兴趣,并提供个性化的购物建议,其中包括有关识别植物的书籍。
数据挖掘的工作原理
数据挖掘使用算法,指令计算机或处理如何执行任务的指令集,发现数据中的不同类型的模式。数据挖掘中使用的一些不同的模式识别方法包括聚类分析,异常检测,关联学习,数据依赖性,决策树,回归模型,分类,异常值检测和神经网络。
虽然数据挖掘可用于描述和预测所有不同类型数据中的模式,但许多人最常遇到的用途,即使他们没有意识到,也会描述您的购买选择和行为中的模式,以预测未来可能的采购决定。
例如,你有没有想过Facebook似乎总是知道你在网上看到了什么,并在你的新闻源中向你展示了与你访问过的其他网站或网络搜索有关的广告? Facebook数据挖掘使用存储在浏览器中的信息来跟踪您的活动,例如cookie,以及基于您之前使用Facebook服务的模式自身知识,以发现和预测您可能感兴趣的产品或产品。
可以开采哪种数据?
根据服务或商店(物理商店也使用数据挖掘),可以挖掘大量关于您和您的模式的数据。收集的有关您的数据可能包括您驾驶的车辆类型,居住地点,您旅行的地点,您订阅的杂志和报纸以及您是否结婚。它还可以确定您是否有孩子,您的爱好是什么,您喜欢哪个乐队,您的政治倾向,您在线购买的内容,您在实体店中购买的内容(通常通过客户忠诚度奖励卡)以及您分享的任何详细信息关于你在社交媒体上的生活。
例如,针对青少年的零售商和基于时尚的出版物使用来自Instagram和Facebook等社交媒体服务上的数据挖掘照片的见解来预测将吸引青少年购物者或读者的时尚趋势。通过数据挖掘发现的洞察力可以非常精确,以至于一些零售商甚至可以根据购买选择的非常具体的变化来预测女性是否可能怀孕。据报道,零售商Target如此准确,根据购买历史的模式预测怀孕,它将婴儿用品的优惠券邮寄给一位年轻女士,在她告诉家人之前放弃了她的怀孕秘密。
数据挖掘无处不在,但是,商店和服务使用了大量关于我们的购买习惯,个人偏好,选择,财务和在线活动的信息,以增强客户体验。