“大数据”是通过研究大量非结构化数据来理解和预测人类行为的新科学。 大数据也称为“预测分析”。
分析Twitter帖子,Facebook提要,eBay搜索,GPS跟踪器和ATM机是一些重要的数据示例。研究安全视频,交通数据,天气模式,航班到达,手机塔日志和心率跟踪器是其他形式。大数据是一种混乱的新科学,每周都在变化,只有少数专家了解这一切。
常规生活中的大数据有哪些例子?
虽然大多数大数据项目都非常模糊,但有大量数据成功影响个人,公司和政府的日常生活:
预测病毒爆发: 通过研究社会政治数据,天气和气候数据以及医院/临床数据,这些科学家现在预测登革热爆发将提前4周通知。
凶杀案观察: 这个大数据项目描述了华盛顿特区的谋杀受害者,嫌犯和罪犯。作为一种尊重死者的方式和作为人们意识资源的方式,这个大数据项目非常吸引人。
纽约市过境旅行计划: WNYC电台节目制作人Steve Melendez将在线地铁时刻表与旅行行程软件相结合。他的创作让纽约人在地图上点击他们的位置,并预测火车和地铁的旅行时间。
施乐减少了员工流失: 呼叫中心工作情绪激动。施乐在专业分析师的帮助下研究了大量数据,现在他们可以预测哪些呼叫中心招聘人员可能会在公司工作时间最长。
支持反恐: 通过研究社交媒体,财务记录,航班预订和安全数据,执法部门可以在恐怖主义嫌疑人做出恶行之前对其进行预测和定位。
根据社交媒体评论调整品牌营销: 人们直截了当地在酒吧,餐厅或健身俱乐部分享他们的在线想法。可以研究这些数以百万计的社交媒体帖子,并向公司提供有关人们对其服务的看法的反馈。
谁使用大数据?他们用它做什么?
许多单片公司使用大数据来调整其产品和价格,以最大限度地提高客户满意度。
- 梅西百货公司例如,使用大数据来动态调整价格超过7000万种产品。他们甚至根据Macy认为他们感兴趣的内容向他们的客户发送定制的电子邮件。
- 警方回应波士顿马拉松爆炸事件:通过使用大数据来研究视频和监控图像,警方能够迅速缩小他们对嫌疑人的搜索范围。
- 莫顿牛排餐厅 使用Twitter推出营销特技,包括着名的新泽西机场提供的上等牛排和虾晚餐。
- Visa使用大数据来识别和捕获欺诈者。单一交易在这里和那里很容易隐瞒不诚实的信用卡用户,但通过仔细观察数百万的交易,可以检测到欺诈模式。
- Facebook使用大数据来定制广告。通过仔细研究你的FB喜欢和浏览习惯,社交媒体巨头对你的品味有着深刻的洞察力。您在Facebook Feed上看到的那些侧边栏广告是通过非常慎重和复杂的算法选择的,这些算法一直在关注您的Facebook习惯。
为什么大数据如此重要?
4件事使大数据显着:
1.数据庞大。 它不适合单个硬盘驱动器,更不用说USB硬盘了。数据量远远超过了人类大脑所能想到的数量(想想数十亿亿兆字节,然后再增加数十亿字节)。
2.数据混乱且非结构化。 50%到80%的大数据工作是转换和清理信息,以便可搜索和排序。我们这个星球上只有几千名专家完全知道如何进行这种数据清理。这些专家还需要非常专业的工具,如HPE和Hadoop,才能完成他们的工艺。或许在10年内,大数据专家将成为一打一打,但就目前而言,他们是一种非常罕见的分析师,他们的工作仍然非常模糊和繁琐。
3.数据已成为可以出售和购买的商品**。 存在数据市场,公司和个人可以购买数TB的社交媒体和其他数据。大多数数据都是基于云的,因为它太大而无法放入任何单个硬盘上。购买数据通常涉及到插入云服务器场的订阅费。
**大数据工具和创意的领导者是亚马逊,谷歌,Facebook和雅虎。 由于这些公司为数百万人提供在线服务,因此有意义的是,他们将成为大数据分析背后的收集点和远见卓识者。4.大数据的可能性是无穷无尽的。 也许有一天医生会在个体发生前几周预测心脏病发作和中风。通过对其机械数据,交通和天气模式的预测分析,可以减少飞机和汽车碰撞。在线约会可能会通过大数据预测人员为您提供兼容的个性来改善。音乐家可能会深入了解哪些音乐作品最能满足目标受众不断变化的口味。营养学家可能能够预测商店购买的食物的哪种组合会加重或帮助一个人的医疗条件。 表面只有划痕,大数据的发现每周都会发生。
大数据很乱
大数据是预测分析:将大量非结构化数据转换为可搜索和可排序的内容。 这是一个混乱和混乱的空间,需要一种特殊的知识和耐心。
以单片UPS交付服务为例。 UPS的程序员从他们的驾驶员的GPS和智能手机上研究数据,以分析适应交通拥堵的最有效方法。 此GPS和智能手机数据庞大,无法自动准备分析。这些数据通过不同的智能手机硬件设备从各种GPS和地图数据库中注入。 UPS分析师花费数月时间将所有数据转换为易于搜索和排序的格式。 不过,这项努力值得。如今,自从开始使用这些大数据分析以来,UPS已经节省了超过800万加仑的燃料。
由于大数据混乱,需要大量精力进行清理和准备使用,数据科学家已经成为他们所做的所有繁琐工作的绰号“数据管理员”。
不过,大数据和预测分析科学每周都在不断改进。预计到2025年,每个人都可以轻松访问大数据。
隐私权不是大数据的侵入威胁吗?
是的,如果我们的法律和个人隐私保护措施未得到谨慎管理,那么大数据会侵入个人隐私。目前,谷歌,YouTube和Facebook已经跟踪了您的日常在线习惯。您的智能手机和计算机生活每天都会留下数字足迹,而老练的公司正在研究这些足迹。
围绕大数据的法律正在发展。隐私是一种存在状态,您现在必须承担个人责任,因为您不能再将其视为默认权利。
您可以采取哪些措施来保护您的隐私:
您可以采取的最大一步是使用VPN网络连接掩盖您的日常习惯。 VPN服务会扰乱您的信号,以便您的身份和位置至少部分地被跟踪器屏蔽。这不会让你100%匿名,但VPN将大大减少世界观察你的在线习惯的程度。
在哪里可以了解有关大数据的更多信息?
对于拥有分析思维和对科技的热爱的人来说,大数据是一件非常有趣的事情。如果那就是你,那么一定要访问这个有趣的大数据项目页面。