来源: 2023-10-16 rootadmin
2009年,一种甲型H1N1流感,短短几周内在美国各地迅速传播开来。
人们注意到,在该流感爆发几周前,谷歌公司的工程师就预测了这次流感的传播,而且具体到特定的州。
他们是如何做到的?原来谷歌是通过观察人们在网上的搜索记录来完成这项预测的。谷歌把5000万条美国人最频繁检索的词条和美国疾控中心在2003年至2008年季节性流感传播时期的数据进行了比较,发现了45条检索词条的组合,将它们用于一个特定的数学模型后,他们能预测出流感是从哪里传播出来的,且判断非常及时。
之前,疾控中心根据各地上报的病例,判断流感传播情况,而且通常在流感爆发一两周后才能做出较为准确的判断。而谷歌并没有医学专业背景只是通过对搜索词条的大数据进行分析就能提前预测。
可见,大数据的几个显著特点:
1.大数据的核心用途是预测,即把数学算法运用到海量的数据上来预测事情发生的可能;
2.大数据提供了认识世界的另一种方式,即从数据角度认识世界。数据分析师能在某种程度上替代专业人士;
3.大数据多依赖相关关系,而不是因果关系。它能告诉你会发生什么,而不是为什么发生。
{{item1.comment_user.name}}
{{item1.comment_time | formatDate}}
{{item1.comment_text}}