Google流感趋势不再发布当前统计数据,但网站上仍然提供历史数据。
人们在生病时寻找有关流感的信息并不奇怪。谷歌找到了一种方法来利用这一趋势,并用它来估算各地区的流感活动。他们发现,搜索趋势数据实际上比传统CDC(疾病控制中心)流感爆发追踪方法快两周左右。
谷歌流感趋势将为您估计美国目前的爆发水平,或逐州分解。您还可以查看过去几年的趋势,并搜索一个可以在您附近找到流感疫苗的地方。
大数据
谷歌流感趋势是大数据发现的一个例子,大数据用于描述大型结构化或非结构化数据集,这些数据集太大而且复杂,无法使用传统方法进行检查。
传统的数据分析通常涉及将收集的内容保持在可管理的大小。研究人员使用较小的非常大的群体统计样本,以便对较大的群体做出有根据的猜测。例如,政治民意调查是通过召集相对较少的人并向他们提问来完成的。如果抽样类似于较大的群体(例如,马萨诸塞州的所有选民),则可以使用小群体的调查结果来猜测较大的群体。您需要拥有一个非常干净的数据集并知道您要搜索的内容。
另一方面,大数据使用尽可能大的数据集 - 比如Google中的所有搜索查询。当您使用大的数据集时,您也会收到混乱的数据:不完整的条目,猫在键盘上行走的搜索条目,等等。没关系。大数据分析可以将此考虑在内,并最终得出结论,否则可能无法找到。
其中一项发现是谷歌流感趋势,该趋势着眼于流感症状搜索查询的高峰期。你并不总是谷歌,“嘿,我有流感。好谷歌,我附近的医生在哪里?”你倾向于寻找“头痛和发烧”之类的东西。在一个非常混乱和大量的搜索查询中略微上升的趋势是谷歌流感趋势的推动力。
这不仅仅是一个新奇事物,因为它比疾病预防控制中心更快地发现流感峰值。疾病预防控制中心依靠医生和医院的阳性流感测试。这意味着人们不得不生病到足以引起流感测试飙升的医生,然后实验室必须报告这一趋势。当你能够动员治疗时,人们已经生病了。