2012年,“大数据”(Big Data)一词席卷了IT业界。
顾名思义,大数据时代就是指有大量数据生成并利用这些数据的时代。
IBM日本公司称,全球每天生成的数据量达到2.5EB,而且其增长势头在不断加快。
大家或许对EB这一单位不太熟悉,如果换算成家庭使用的普通蓝光光盘,2.5EB相当于10亿张容量为25GB的蓝光光盘。
而且令人吃惊的是,人类迄今为止生成的数据中,有90%是在近两年内产生的。
除了电子邮件、推特和Facebook中输入的数据、用手机随手拍摄的图片,以及向YouTube投稿的视频之外,还有各种传感器收集的数据,以及网上购物等的日志数据等,都被收集起来。现在,每秒钟会产生1万条微博等信息。
这些数据被称为非结构化数据,在生成的数据中约占8成。非构造化数据今后还将爆发性增加,估计在今后5年内将增加800%。
另外还有人推算,到2020年,一年将生成35ZB的数据,这一数据量相当于目前的44倍。
在这样的情况下,重要的一点是,目前的IT系统无法完全满足大数据的要求。
针对IT系统的处理进行了优化的数据被称为结构化数据,其代表是Excel数据等。但大数据时代的IT系统必须能够收集并分析微博及视频等大量非结构化数据。另外,将多种不同数据结合起来,催生新的发现,这也是大数据时代要求IT系统具备的要素。
因此,业内人士达成的共识是,大数据时代不仅指大量数据生成的时代,而且还指IT系统的机制本身被刷新的时代。
不过,大数据涉及的范畴不仅限于IT业界,因为其中还蕴涵着使我们的生活发生巨大变化的要素。
大数据消除交通堵塞
那么,大数据会以什么样的形式影响我们的生活呢?其实,大数据会给我们带来这样的未来。
比如,通过收集并分析来自行驶于市内的几十万辆汽车上的传感器发出的大量数据,便可实时掌握哪里发生了交通堵塞,并可根据这些信息向汽车发出指示,避开交通堵塞。
不过,只是这样的话并没多大意义。
如果这些信息中还包含市内举行的大型活动的信息,便可结合这些信息,根据活动开始及结束的时间来预测会场周围的堵塞情况,然后根据事先预测做出绕道的指示。
另外,还可试着加入气象信息、道路施工信息、公共交通信息及停车场信息等。这样,在可能出现交通堵塞的道路上,便可灵活变更车道数量,或者鼓励用户将车辆停到最近的停车场,改乘公共交通工具前往目的地。
这时,还可结合一些其他的手段,比如对使用公共交通工具的人提供会场优惠,而对驾车去会场的人收取一定的市区堵塞费等段。这样便可进一步有效缓解交通堵塞。
而且,根据推特和Facebook等社交媒体上的信息可以了解到来自某一特定地区的数据输入较为集中,由此便可得知那里发生了某些情况,然后根据这一信息向车辆发出绕道的指示。
现在海外已开始监视社交媒体上的言论,当有大量人群聚集场所产生大量负面言论时,就会判断那里有发生游行或犯罪的预兆。在地图上显示这些信息后,当附近的警力薄弱时,就会向其他地区的警察发出指示,让他们前往这些有可能出现问题的地方,为现场补充警力,从而事先防范骚乱。
另外,还可与市内的电力使用数据联动,发行超市限时优惠券促使窝在家中的人在下午用电高峰时段出门;还可鼓励人们在用电低峰为电动汽车充满电、在用电高峰在电动汽车中渡过,由此来削减家庭用电量。
仅从缓解交通堵塞的观点来看,便可预见到这么大的变化。通过收集大量数据并把这些数据结合在一起进行分析,便可事先拿出多种对策,而且还可使社会本身变得丰富起来。而这也正是大数据的本质所在。
进入2013年后,大数据的应用案例估计会越来越多,这将为我们带来意想不到的便利且丰富多彩的世界。作为具体的成果,2013年将会实现什么样的新鲜事物,让我们拭目以待。