新浪科技讯 11月5日上午消息,Teradata天睿公司大中华区首席执行官辛儿伦在2012年Teradata全球用户大会上接受新浪科技专访时表示,大数据在未来五年内会加快发展,但仍然不会是爆发期,还将处于发展阶段。
2012年Teradata全球用户大会于当地时间10月21日-24日在美国华盛顿召开,开幕式上,可容纳3000多人的会场座无虚席,来自全球55个国家和地区的用户、合作伙伴、分析师等在会议期间互相交流和学习。
虽然已是第三次参加全球用户大会,谈起这届大会,Teradata天睿公司大中华区首席执行官辛儿伦显得有些兴奋:三年前和团队一起憧憬向全球推广大中华区用户建设经验的规划在此刻实现;中国工商银行不仅获得了数据仓库最佳实施用户大奖(EPIC)的“运营杰出奖”,还受邀在大会上做主题发言;而中国建设银行也获得EPIC的两项提名奖。
随着社会和电脑技术的不断发展,各行各业所产生的数据量不仅越来越大,结构也更丰富,其中的关系程度也越来越复杂,而企业对数据分析的需求也越来越高,希望分析探索数据背后的价值。
辛儿伦认为,行业大数据从分析领域来看存在一定共性,要求具备三种能力去建设数据分析:即要有整合企业数据的能力;整合数据以后,构建挖掘、探索潜在商业价值的能力;以及制定精确的行动纲领,采取高效行动的能力。所以,建立整合、探索和行动这三种能力是非常重要的。
至于大数据分析与传统的商业智能有哪些不同?辛儿伦解释称,传统商业智能只是针对结构化数据分析的范畴。“过去这几年来,随着IT的创新,它的能力已经不只是处理结构化的数据,因为许多网站、日志、文本、社交媒体、机器新生成的数据也需要并值得去分析。这些数据都不是以结构化的结构存储的,以前可能没有这方面的工具去分析这类数据。”
如今,大数据分析已经逐渐成为行业热点。市场研究公司Gartner曾预计,大数据今年将直接或间接拉动全球960亿美元的IT支出,这一数据在2013年将达到1200亿美元,2016年达到2320亿美元,2015年全球将会新增440万个IT工作岗位以支持大数据。
即便如此,辛儿伦认为,大数据距离真正爆发期还有一段距离,在未来五年内,会加快发展的速度,但还将处于发展的阶段。“现在根本都还没有到爆发期,还是一个发展期阶段。我觉得至少在未来几年,随着更多在分析领域底层基础技术的发展,开发更多良好的易于使用的工具,会加快发展的速度。”
以下为部分对话实录:
问:今年大会哪些地方给您印象比较深刻?
答:我是第三次参加这个大会,我和我的团队在三年前就一起憧憬,能够在全球的用户大会上分享我们大中华区的经验。我们大中华区里有许多客户,我们和客户一起投入了很多时间、很多精力建设很好、很优秀的数据仓库,希望我们有更多的故事能够与全世界分享。正好Teradata全球用户大会是一个很好的平台,像中国工商银行经过几年的酝酿和建设,这次非常荣幸邀请到他们做大会主题发言,还获得了EPIC的“运营杰出奖”。中国建设银行通过8-9年的数据仓库建设,这次也获得了两项提名奖。
应该来说,通过全球用户大会,国内、国外的客户之间实现了互动交流,我发现有很多国外的IT员工、CIO等对中国国内领先的数据仓库的建设特别感兴趣。在工商银行的专题演讲讨论中热烈参与,并提出很多的问题和建议。这次我们取得了相当好地与世界舞台沟通、交流的机会,我们希望在未来加大这方面的力度,不仅是金融行业、通信行业、交通、运输等各行各业都可以通过这个平台来跟世界做交流。
问:现在大数据已经成为一个行业热点,在您看来哪些行业或者企业更需要大数据?
答:回顾一下电脑科学的历史,随着市场在数据分析领域的需求日趋提高,许多的厂家更加专注研发数据分析的技术和应用。特别在过去几年,随着技术的创新,以及数据的蓬勃发展,不仅是数据量越来越大,它的分析维度越来越精细,它的结构越来越丰富,它的关系程度也越来越复杂,所以更多的企业在数据整合、探索和挖掘、分析、进而采取行动等方面的需求与日俱增,已经从过去的传统结构化数据,延伸到半结构化或者非结构化、或者多元结构化的数据分析。
随着对深度、广度和时效性的需求,各个企业陆陆续续都提出这样的数据分析需求。企业在信息资产管理的基础建设逐步成熟后,过去在金融或者通信行业的客户更早地提出这方面的需求。最近几年,政府、能源、制造业、通信、航空、交通、运输,各行各业都迫切需要建设这种能力,去分析探索数据背后的价值。
我觉得大数据不是一两个行业的需要,而是各行各业都有需求,不仅是国外有大数据分析的需求,在中国也一样受到关注。那大数据有哪些共性:从数据分析领域来讲,它的共性是要求企业具备三种能力去建设数据分析:它要有整合企业数据的能力,整合数据以后,构建挖掘、探索潜在商业价值的能力,制定精确的行动纲领,采取高效行动的能力。所以,建立整合、探索和行动这三种能力是非常重要的。
问:您觉得大数据与传统的商业智能有什么区别和联系呢?
答:当以前讲到BI,当时没有全面性的IT工具去协助厂商针对于商业各种不同结构的数据进行分析,同时通过分析将商业数据转换成企业有用的信息,从有用的信息归纳总结成为真正协助企业成长的知识。
以前更多提到所谓的BI,是针对结构化数据分析的范畴。过去这几年来,随着IT的创新,它的能力已经不只是处理结构化数据,因为许多网站、日志、文本、社交媒体、机器新生成的数据也需要并值得去分析。这些数据都不是以结构化的结构存储的,以前可能没有这方面的工具去分析这类数据,但是现在有了这方面的技术。现在有些厂家提供的工具,是能够帮助满足各方面各种不同数据结构的需求。
问:大数据行业现在特别热,有机构预测未来两年可能全球会有超过400万个新的工作岗位与大数据有关,也会出现一些行业的持续并购和整合。一些风投也比较看好大数据创业方面的工作,您觉得这个市场未来会有多大?
答:这可能要追溯整个信息化的演进和发展来看,每个地区和国家信息化的建设,刚开始可能都偏向于信息化的基础设施建设,随着基础设施建设和应用面对操作型、交易型应用的建设越来越趋于成熟,企业逐渐在这个领域上的投资会更趋向于审慎。但是,在数据分析领域,随着企业面临到更大的竞争,随着内部智慧化运营及提升利润的要求,企业会逐步筛选相应良好的信息化流程和工具,协助完成数据分析工作。
因为大数据涵盖的是多重维度多元化数据的需要,已经不再只是协助分析关系型数据。我们感到更多地是用户、客户在这方面的投入越来越大,因为这样能够驾驭数据形成有用的信息,协助他们具体提高生产力和竞争力。当然随着这方面投入的增加,相应地对人才的需要、工作岗位的需求会增加,而且随着科技创新,以及厂商在这个方面的研发,可能会越来越倾向于在该领域加强投资。
问:大数据对企业经营来说,如果可以有一个良好的分析决策,对企业的影响会是很良性的。比如,客户在面临大数据的时候,经常会有哪些需求和要求?
答:以前在所谓结构化数据分析工具的层面上,没有办法通过那样的工具分析这些新的数据。比如,对于网络日志的分析,去分析网站用户发布的东西,过去可能通过一些关系型数据的工具去分析,也可以做,但是不是一个最佳、最有效的工具。比如,机器生成的数据,这个数据不是按照结构化的关系存储的,或者很多数据的元素并不知道彼此之间的关系,也就是这种关系可能是未知的,需要通过探索的手段才能获得彼此之间的关系。
以前CIO都想去解决这方面的问题,但是依靠过去的技术手段是没有办法有效实现的,现在通过像Teradata等厂商研发的工具,有能力去处理这方面的需求。
您说现在客户对大数据有哪些需求点,我觉得可能目前还只是一部分的需求。在之前传统的商业世界里,我们去记录客户的行为,往往是具体发生一笔交易才会去记录,或者说只是一些很具体发生的接触点才会记录。现在,客户、产品相关的地理位置信息,这些信息记录下来都是大数据,网站的留言、语音、视频、图像的分析等都是大数据的应用。
另外一个就是现在用的比较多的传感器,物流行业大量用到传感器技术。就传感器来说,有部分数据是数字的,还有很多非数字化的信息,比如文本、图像等。在喷气发动机的运行监控中,现在有很多传感器可以获取它的信息,但实际上还是需要人去分析,那些都是大数据,还是不太好处理的数据。又例如,今天企业想很好地处理客户信息多渠道的协同,可以客户访问企业网站的信息,结合这个客户去柜台或呼叫中心的情况进行分析。这在以前是不太容易做到的,今天利用Aster SQL-MapReduce都已经能做到多渠道的协同分析了。针对这些,现在已经有成功的案例了。
例如,在银行业里,能够保留并成长客户是很重要的,所以他们对客户的满意度是相当专注的。举个典型例子,如果有一个客户通过呼叫中心抱怨,你上个月怎么收了我25块,说这是什么费用。如果客户通过呼叫中心可能会抱怨说两遍,银行也没有怎么注意,然后他通过银行的网站再投诉,银行也没有怎么注意,而这个客户再通过银行各种不同渠道再投诉,通常经过这几次以后,他就觉得银行根本就不是从客户服务的立场出发,客户流失的风险必然大大提升。如果银行有这方面的能力,就能知道有客户之前在哪些渠道已投诉,那就必须注意了。
问:在互联网行业,从数据上来说,Facebook在全球注册活跃用户已经超过了十亿,它产生的数据量是非常巨大的,就像针对这种互联网行业公司,咱们能给他们哪些服务?
互联网公司平时要处理非常大的数据量,除了数据量大以外,还有非常多的文字、图片、视频、声音等。直到今天为止,这当中绝大部分的内容还是没有被很好利用,除了文字以外,还没有很好地利用真正发掘出来的价值,那里还是未开发的宝库。
互联网企业无论是eBay、Facebook等,因为它太大,我们应该从IT应用的角度稍微拆一下。不管是做什么,最终还是一个企业,总是要有财务系统、有客户服务系統、有员工管理系统,这些都是传统的。这些都有非常成熟的解决方案。在互联网行业,大家比较关心相对较成熟的大数据子集,如社交相关的应用以及移动技术的应用等。使用Teradata Aster的技术,包括Hadoop的技术,实际上是可以产生出较多的价值。例如,根据人的定位,根据俩人之间是不是有微博的关系,就能判断出更多属性,做出更好的服务或者更好的风险控制等等。
今天的互联网企业已经在应用这方面的技术,包括Teradata也可以提供这方面的技术。有些是用Hadoop在做,有些是用Aster在做,还有一些是用Teradata的技术在做。
具体来讲,图的分析、各种关系的分析,甚至说直接按照拓扑计算的地理信息,这都是今天Teradata大的技术群、产品群很成熟的技术,已经具有很成熟的案例,比如LinkedIn就是在使用Aster和Hadoop技术。比如eBay,每天处理大量的交易信息,涉及大量的客户、风险管控、产品推广等,现在主要使用Teradata在同一个系统中实现。
问:这种类型的大型互联网公司,将来会在某一个方面,在数据分析方面会和Teradata成为竞争对手?如果很多做数据分析的互联网企业,像Facebook这样做到了非常大的量,自己本身就是一个大数据主要的领导者。
答:我觉得不会存在这种竞争的关系,对我们来讲,这是不同生态链上的企业。我不认为这些企业会从现在的价值链、业务链上突然跳出来。
价值链和业务链很重要,Teradata是技术解决方案提供商,我们的专注和互联网公司的专注不同。我们更加专注提供科技、技术、产品、平台、咨询和服务,提供给各行各业的企业,终极目标就是激发企业的商业的潜能,提升它们的生产力和竞争力。互联网企业可能更多是利用现在的技术,去提升自身在互联网领域的潜能,专注还是不同的。
问:之前您接受采访也说过,现在大数据还远远没到爆发期,您觉得大数据的爆发期未来会在什么时候到来?比如说在未来的五到十年,大数据会有什么样的走势?
答:我们可以追溯一下,传统的结构化数据是在20世纪,而且这种发展长达四五十年。从过去结构化的数据到现在有能力处理半结构化和非结构化数据,其间发展时间应该也不超过五年,也就是最近这四五年的事情。
所以,现在根本都还没有到爆发期,还是一个发展期阶段。我觉得至少在未来几年,随着更多在分析领域底层基础技术的发展,开发更多良好的易于使用的工具,会加快发展的速度。但目前,我觉得应该是在发展期的阶段。
问:您觉得未来五到十年会发展到一个什么样的程度?
答:我觉得未来五年肯定还是一个发展的阶段。会有更多厂商提供更好的商业工具,因为不是所有的厂家都能够去组织庞大的IT团队去开发开源的Hadoop工具,可能有一些厂家要去扮演所谓的中间阶层的角色,把良好的易于使用的工具提供给企业。
问:针对中国目前的大数据市场,Teradata中国有没有专门针对中国市场的信息可以跟大家分享?
答:我们去年1月收购了Aster data。在第三方评估来看,Aster Data在半结构化、非结构化数据分析领域是全球领先的厂家,Teradata专注36年研发结构化数据分析,通过这次并购已经延伸了Teradata的能力,具有处理各种不同结构数据分析的能力。目前,我们在国内推广Aster Data,初步已经见到相当好的成效,同许多通信行业、金融行业、制造行业领域的客户一起合作。应该讲,目前合作的初级阶段就已经取得了相当不错的进展。