主持人:各位来宾,各位媒体朋友,大家好,欢迎大家参加今天IBM的活动,IBM2013大数据新闻发布会。IBM作为一家历史悠久的百年公司,和数据的交道也不是很短的时间了。自从2000年以来IBM在收购大数据及分析领域的企业就已经超过了35家。另外IBM在大数据及分析领域研发上的投入每年高达40亿美元,连续19年专利数量获得第一。同时IBM在全球包括北京在内的六个城市建立了全球业务分析和解决方案中心。全球拥有9000名顾问和400名数学家,同时告诉大家,IBM其实是一家拥有全球数量最多的数学博士的雇主。IBM明确了以智慧的分析洞察为核心的大数据战略,构建了业界最完整的大数据价值体系,力图帮助企业能够在大数据时代致胜。

首先我介绍一下到场的嘉宾:来自中国市场的大数据实践代表,他们是:德华安顾人寿董办主任王洪涛博士;先进数通有限公司总裁林鸿先生;同时我们也请来了国内知名的大数据学者,电子科技大学互联网科学中心主任周涛教授。下面介绍一下来自IBM的领导:IBM全球副总裁兼大中华区软件集团总经理胡世忠先生;IBM软件集团大中华区中间件集团总经理李红焰女士;IBM软件集团大中华区战略及市场总监吴立东女士;IBM全球企业咨询服务部业务分析与优化服务大中华区总经理段仰圣先生;IBM软件集团大中华区业务分析软件总经理缪可延先生;IBM软件集团新兴市场大数据中心总监王晓梅女士。同时我今天特别高兴地跟大家分享一位今天特别请到的远道而来的IBM的嘉宾,IBM软件集团新兴市场业务分析软件副总裁Katrina Troughton女士。谢谢大家。

下面让我们以热烈的掌声有请IBM全球副总裁兼大中华区软件集团总经理胡世忠先生做开场致辞。

胡世忠:各位下午好,欢迎参加我们的活动。我差不多有十分钟的时间启动这样一个活动,下面还有一些演讲者,我的同事刚才已经介绍完了,我们今天会详细围绕大数据的内容进行探讨。首先我来讲一些理念,我重新概述一下IBM今天就我本人来说在过去几年当中,包括团队、IBM的人员,不管他们的名片是什么,他们可能是代表着某一个具体的市场,具体到一些地区,来自服务器、硬件咨询、GTS,但是最终来说我们自己的职责还是非常明确的,代表着IBM,更加广泛的产品组合和我们的能力、技术,能够来保证在智慧地球非常有效的运行。

第二点要强调的是智慧地球是基于三个主要的原则,我们不断和客户进行讨论、强调,我把它变成三个“I”,感知化、互联化、智慧化。围绕三个方面的数据,可以看到数据的来源,数据的传送方式,数据使用方法。关于这三个阶段,今天围绕这个会讨论很多,我本人和我的同事们会讲解一些观点,是市场上非常热门的话题,有人把它叫做大数据。

我概述一下过去18个月或者两年当中我在市场上和客户所交流的,还有合作伙伴、分析师、媒体,我们进行讨论,可以不断发展。第一点,我可以肯定你们都同意我们生活在这样一个社会,我们叫做高度互联,这是一个新的术语,来描述这样一种事实。很多人都有这样一种现状,我们在某种形势下是相互连接的,是感知化、互联化的。现在这些方面很多都变成了数据增长的根源,我记得4-5个月之前,在一个类似的活动上,我们推出了PureData的设备和技术时,也涉及到了关于大数据探讨,当时我描述了数据的爆炸,叫做Zetabyte考量办法。现在我们进入到了新的术语的描述,数据爆炸或者是海量的数据,应该是百分之三次方的数量。我们面对数据的爆炸差不多有2.5个Z字节,每天所要所生成的数据,这带来了我们现在把数据看成一种资源,很多人考虑到资源,比如石油、煤炭、天然气、水,当然数据本身已经被看成了最大的资产或者是自然的资源之一,每天都要生成。

这个数据是以2.5个Z字节的速度来发展,我们也看到了一些变化,所有人某种形式上是消费者,是食品、奢侈品、衣服的消费者,每天都要买一些东西。另一方面,这些公司他们提供服务,也提供一些产品。我今天和我母亲探讨过,我告诉她今天我会有这样一个活动,围绕大数据,我觉得很幸福。母亲问我什么是大数据,我给她解释了一下。可以和大家分享的是,当时运行的环境是不一样的,我的母亲一代要买什么东西信息和数据主要来自于厂商或者商店告诉你什么是好的,为什么买这些产品等等,是单向的。而在我们这一代,信息发生了变化,我们去争论这些权利、控制,定义数据,以及信息怎么传播等等,并不只是在厂商那边。我们也听到了消费者的反馈,就是在一个好的服务产品提供上会有一些见解,这是可以分享和非常明确的。

从专业角度来说,昨天我和父母探讨时说到了这些。现在说大数据,对你们来说,在我和客户交流对话或者和业务合作伙伴交流时,有人经常问我,你是来自IBM,我听说IBM是技术、软件、硬件服务商,你们有能力来应对大数据。你对大数据是什么看法,有什么解决办法?我可以肯定,如果我们举手表决,问一下每个人对大数据的定义是什么,我们最起码能得到8—10个不同的定义。现在我形成了一个概念,我碰到了一个问题,或者是进行讨论时把它细分成四大块,我通常可以把问题再踢回去,你问我大数据是什么,大什么意思,或者是数据量多大,还有数据的速度。还有数据的种类,各种各样的,也就意味着80%的数据每天都是来自于非结构化的数据,来自媒体、博客、任何人写的微博、微信来的非结构化数据,是大量的,混合型的数据就是结构。

还有数据是否正确和完整,所以讨论也是非常热的讨论,怎么去定义?到底是什么样类型的数据是属于这样的大数据的?前一张片子看到市场的行为变化,这是另一种方式,叫做双向的。并不是谁拥有这个权利,传播或者广播数据,都是围绕我们在数据上做什么,以及这样一个自然资源怎么应对,这是关键的探讨,我想这是一会儿可以分享的。我们用数据做什么,这样的资源我们做什么,这对我们来说是最主要的问题,我们应该在每一个人头脑当中进行探讨。

现在IBM想在市场上提供一些服务和能力,有些人也参与了其中的研究,一些CEO、CIO的调研,可以分享一下市场的调查情况,这是一个非常有意思的趋势,正在发生着,已经变得非常明显了。可以看到,上一次活动讲这个内容的时候可能还没有这么明显。这张片子所表明的,对机构的领导者们,包括CEO和机构的主管们,在市场上超出了他们的预期,他们把注意力围绕如何使用数据,如何用正确的能力管理数据,他们能够采取行动。这些领导者说目前还是看不到数据的价值所在,所以有这样的趋势,就是相关性,如何把数据和业绩结合起来。

下一页也是我一个后续的工作,我们在市场上进行探讨时要看到相关性成功与否,以及如何使用数据,采用什么样的能力用于数据,数据在企业内部有三个侧重点:一是有合适的能力和技术,可以把它作为决策,帮助你解决问题。会举一个例子给大家看。二是流程和性能改进。我们要花很多时间在内部设法管理相关的业务,有很多流程,IBM是这样一个机构。退一步来看,用A要求来实现某项任务,可能会涉及到一些流程,包括应用的流程,在应用流程上也许B先生、E先生、D先生等等,有一些需要他们来考虑的。在数据和分析能力来说,不同的能力有些领域在这个流程中能够消除或者减少,可以让我们作出决策,正确的或者是否定得更快一些。第二种种类的领导者会想到如何利用充分的数据做到业绩上佳。我们现在不只是带一个终端,现在的趋势是带两个终端,都是在高度互联的世界中产生的。收入或者是带来新的业务模式的机会、销售他们的服务、产品等等,这些都是我在市场上看到的客户的情况,他们如何适应大数据的时代。

我举一个例子,在爱尔兰的都柏林对中国也是有相关性的,有很多项目和探讨,IBM都参与了,包括在北京的一些项目,有很多城市都有交通的问题,我们使用数据和分析,还有分析的工具,我们能够看到,某一天、某一时间,公共交通系统高峰时,早晨有高峰,比如7—9点之间我们要去上班,会有高峰的交通流量。我们还有一些孩子们,父母或者阿姨会坐车把孩子送到学校去。城市的情况还有一些热点,还有一些老的路线,还有五环路等等新的路线并不能利用太多,对于交通公司来说不能优化,要保证有合适的公共汽车运送这些流量,这些都是真实的案例,经常发生在欧洲、爱尔兰,领导者如何把他们可以获得的数据进行决策和优化。

再一类是和流程有关的,说到IBM的产品是怎么做的。举一些例子,包括和外部客户的。这是我们在中国以外的客户,但同时我们有大量的项目,或者是参与活动,也是能够帮助客户们应对他们的问题的,来提升他们的流程。比如在每一个国家、每一个省、每一个城市中的政府,包括保险的索赔等等,我们利用数据分析模式和趋势,保险公司或者政府机构就能够检测出某些索赔是低风险的索赔,某些人群的索赔、某些实体的索赔可能是高风险的索赔,搞清楚可以改善流程,这样一个索赔是很简单的。比如李红焰的索赔是有疑问的,我们要有步骤来调查,并不是骗保的欺诈行为,这都是例子,让我们如何加以应对这些问题。

再就是创造新的机会和收入,这是和我们中国非常相关的。通信部门来说,包括运行的软过去有很多需求,围绕容量、商务智能等等,现在这些客户找到我们说,我们是高度互联的社会,我们要做一些终端,包括做广告,广告还是一个大的创收途径。我们有更加好的明确性,到底终端用户会是谁,在我们做广告时。在数据和分析能力上我们能找出来,比如你是使用iPhone如何接受广告信息。比如你的系统使用的是安卓的,广告也是不同的格式,要有合适格式的广告,Katrina Troughton和吴立东能收到广告,保证有收入。这都是我们真实的案例,大数据、分析能力企业如何转型,帮助他们成为业绩非常出色的公司。这页涉及到了不同行业所做的投入,比如不是和客户直接面对面的行业,比如加工制造业,他们大量加工制造的资产,一些汽车,包括电梯等等,他们某一个具体的资产可能需要维护和保养,如果没有维护和保养可能就会坏掉,会影响业务的发展。所以用数据来进行分析发生了什么情况,有什么样的行为和模式,对公司会有很大的好处。

我们经常会有一个比较现实的探讨,分成几个不同的种类,关于多样性、速度、数据,我们并没有单一的产品,你有大数据的问题我能帮你解决,可能作为横跨不同的部门来讲IBM来提供能力,保证智慧地球正常运行。讲到数据,探讨了和客户在市场上智慧的分析能力。右手边是蓝图,我们怎么参与,包括怎么加强IBM的产品咨询、服务软件,包括服务器、硬件,能够提供这样一些设备,能够让技术提供端到端的解决方案,围绕智慧的分析。举一个例子,叫做预测性资产的优化,基于软件能力开发出针对工业产业部门GPS或者是Cognos的产品,还有社交媒体的分析。能够让我们的用户更好地了解客户的资料,使用安卓或者是黑莓,这些都是不一样的行为方式。还有明确性,能够把服务产品和信息明确转达给客户,还有Smarter Analytics、StoredlQ,这是我们所收购的软件能力,是我们非常有针对性的市场,能够看到数据源,不光是速度,还有StoredIQ,有这样一种能力,能看数据是否是相关的,比如像一些传统的数据已经不再使用了,要把它处理掉,这都是一些公司要利用数据更加有明确性。这是和IBM内部的合作,提供便于使用的快速设置的能力,启动这样一个分析能力。

在我交给下一位演讲者之前,你们得到这样一个信息,我们叫高度互联的信息,包括不断变化的行为方式,这些例子就是围绕着我们如何捕捉这些数据,并不是说这种大数据用这种产品加以解决,远远不只于此,我们有不同的唯独,不同的切入点,不同的方式落地。这就是为什么我们需要和客户交流,如何能实现差异性,通过我们智慧的分析的产品组合,我们希望向市场去提供。

谢谢各位。

主持人:感谢胡世忠先生的精彩致辞。下面有请电子科技大学、互联网中心主任周涛助人为我们带来互联网革命的主题演讲。有请。

周涛:谢谢大家。各位好,首先非常感谢IBM的邀请,也谢谢胡老师精彩的演讲。我今天想说的是,在座的各位都是非常幸运的一代,因为十几年互联网的飞速发展已经彻底改变了我们的社会经济。但是纵观比较三次不同的工业革命,或者是可能的大数据革命,他们都有同样的成败格式之点。这也是今天为什么我们到这一起来看,如果有一个所谓的大数据时代,谁将组成?

在新的一次可能的第三次工业革命中,数据、计算将扮演材料、能源和先进工艺技术这样的角色,如果把计算看成能源,能够允许它像电力一样进入我们的生活流动起来,并以统一的形式收费,我们将来用三步计算、五步计算并不在乎计算从那里来,就像我们不知道今天的五度电是来自大亚湾还是三峡。我们可以想像,在未来云计算以及其他的计算能力将成为一个国家非常至关重要的核心战略之一。可以想像,在中国有可能实现把我们的计算资源或者说单位计算的成本降到比欧美更低,把大的计算放在西北部。通过西电东送的方式,实现把数字的处理和计算成本下降到以往的30%或者20%。

在这种情况下,它可以在很大尺度上改变我们国家的地缘政治。同样,如果我们注意到数据将会作为一种战略材料,我们的每一个企业,科研团队和政府,就有责任通过一些计划,有目的的搜集、处理、分析、索引数据,IBM有智慧地球,也知道我们国家有一些类似的行业计划,包括特定的资源,像金融、电信这些行业,这些数据在未来可能产生现在所想象不到的价值,也需要我们现在的一些企业家、政府部门做好准备。当然,最重要的一点是,相比以前如果回到一两百年以前,一个特别聪明的人可能要几十年的时间才能改变我们的社会经济,但是像扎克博格、比尔盖茨他们五年十年间就彻底改变了我们的观念形态,这种改变背后隐含的第一是切合时代的发展,第二是很强的一种分析动力。我们未来的大数据如果要想作出这样伟大的企业,真正先进的工艺技术就来自于更深入的分析,需要更聪明的头脑,不再等同以前工业革命时期可能我的锻造技术更好,我的轧钢技术更好,或者其他技术更好,而是在于有更聪明的头脑。

当然,大数据时代和以前的工业革命不同的是,它的特征是个性化的,因为现在第一次允许大规模的数据以个人为中心流动起来,所以未来的大数据时代能够不管在1秒还是通过其他手段,能够提供一些真正个性化的服务。站在学术的角度,我首先给大家介绍的是大数据带来科学的革命。以前理解科学总是把数据和理论放在一起,什么叫科学?或者什么叫实政科学,有了数据,有了理论之后,首先对这个现象有一定的理论上的解释,另外有了解释,所以我们可以做预测,由于我的预测进一步验证了我的理论,我才可以最终实现最后的目的,就是人工的干预和控制。但是现在这种科学研究的范式发生了很大的变化,我们看右边,是现在的模式,(见图),实际上只有解释这个环节,既需要数据也需要理论。对于预测和控制这两个环节,理论可能在其中扮演复制作用,也可能不要。所以大数据时代的核心问题将变成预测的问题。事实上任何东西本质上都是可以让我们做预测的,今天看到的很多零售业的服务,比如亚马逊个性化的推荐,本质上是一种缺失的信息预测,可能喜欢这些东西,但我在观察到的数据中看不到,所以我做这样的预测。

我给大家举个例子,应该什么时候在什么地点买什么东西。胡老师说我们在手机上能够更好地进行位置服务,打一个更好的手机广告,也是某种意义上的缺失性信息预测。更好的是我们可以做宏观上的趋势的预测,比如观察到电力的数据,能更早知道零售业和重工业复苏的迹象,就能够比别人更早一步知道我们整个物流的情况,知道未来股市的发展情况,可能更早两步、三步作出趋势预测。可以做的预测还很多,可以做房价预测,还可以预测还款、借贷能力等等,这都将成为大数据应用中最核心的科学问题。

大数据带来的科学上的第二个大的变化是,以往很多在实验室小规模控制的科学问题,一些科学学科,比如社会科学,本质上是定性,现在大数据分析的基础上都会变成定量的科学。举几个例子,以社会科学为例,以前做社会科学大的试验无非是几百人、上千人做问卷,现在我们自己做的问题涉及的都是几千万,甚至超过一个亿的人,比如我们做宗教问题,观察是不是有一些宗教更加有暴力倾向,或者是不是连接很紧密,教派之间是否有排斥,这样大的问题我们可以通过文本分析的方式,通过褒义词、贬义词、情绪词、评论的分析,判断每一个人到底是一个亲善友好的人还是一个刻薄的人,到底是一个情绪平和的人还是一个急躁易怒的人,通过客观分析我们在宏观尺度上研究一个宗教对一个人的改变,以及不同宗教是否有不同倾向。

比如亚文化问题,我们已经可以通过数据来分析出或者说通过线下采访能知道哪些人可能是同性恋人群,这个人群的数目不再像以前的研究中是几十人、一百人,而是有几十万人。这几十万人都有自己的消费购物数据,有手机数据,有和其他人联系的数据,我们事实上可以知道不被主流文化所认可的其他亚文化人群他们有什么独特的社交、独特的行为等等。

在座的很多媒体、企业家所关注的是商业问题,大数据带给我们巨大的理念上的改变,同样它也会带来商业模式的成熟发展甚至革命。我这里给大家举一下大数据在商业上应用的1.0、2.0和3.0版本。大数据的1.0是很好理解的,一个企业自身的业务需求产生大量数据,利用这些数据,通过深入分析,可以优化相关的业务。在这个时候,数据起到了指导决策的作用,举几个例子,比如说沃尔玛,它有大量的会员卡和零售数据,所以通过这些数据可以制定更好的优惠卷和个性化商品推荐服务。也通过这些数据它能够更好地管理产业链、仓储和物流。我们在北京做过一家,是专门做电子商务服务的,拥有2亿多用户的数据和8千万单品的数据,就是怎么样做商品的个性化推荐。利用这些个性化推荐,不仅可以直接做自动化展示,还能够帮助电商更好地编排在网上店铺的摆放等等。豆瓣是全球做社会化推荐最好的一家企业,利用评论数据,也利用点击浏览数据能够做到听其言观其行,利用这些数据可以做到几乎最好已知的社会化推荐,这样的例子还有很多。

还有一家企业,可以把电子化定义拿来做智能的诊断,亚马逊是做个性化推荐的鼻祖,它可以知道几乎你手机上安装的所有应用,事实上它能知道你的消费水平,有没有小孩,有没有车,有没有得什么慢性病,有没有金融支付终端等等,它还知道你在哪个地方,如果是这样一些企业打这样的个性化广告效果会很好。

大数据的2.0和1.0的理念是不一样的,这里强调数据的外延。数据除了从自身的业务产生并解决自身问题以外,我们最终是数据本身有能力解决其他的问题,同样我们也需要有能力去把其他很多其他的数据放在一起解决自身的问题,这就是所谓的数据外部性问题。这里要求企业搜集与目标业务直接或间接关联的大量异质数据。建立复杂的分析和预测模型,产生针对目标业务的输出。这时候数据本身就是决策。为什么这样说?虽然在这种复杂的模型中,我们已经很难看到真正的因果关系,我们并不知道是为什么由A到B,由B到C,但是我们只知道选择A比选择B好,所以数据本身不仅仅是指导决策,而就是决策。举几个例子,比如说Zestfinance是一家很奇怪的信贷公司,可以快速发放小额贷款,所利用的不是平常讲的背景调查等等,而是它分析社交网络以及在其他购物等等频道留下来的你的活动记录,所以他说所有的数据实际对我们来说都是新闻数据,用这种办法来预测还贷能力,计算信用度,最典型的是把其他和你本行业看起来没有直接关联的数据用起来做本行业的事情。

最后想谈的是大数据的3.0,这个时候希望能进入真正的大数据时代。在这里我们对数据的质量价值,数据好不好,有多大价值,如果交换要如何付费。如果别人拷走了你的数据怎么算?还有数据的权益。还有我们特别关心的数据隐私安全等等,我们要有充分的认识。要又可以量化或者可以保障的措施。在这个时候,类似于电信运营商有一种叫做数据运营商会出现,会有很多数据,在上面会有小的科研团队或者创新型企业,也有数据提供商和数据加工商,他们会产生不管是下载还是API接口还是其他的产品,会成为一种单独的产品在上面出售,有自己的分成模式。这个时候会出现一种新的数据客,他们在数据市场中玩粗加工的数据或者是粗加工的数据产品,再产生新的数据产品,以ATI的形式投放到数据市场。就像今天大家在手机市场中,经常有两三个人很聪明的人开发一个很有趣的应用,就有很多的使用。那时候可能有一个很聪明的人,开发和有趣的数据产品,可能很多企业政府科研团队都会使用他们的数据产品。

当然,最重要的是,所有的学术团体、企业和政府,都能够使用到大数据,这就是为什么讲今天叫大数据时代,因为如果只有两三个人,或者七八家企业能够用到大数据这不能叫一个时代,就像十个人上网不能叫互联网时代。所以将来当我们有了大数据之后,我们希望的是未来某一天通过更好的索引,更好的体系结构的支撑,使得普通的科研团队、普通的创业者都能够有办法获取你所想获取的数据里面的一些逻辑片断,我们未来操纵大数据应该是四两拨千斤举重若轻,尽管我看到的是一个很大的数据,但是操作起来就像单机版里面的一个小文件一样,这是我们未来的希望。

总结:大数据从1.0到2.0到3.0,我们提过一个概念,商业模式从2B到2C到2D、2Data,实际上是有两条线在驱动它,一条线我们希望它越来越粗犷、开放,数据一定要开放出来,以共享的心态。一条线我们希望它越来越精深,就是深入地分析。最后我想作为第三方讲讲非商业的东西,大数据也是一把双刃剑,所谓水能载舟亦能覆舟,首先大数据必然会带来隐私方面更隐秘一些,利用手机的Moblie,移动的数据,不需要任何购物数据就能知道你很有可能是不是同性恋,我还能知道你是不是一个腐败分子,还能知道你有没有包二奶,但是同样的技术手段,我们到底是用这个手段来实现更好的商业或者是社会的公正性,还是我们宁愿不用这个手段来保护人们的隐私,这是一个永远的问题。因为这个手段一旦滥用,我们有可能会回到一种很可怕的1984年所描述的独裁、剥削的时代。再就是大数据的应用,比如说它和医疗的数据,下一代的小孩子干细胞的资料都会储存下来,现在的3D打印在细胞层面可以每次喷两到三个细胞,上千的胚体都可以打印出来。这个意义上来讲,有可能某一天我们可能打印出生物,甚至打印出人,现在有人可以打印出枪,当这种大数据的技术泛滥开来,它到底带给我们的是有益的未来还是可怕的未来,这都是需要我们思考的。

最后我想说的是,作为站在时代浪潮巅峰的这一代,既是幸运的,也是有危机感的,我们既有历史的高度,也身临其境,胜利总是青睐有准备的人,什么是准备?我想讲三点:责任、综合、分析。责任是每个企业不仅要盈利,更重要的是大数据带给我们一种可能性,就是企业作为一个有品位的企业,做一些有社会责任的事情,做一些引领型的事情,我觉得这特别应该是IBM做的,当然也正在做。二是大数据不是一个片断,也不是会一个技能,而是综合的,从理念层面到技术,到科学,到管理。三是大数据不是一个浅显的东西,也不是能解决所有问题的万能钥匙,它需要深入、需要分析。谢谢大家。

主持人:谢谢。下面有请IBM全球企业咨询服务部业务分析与优化服务大中华区总经理段仰圣先生为我们带来分析大数据在现实世界中的应用的主题演讲。

段仰圣:各位来宾大家好,很高兴有机会和大家在这个场合见面。今天最主要和大家分享的是IBM在去年的第四季度,在美国发布了大数据在现实世界中的应用,今天的机会非常好,和大家分享一些我们的看法和发现、建议。

如果大家关注上次IBM商业价值研究院在过去一段时间的研究,这是我们又一次和商学院研究的成果,之前和麻省理工学院合作,去年我们和牛津商学院合作,是非常有轰动里的,值得大家看一下,到底在大数据环境下有什么样的内容。我们和1100位大数据业务专业人员与IT专业人员探讨出专业意见,欧洲和北美洲比较多,从工作来讲,业务人员和IT都有参加,所以不只是偏向业务的调查。

有三大部分,通过这三个部分和大家分享一下:一、宏观发现。二、重要发现。三、我们的建议。IBM谈分析洞察从09年到现在快四个年头了,从开始到今天我们看到业界对这个主题越来越重视,大家都非常投入。从2010年大概37%的人认为分析可以带来优势。2012年到了63%,所以大家都非常认可分析对于一个企业竞争力的提升,是有很大帮助的。我们有一个关注点,拉丁美洲、印度、东南亚、澳洲的受访者对相关业务带来的竞争优势的认知程度要高一些,在那个区域来看,他们认为这部分贡献分析带来的贡献竞争优势更大一些。

另外谈一下什么是大数据,这个题目非常有趣,如果大家参与过讨论,一定都能了解到大数据的含义。当我们去问IT人员或者业务人员什么是大数据的时候,他们回答的答案是非常五花八门的。各位可以看到这样一个趋势,比较多的人回答是更广的信息范围,就是说企业的数据也包含在内,还有实时数据之类的。比较有趣的之是,大家认为大数据应该关注社交媒体的数据,事实上大家的反映来看,7%的人认为这是大数据的范围,更多人也认可这是更广的信息范围,新的数据和分析类型。

我们再看一下应用的情况,从去年有智慧的洞察分析到现在快一年的时间,大数据的话题越来越热,各行各业都在谈大数据,我们看到了一个明显的趋势。现在的情况到底是怎么样的,研究发现1/4的企业已经将大数据的应用试点到了十几生产中,各位从图上可以看到,20%的人可以看到,24%还没有这样的活动,所以可以看到,要么是开始关注这个话题,要么是开始积极进行这样的活动。

重要发现:通过今天和大家分享,让大家在未来大数据的应用和发展过程中有一些帮助。有5点:1.客户分析推动大数据举措。2.大数据依赖于可伸缩和可扩展的信息基础设施。大数据需要有一个基础的设施才可以进行。3.最初的大数据举措注重从现有的和新的内部数据中获得洞察力。就是说一开始大数据是从互联网得到数据,我们称为大数据,事实上更多企业是更关注于企业内部的数据。4.大数据需要强大的分析能力。刚才周博士也提到了,大数据不是真的谈三个字,大数据,更大的数据,分析能力非常重要。我想这也是IBM在这个领域中非常独特的差异性,不是强调数据的整合,而是强调我们对数据的分析能力。5.新兴的大数据采用模式注重提供可衡量的业务价值。IBM在谈这些话题的时候,更重视如何产生实际的业务价值。

先看一下大数据的主要目标是通过更深层的理解客户习惯更好地提升客户体验。这是一个普遍性的回答,我们可以看到,49%的回应都是以客户为中心这样的概念去做大数据的研究和应用。比如我们可以看到4%是做业务流程优化,14%是做商业模式创新,所以各位可以发现,大数据应用主题基本上还是针对客户为中心的应用。所以通过大数据的理解,他们希望对客户更深入地认识,知道客户的习惯、喜好,去做更精准的营销,我想这是最明显的应用。

在不同行业中的情况,各位可以看到,如果到行业中就会更明显,比较简单来看,制造业相对来讲客户少,所以对客户的理解不一定那么深,所以比例是比较低的。电信、金融、消费品来看,他们非常重视,还有医药、零售,他们希望在这个领域对客户有更多的认识和了解。大数据在今天来看,这其实也符合我们现在的情况,就是各行各业如果谈到大数据,也都更多希望针对客户这块的了解,希望做更好的分析和应用。

大数据是以信息数据库和可伸缩、可扩展性作为基础的,但是这个部分我们特别谈的是,现在很多业界在谈大数据时其实某种程度上都忽略了大数据信息的管理和安全性,更在乎的是如何把数据拿回来做应用,因为我们看到很多的在市场上的竞争者和客户在谈时,你们可以很容易地应用大数据,这其实可能会对未来应用大数据时造成困扰或者是危险,周博士在讨论中谈到责任和安全,我想其实和这个都是息息相关的。我们看到大数据不仅仅是把数据拿来应用,对信息者的层面来说,基础设施是否可拓展,数据仓库的高容量这些部分我们都看到了,非常重要,而且很多回应者也都告诉我们,这是他们关注的重点。

大数据的数据来源是什么?我和客户谈的时候也在思考,大数据到底该怎么开始做?其实内部的数据就是大数据最好的来源,公司内部的数据是大数据最好的来源,而不是一开始思考公司外部的数据怎么用。我们用互联网上的数据并不代表做大数据时一定要从这边开始。从企业来看,现在有越来越多的企业有很大的挑战,他们对交易数据、日志数据处理、电子邮件的处理是有困难的,是因为他们没有能力购买或者是建制这么大的环境对这么多数据进行储存,大数据恰恰解决了这部分的困难。所以我们会和行业客户沟通,大数据一开始可以先思考内部的数据源做大数据应用的范围。

刚才特别提到了强大的分析能力,这是大数据非常关键的一块。当你有这么多数据的时候,下一个问题就问,你要做什么?想得到什么样的效果和效益?这都是我们会去问的。分析是决定结果的关键因素。没有适合的技术和软件,从大数据中很难获得洞察力和具体行动方案。现在大数据的分析能力还停留在传统的查询和报表,数据挖掘现在也被作为一个比较重要的能力了。数据可视化,我们可以更好地看数据的情况,预测建模和优化。各位可以看到,趋势来看,大家对大数据的分析能力越来越重视,其实有另外一点我们也看到了,大数据其实分析是一部分,对软件人才的需求、对硬件人才的需求,对分析能力的需求其实都是比较全面的,所以它不是很片面的,只要有人可以分析就可以了,还是需要一些软件和硬件的人一起来合作。

大数据的采用阶段。根据不同的阶段,我们把市场的情况大概分了四个阶段,一是教育。我们还是处于教育整个市场的阶段。二是探索。我们探索大数据到底怎么应用。三是接触。就是实际的思考怎么去应用大数据。四是执行。真的把大数据结合在业务流程之内,四个阶段,各位可以看到每一个比例的情况。跟我们现在的理解是接近的,大部分停留在探索阶段,虽然大数据非常火,大部分客户或者是行业客户都是在探索阶段,所以执行部分是6%,相对偏低。

另外是领导职能的转变。大数据一开始谁会关注?不知道大家有没有理解到。其实开始谈大数据的是CIO,因为他看到大数据可以帮他很多忙,希望通过大数据方式做很多事。大数据成功是要得到业务价值的,所以长时间首席执行官、CEO这些他们的角色会越来越重要,各位可以看到,随着大数据在一个企业中的发展,可以看到角色的变换,这是可以看出来的。

 下面谈一下IBM的建议,基于这些发现谈一些建议。五点:1.以客户为中心推动初始举措。大数据的议题虽然非常火热,但是希望有一个中心议题。2.希望能定制一个企业的大蓝图数据。3.从现有数据开始,实现近期目标。4.根据业务有限级逐步建立分析能力。5.基于可衡量的指标制定投资回报分析。

如同一开始谈的,客户分析是大数据开展的一个重要起步点,所以我们建议企业如果要采用大数据的话,先可以思考是以客户分析作为一个重要的切入点。大数据的应用怎么落地,这部分是很好的起步。现在有越来越多企业思考大数据,大数据对一个企业的应用来看到底应该怎么把大数据的结果和企业的架构做结合,要去思考当我得到这样的信息时该做什么样的反馈,其实是要做比较好的思考的。大数据的范围,公司开始如果使用大数据的话,哪些内容应该进行分析,还是漫无目的造成资源的浪费,这部分非常重要。现在有的数据可以让我们在快速掌握大数据的使用提供便利,这是给客户很好的建议,希望客户也朝这个角度思考。过去我们有非常多的数据,像交易数据,每天都有非常多,实际我也没有办法把它留下来,如果可以有这样一个大数据的技术提供给企业客户,可以针对这些数据做更好的分析应用,对企业是有很大帮助的。我们认为一开始可以先从企业数据来进行。我们认为分析能力是技能和工具两块,分析能力很重要,可是工具也很重要。今天我们需要有高端的分析人才,同时也需要很好的分析工具,这和今天的主题是很贴切的,内容除了数据之外,我们对分析能力提的建议也是非常重要的。

我们要预测一下大数据对公司未来的发展影响到底是什么,我们真的能掌握到一些根本应用的影响,比如我们提到三个决策,一是智慧的决策,我们提供做更好决策的资料。二是快速的决策,可以快速作出决策。三是创造奇迹的决策。什么叫创造奇迹的决策?就是可以产生差异化。我们希望公司思考这个问题的时候可以从这三个角度思考,如何更好地去做更高质量的决策,二是快速决策,三是差异化。

最后我想和大家分享一下现在IBM在和国内一些行业拓展大数据领域的一些思考一些内容。国内现在还是在探索阶段,所以很多人关注这个话题,不过实际应用还是有限的。我们可以看到,现在我们和各行各业合作,电信、银行、制造我们都有合作,在这些里面现在讨论的是商业模式创新,电子商务能力等等,结合我们财务一体化、财务核算自动化、资源配置角度来协助各个层面上的应用。最重要的是云化大数据,未来的平台会和云结合非常深入,因为需要大量的运算能力,云化大数据平台将是一个中心。

通过今天内容的分享,我把白皮书给各位做一个简单的报告。谢谢各位。

主持人:谢谢。下面有请IBM软件集团大中华区中间件集团总经理李红焰女士为我们带来改变游戏规则的IBM大数据例证主题演讲。

李红焰:谢谢各位。刚才各位专家都给我们做了很精彩的演讲,周教授给我们谈到了从历史长河来讲,第一次工业革命、第二次工业革命、第三次工业革命,这是一个历史的必然,当我们谈到工业革命的时候也不得不讲,当年瓦特在1770年的时候发明了蒸汽机,但是让蒸汽机这一科技的飞越性发展影响人类时是五十、六十以后,火车出现了,电报出现了,他利用这个技术,真正改变了人类的生活。说回来IT,也是一样的,大家知道,IT真正开始是上个世纪四十年代到五十年代,真正影响我们的生活实际是90年代Internet出现以后,对我们生活颠覆性的影响是不言而喻的。各位媒体和IT也蛮熟了,真正影响IT的影响力在Internet发展以后,IT对社会、对每个人的影响后十年比上世纪所有的总和都高。未来我们会做什么?今天我们说的话题是如何在改变游戏规则,IT如何在改变游戏规则,改变我们的生活。

我相信各位以前经常听到一句话,以事实说话。现在我们经常听到的一句话是以数据说话。我也听到国内有一个CEO跟我讲,除了上帝以外,所有人都需要数据去证明他自己。我相信各位记者,包括我们这些在前端做经营的人,数据对我们的影响力都不言而喻了。现在大家对大数据的理解是什么?有人说数据仓库已经过时了,玩了那么多年。还有说Hadoop是大数据,Web是大数据,我们和它都没有关系。IBM的观点认为是不一样的,(见图),这是什么?我们应该知道,古代的时候,在埃及壁画中我们看到一幅画,这个就是3800年前的大数据,那是当时的一个女巫,她实际在做占卜,她把很多大数据、信息读出了对未来的预测,刻在了墙上,所有的智慧都在她的脑袋里,据说他们还是单传。如何让这种魔力让普通人也拥有呢?今天我们来看社会是什么样。这是国外的例子。

国内的也很多,中国人都知道《易经》,我们在中国农历中有惊蜇,有很多节气,为什么有这么智慧,是影响我们日常生活的,其实是当年已经是大数据得来的结果。我们问大数据在哪儿,在我们身边,我们已经在大数据这辆列车上走了很久了,今天不过是提出来看,如何更好地让它为我们所用。今天我们在讲为什么驾御大数据在今天这么重要?有几个小故事,奥巴马的故事大家都听说过了,他在2012年竞选时,他的团队做了大数据分析,最后得出来说有个叫乔治的电影明星对美国西岸的40—49岁的女性影响力不一般,所以他就把乔治拉来和他一起去了西海岸拉票。这其实就是如何把大数据应用在政治上的政选上。同时我相信大家应该也知道,在我们生活当中淘宝,据说马云曾经有一段时间做了调研分析,做的结果是离海边越远的买家对游泳衣最不在乎价钱是多少,会卖得越贵。后来他对西北部买家实行购买游泳衣免费运送,这样他的游泳衣翻了一倍。这是国内的例子。

再举一个例子,现在在美国最出名的一部戏叫做《纸牌屋》,有个有点像优酷、奇艺的电影网站,大概有3300万用户,对所有点击这个网站的用户进行分析,出来的结果是哪个电影明星最卖座,什么样的情节让他们最开心。最后这个网站请了他分析出来最有影响力的明星,请了他最有影响力的编剧,编了《纸牌屋》,完全是根据分析出来编的。现在在美国大卖,每一集不断更新。现在已经进入到文化了。我们也会问,这是美国的,跟我们有什么关系。在座的各位也看过《泰冏》,大家会很兴奋,给了很多刺激的画面,其实行内的人觉得很没劲,因为《泰冏》的每一个场景,在第几分钟有笑点,第几分钟有泪点,第三十几分钟有高潮,完全是按照好莱坞的定式出来的,所以有了这个剧本。难道它仅仅是对客户剧本的研究吗?它带来的商业价值我相信是毋庸置疑的,就是说大数据的分析是影响我们的生活的,很多人已经在做这么做了,所以我们已经在这部列车上了。

现在我们也在讲,以往的IT更多是对现有企业中的数据作为搜集、整理、管理的工作,基本上形成的是原来老的核心应用系统。现在这些核心应用系统依然是主宰企业IT很重的一笔。如何让这些IT中很重的这一笔,过去的资产发挥出来,由原来纯粹的结构化的东西到现在动态的、多样化的来利用它,同时由原来只是内部的资料到外部的资料,由结构化到非结构化,有很多不一样的。目前IBM在考量的是,这种穿越由过往的IT到未来的IT,我们叫新纪元,IBM是有很大的优势和责任。我们的客户在现在的IT领域当中得到更多价值资源,发掘出来,所以这是IBM在这里扮演的角色。

除了我们技术本身,我们在谈技术,技术是需要建构的,技术的建构是要根据市场需求来的,我们也会问,为什么大数据过去就有,但我们没有那么平民化。今天在说有了足够的数据,更重要我们有了足够的技术来帮我们做这件事情。IBM以此为己任,也在不断构建IBM架构基础。

接下来我和大家分享几个令人信服的大数据例证,国外的比较多。一是大数据探索,我们知道数据本身其实已经存在那儿很久了,数据对于我们来讲,数据不等于Information,information不等于Big Insight,就是说数据本身并不代表它就是信息,原因是在于我们的这些数据本身有重复性,比如说您写一个微博,稍微改几个字就是新的,但内容没有太大的信息。所以这些里面我们会看到有很多垃圾,所以我们在那里面做了一些抽取以后会看到关键信息、关键数据是哪些,当然有了关键信息就有洞察吗?也不行。因为如果说上升到洞察,它需要的是可视、可解读,而且它是可交流、多元的、交互的,那才能谈到洞察。所以当我们谈到现有的每一个企业中的金矿,怎么把过去封存的金矿挖出来,让它能有用,这是我们能看到的例证。(见图)这家航空公司是一个国外的公司,自己会跟别人做军事演习,他的客户以及上下游都会用他们的系统,他有一些系统的使用者对内是8万余员工,对外是4万余员工,他们内部有非常多的CRM,同时还有非常复杂的ACP,还有内部的文件系统,他们的系统不下20个。如何在这么多信息中拿到为他们所用的资料,所以他们也用了一些IBM的技术,InfoSphere等技术,支持他5千名代表同时可以有一个简单的指令,在所有数据中找到和他有关的资料,让他很好地给客户提供服务,时间是15—50分钟,由此节约的是3800万美金,就是一个项目。

第二个,我们现在谈到是以客户为本的,如何对客户有一个360度的全方位的理解,而不是仅仅他和您单向的交流,这点也是我们现在要做的基础。其中有一个最根本的是我们有一个快速消费品行业,他有非常多的方向,也有微博上的信息,Web上的信息,销售商的信息,使用商的信息,现在把信息串在一起,下一步要节约他自己内部的公用资源,更重要的是为他下一步经营市场提供了很多证据。还有运营的分析,当我们在做运营时,如何做分析?这点来讲我相信Cognos、SPSS有很多产品都能帮到我们。一个移动用户,他在做精准营销,同时他也希望精准营销让客户的应用习惯能搜集出来,对他进行额外的销售途径给他。这里用的也是Cognos、SPSS、Unica,我每次讲数据仓库本身,这些背后实现的都是这些产品。

同时我们也在讲,数据仓库的增强。数据仓库本身,过去我们花了很多钱在数据仓库上,这里有两个潮流,过去的潮流是我先把数据仓库建起来,再从里面抽东西。目前来讲,IBM的研究,我们建构的数据仓库以及我们要的Big Insight是我们的用户是怎么用这个数据,以及我们抽取的东西如何让我们有预见性,如何让我们更有智慧的工作为前提的,这时候也有另外一种做法,不一定先建数据仓库,而是先想到我要什么,最后我再来构建我需要的数据。在这里来讲,如何让数据仓库更强?也有一个例子,有一个汽车制造商,也是IBM的例子。今天我和大家讲的例子都是IBM自己的例子,这个客户自己全球所有的供应商,包括过往的历史档案都放在一个库里一起来看。IBM的BigInsight帮他弥补了Hadoop那边的资料的不足,做了一些Linkage,这样可以达到真正让他和世界上最潮流的东西串在一起。

我相信安全毋庸置疑了,在中国用的很多,各位也发微博,突然有一天没有了,这和安全有关。安全的隐患已经不仅仅是说我们的人身安全,包括企业的数据安全,已经是我们最重要的资产,如何去保护它?所以这里也有一些例子,这个厂商是在国外专门做网络监控的,专门给政府提供服务的一个厂商。它也是用各方面的信息,不仅仅是天气,也不仅仅是空气、犯罪,遍布在每个城市中的摄像头,所以信息来源非常多。但最终来讲,它会整合给他的客户提供安全能力。

大客户的最佳实践,刚才讲的白皮书里面所有的东西,包括了IBM亲身经历的例证,所以我们有很多经验的总结。同时我们提供了全面整合的结构、技术上的结构,大家会看到,下面是分两个层次:一是大数据的平台。二是业务分析。这两个是相辅相成、缺一不可,没有这两样东西它可能只是我们讲到的大数据的一个点,它没有结构化、没有面,我们现在希望从端到端给客户很好的解决方案。所以大家会看到,在构架里面我们画了这个图的每一个构架,应用发现,从基础结构到最后的分析、内控、决策,所有的这条线IBM都有相应的解决方案,而且他们之间是无缝结合的,这是从技术上来看。

同时我们也在讲着手实施的建议,在今天白皮书里面,刚才讲了以客户为中心,先从自己开始,怎么再往外面连。二是先从简单的开始,enjoy到那里面对我们的好处,我们如何来做。所以我们都会看到报告都已经给了我们很多具体的做法。还有一个是像周教授讲的,这个报告本身不是对IBM一个产品的推介,更大的是社会责任,更多是我们如何有品位地帮客户实现更多的价值,所以我觉得在这方面来讲,我们也愿意把我们好的研究分享出来,不仅给到客户,也给到对这个感兴趣,以及未来如何很好地利用科技的人。我也讲过我自己身边的例子,春节的时候我妈妈生病了,大家都知道,春节的时候护工都回家了,我在老家做了七天的护工,我24小时在医院呆着。在成都的一个医院,有一天有一个护士进行巡视,跑到我们这边来问,你们最近有没有不满意?我说没有,挺好,因为对护士一定要说好,不然的话会很麻烦。我妈妈隔壁床有一个大姐就说,不行,她是东北人,其实有点像纪检部门的人,她就讲了自己的不满,那天滑雪她撞了头,到了医院以后她说冷,护士就说你冷就回家,你嫌这被子不够就回家。病人非常生气,她说完之后就走了,那个人也走了。我心想惨了,护士长有问题了。结果不一会儿他们院里的院长也来了,护士长也来了,所有人都来了,我在想,为什么?后来才发现,我隔壁床的大姐发了一条微博,微博上写的是某某医院,我在这儿住着,他让我感受不到温暖,我一定会投诉下去,我还号召周围的邻居、周围的朋友都不到这个医院来,她点了这个医院的名字。所有的人就来了,来了之后就坐下来聊天,你会发现一个非常有趣的现象,院长说实在对不起,您知道吗?为了您的微博,我们全院发起了一个遍地的检查,到底是谁?因为大姐的微博主叫“@看见美人都喜欢”,他们根据微博的名字去找男士,一直找不着。直到我旁边这位大姐讲出来了,所以他们很快就做补救,院长真的很真诚,最后大姐也很开心,说要原谅他们。这已经是我想到的一个所谓的网上人才玩的事情,已经影响到了我们的生活。

我为什么在这儿讲这个故事,因为就在我身边,而且会想象不到这个医院不会自己说有一个人来了,我在电脑边,一定是买了某种服务,提到了你来。试想一下,如果我们把这件事情做深入一点,我们去研究我看见美人就喜欢的过去的行为,因为他不断讲我的儿子怎样,因为看出这不是一个男的,是一个女的,会缩短他找到的距离。因为这个女的在房间见人来就把这个事情讲一次,其实已经影响已经不好了,所以能缩短。第二,当我们发掘发现这个问题的人是某个年轻的护士,我们就会联络两年期的护士,定期提前给她做培训,你会看到这件事情可以影响很深远,影响很多事情,如果把我们身边的事情做得更细就更好了。

最后我讲讲刚才周教授提的,科技到底是善还是恶,这是一个永恒的话题。当我们谈到大数据本身的时候,我们也在谈科技到底为了什么?它的善和恶是什么?当我们谈到控制大数据时代来临的时候,我们更希望的是我们去驾御它,同时让它为我所用。我们也相信,我们有很多责任感的公司,在座的各位很多人我们实际是希望大数据科技的来临带给我们更多的是善,带给我们更多是对人类的拥抱。所以这是我们在座的各位一起任重而道远的任务,包括学术界、包括各位。我的报告就到这里。谢谢各位。