扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
来源:ZDNet软件频道【原创】 2013年7月19日
关键字: IBM 大数据 IBM2013技术峰会
ZDNet至顶网软件频道消息:在IBM 2013技术峰会上,牛津大学网络学院互联网治理与监管专业教授、大数据权威咨询顾问、维克托•迈尔-舍恩伯格博士表示,他理解的大数据有三个特点,即全体、混杂和相关关系:全体意味着要去研究和现象有关的所有数据点;混杂意味着不去追求特别的精确性,而去会满足于某种大的方向;相关关系是指对事实的态度更多地从因果关系转向相关关系。
牛津大学网络学院互联网治理与监管专业教授、大数据权威咨询顾问、维克托•迈尔-舍恩伯格博士
维克托博士如是说道,“首先,全体,也就是说要更多地去收集和分析更多的数据。这个数据都是关于我们希望研究的问题的数据,它并不是这个数据点绝对的数字,而是有多少数据点是和我们要研究的现象相关的,如果我们研究的现象只有6000个数据点,抓住6000个数据点就是大数据,因为它抓住了所有数据。通过这种方式我们可以看到这些细节,这些细节在之前随机抽样给不了我们的。第二,混杂,是说接受混杂。在小数据时代我们总试图收集一些非常干净、高质量的数据,我们花很多钱、很多精力来确定这些数据是好数据,是高质量的数据。而在大数据时代,我们就不去追求那种特别的精确性,我们可能会满足于某种大的方向。当我们在宏观上失去了精确性,我们却可以在微观上获得准确性,因为更多和更加混杂,它们相互的加强给我们带来了第三个巨大的转变,可能也是最重要的转变,从因果关系转向相关关系。我们不再从事实中寻求原因,我们不再问为什么,不再寻求一个松散的因果关系。”
维克托博士表示:“网络延伸出的信息风暴通过以预测为核心的活动,创造出不可估量的商业价值。信息风暴促进了大数据及分析等创新技术的应运而生,加速了以数据为核心的企业业务模式的转型,同时也带动了移动、云计算、社交、分析、软件开发等新兴科技的蓬勃发展。”
维克托博士介绍了IBM在加拿大的一项有关早产儿的研究项目,研究者使用的传感器每秒钟会测量1300个数据点,最终产生了十亿级的数据点。IBM把这些混杂的数据放到分析软件中,可以在感染症状出现24小时之前就能预测到,这是非常大的一个飞跃。维克托还介绍了一个有关谷歌的故事:谷歌早期采用了一种蓝色搜索窗口,老板要求设计师从51种蓝色中分析出最适合谷歌的蓝色,后来设计师发现最好的色泽与开始选择的蓝色用裸眼比较是看不出的,但这种微妙区别使最初选择的蓝色会使得谷歌损失200-300亿美元的收入,新蓝色更有点击的诱惑。
在这个大数据时代里谁是胜利者,谁是失败者呢?我们需要知道的是,技术并不意味着成功,或者说规模并不意味着成功。以往说你规模越大越成功,因为有规模经济,而规模经济会带来很大的效益。大数据时代有两个方面的变革,之前这些大规模公司还会继续享有它们的优势,而新公司也可以通过云服务,通过创新精神及敏捷的架构去获得成功。为了在大数据时代获胜,我们需要一个非常有力的工具,需要更好的数据分析架构,以及大数据的思维,以获得更多的洞察力。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者