扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
作者:张琎 来源:ZDNet至顶网软件频道【原创】 2012年6月26日
关键字: 云计算 微软云计算 SQL Server 2012 第四届中国云计算大会 大数据
在本页阅读全文(共3页)
微软资深副总裁张亚勤博士是这样解读大数据的,他认为 过去两年我们所产生的数据是历史的总和,90%的数据是过去两年产生,大量数据是非结构化数据。这里有两类数据增长快,一类是视频,另外是移动互联。增长 速度每年超过100%。IT新的大趋势是海量数据、更加复杂的运行环境、系统和应用。
大数据的三个V特征,一个是数据量越来越大,90% 的数据是过去两年产生的。第二个是速度越来越快,比如证券交易所的大数据系统应用,需要每天做上亿次交易,对系统的延时要求相当高,基本是毫秒级、复杂的 建模和复杂的数据类型。第三个是各种各样的类型数据,过去数据更多是结构化,现在越来越多的数据是半结构,甚至是完全没有结构的数据。数据各种各样,有从 企业来的、从互联网来的、从用户来的,各种各样的数据大量进入我们的服务器,进入处理中心。这样就产生了很多挑战, 这么多数据怎么样变成信息,怎么样把信息变成知识,把知识变成决策,需要更多的很好的一些数据处理能力,这就需要有很强数学背景和统计学背景的数据专职人 员对大量数据处理逻辑分析和结构化的呈现。
微软有多年的大数据处理经验,有成熟的大数据解决方案,这具体包括三个层面。首先是数据管理, 可以对各种不同数据包括来自不同地方、不同大小的数据,都能进行采集和管理,这是第一层次,这里有实时数据,也有非实时的数据。第二层次是数据扩充,怎么 挖掘推荐,怎么转换,怎么分享和控制。第三层次是怎么把数据很好的呈现出来,用好的工具让大家获得更直觉的洞察力。
微软大数据解决方案数 据平台可以接受各种各样的数据,有在物理层次的、有企业的、有传感器的,还有从网络经过爬虫收集的数据。有了这些数据之后,根据数据的不同种类,如果是企 业数据由微软的数据仓库来进行处理。如果这个数据可以到公有云和私有云,可以通过基于Hadoop支持大数据平台,微软有很大的团队专门支持 Hadoop,数据处理之后到商业智能平台,最上面是好的视觉可视化和呈现的工具,包括powerview,用Office可以看到消化这些数据。
大数据遇到一个挑战是Hadoop对于流数据不是特别有效。微软有大量处理并行数据、流数据能力。微软在编程和平台上对Hadoop有很多投入和支持,可以支持各种各样的编程语言,比如JAVA、PHP等。微软大数据平台解决方案不管私有云公有云应该最开放。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者