科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航



ZDNet>软件频道>数据库-zhiding>直面大数据 强化云管理

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

云计算与大数据越来越密不可分,云计算的到来,也开启了大数据时代。在大数据时代,企业的IT管理面临着前所未有的挑战。如何建立智能化的数据平台,在提高数据响应效率的同时把应用做到极致,愈发成为人们关注的焦点。

来源:ZDNet至顶网软件频道 2012年06月26日

关键字:大数据 第四届中国云计算大会 SQL Server 2012 微软云计算 云计算

至顶网软件频道 (文/张琎) 云计算与大数据越来越密不可分,云计算的到来,也开启了大数据时代。在大数据时代,企业的IT管理面临着前所未有的挑战。如何建立智能化的数据平台,在提高数据响应效率的同时把应用做到极致,愈发成为人们关注的焦点。同时,无论是邮件服务中心、计算能力多租赁中心和数据管理中心等都必须考虑特定环境下大数据处理问题。

根据世界著名咨询公司Gartner 2011年研究统计,全世界数据增长了40%。未来10年全世界的数据量将是现在的44倍,其中有85%的数据来自新的数据类型。大数据目前处于兴起上升期,云计算处于兴旺期,这也从侧面印证了云计算推动了大数据的发展。
直面大数据 强化云管理
中国电子学会云计算专委会主任委员、中国工程院院士李德毅院士认为,自2007年人们发现大数据之后,传统的数据库、数据仓库技术在大数据面前遇到了前所未有的挑战。首先从数据量看,一般来说数据库或者数据仓库都在GB量级或者到TB,大数据在TB或者PB量级,这是数据量不同,严格讲量级不是决定问题的根本。更重要的是把所有信息放进数据仓库里的数据要求是比较高质量和干净的数据,而我们生活中的数据多数是有噪音的混沌的状态,这点传统的数据库技术难以承受。
直面大数据 强化云管理
通过数据模型比较,数据库和数据仓库属于强机构,而大数据是属于非结构,大数据中人们更多关心是视频数据、声音数据、图片图像数据,不是纯数据。如果说我们要把数据放到数据库里需要一个池,我们研究数据管理的时候像挖池子,挖好了池子把鱼放进去,这是传统的数据库思想。现在我们不可能先挖池子,我们面临的是海量数据,在数据库技术中我们比较重视交易活动。而大数据时代我们关心的是人与数据交互,即通信。对于数据库而言,我们希望得到一个确定解,对于大数据需要不确定解,需要满意解,大数据对人们提出挑战也是对传统数据库技术提出挑战。

微软资深副总裁张亚勤博士是这样解读大数据的,他认为 过去两年我们所产生的数据是历史的总和,90%的数据是过去两年产生,大量数据是非结构化数据。这里有两类数据增长快,一类是视频,另外是移动互联。增长 速度每年超过100%。IT新的大趋势是海量数据、更加复杂的运行环境、系统和应用。
直面大数据 强化云管理
大数据的三个V特征,一个是数据量越来越大,90% 的数据是过去两年产生的。第二个是速度越来越快,比如证券交易所的大数据系统应用,需要每天做上亿次交易,对系统的延时要求相当高,基本是毫秒级、复杂的 建模和复杂的数据类型。第三个是各种各样的类型数据,过去数据更多是结构化,现在越来越多的数据是半结构,甚至是完全没有结构的数据。数据各种各样,有从 企业来的、从互联网来的、从用户来的,各种各样的数据大量进入我们的服务器,进入处理中心。这样就产生了很多挑战, 这么多数据怎么样变成信息,怎么样把信息变成知识,把知识变成决策,需要更多的很好的一些数据处理能力,这就需要有很强数学背景和统计学背景的数据专职人 员对大量数据处理逻辑分析和结构化的呈现。

微软有多年的大数据处理经验,有成熟的大数据解决方案,这具体包括三个层面。首先是数据管理, 可以对各种不同数据包括来自不同地方、不同大小的数据,都能进行采集和管理,这是第一层次,这里有实时数据,也有非实时的数据。第二层次是数据扩充,怎么 挖掘推荐,怎么转换,怎么分享和控制。第三层次是怎么把数据很好的呈现出来,用好的工具让大家获得更直觉的洞察力。
直面大数据 强化云管理
微软大数据解决方案数 据平台可以接受各种各样的数据,有在物理层次的、有企业的、有传感器的,还有从网络经过爬虫收集的数据。有了这些数据之后,根据数据的不同种类,如果是企 业数据由微软的数据仓库来进行处理。如果这个数据可以到公有云和私有云,可以通过基于Hadoop支持大数据平台,微软有很大的团队专门支持 Hadoop,数据处理之后到商业智能平台,最上面是好的视觉可视化和呈现的工具,包括powerview,用Office可以看到消化这些数据。
直面大数据 强化云管理
大数据遇到一个挑战是Hadoop对于流数据不是特别有效。微软有大量处理并行数据、流数据能力。微软在编程和平台上对Hadoop有很多投入和支持,可以支持各种各样的编程语言,比如JAVA、PHP等。微软大数据平台解决方案不管私有云公有云应该最开放。

SQL Server 2012与大数据

作为新一代的数据平台产品,SQL Server 2012 不仅延续现有数据平台的强大能力,全面支持云技术与平台,并且能够快速构建相应的解决方案实现私有云与公有云之间数据的扩展与应用的迁移。

大 数据时代,对非结构性数据,或者说在 NoSQL数据基础上,可以对各个数据做分析的工具几乎没有,SQL Server 2012的出现,填补了这个空白。SQL Server 2012可以将结构性数据和非结构性数据作为数据服务提供给用户,从而可以帮助客户从大数据当中挖掘出相应的商业价值。

SQL Server 2012通过Hadoop组件搭建成的Isotope集群,与传统的Hadoop集群相比有三大优势。第一,前者与微软Window Server紧密集成并性能优化;其次,Isotope集群能很好地与企业的安全系统、认证系统进行整合。第三,能够与微软传统的BI(业务分析)工具进 行很好的整合。

SQL Server 2012通过Power View可以让用户非常快速地更改已有的数据模型,或者建立新数据模型,从而做很多数据分析,甚至也可以让用户做分析模型,可以和其他用户或者部门来分 享。微软推出的数据模型,不仅是一个多维度的模型,还包括对整个数据模型的理解,是一个通用的数据模型、分析模型。
 直面大数据 强化云管理
SQL Server2012可以通过StreamInsight(复杂试探处理引擎)组件将非结构化数据源有效引入。StreamInsight的前端是一个内 存处理引擎,其上有一系列可定制的输入适配器,可以把触感器、感知器的流水型的数据,甚至图片等不同的事态源通过适配器把事态转变成标准的 事件模式,然后导入到内存处理引擎。StreamInsight的后端有一个导出适配器,当处理引擎处理完事态之后,在符合处理规则的条件下,就会通过导 出适配器推送出一个事件。例如,推送到实时更新的Silverlight前端的一个网站,或者推送进一个数据库,或者是一个预警装置、一个邮件的门户,它的核心引擎规则的处理是用标准的语言进行连接。

推广二维码
邮件订阅

如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

重磅专题