ZD至顶网软件频道消息: 近年来,由于Hadoop和Spark等技术的出现,“基于关系型数据库的数据仓库是否到了退出历史舞台的时刻”的论调一再被提起。而在酷克数据联合创始人兼CEO简丽荣看来,数据仓库需要的不是退出历史舞台,而是需要进行根本性的变化。
事实上,随着信息技术的迅速发展,各行各业正产生和积累爆炸式的数据。但是,尽管近年来大数据处理相关的工具和产品不断涌现,传统部署模式下的大数据分析软硬件前期投入巨大、实施周期漫长、运维复杂,加上艰难的IT资源规划等原因,导致企业进行大数据分析的门槛依然很高。
基于以上情况,简丽荣认为,云计算的快速发展,特别是云端数据的爆炸式增长,使得数据仓库上云成为大势所趋;同时,云计算平台也为企业解决传统数据仓库面临的挑战提供了坚实的基础。不仅云计算的规模经济和按需收费的模式大大降低了企业的前期投入成本,同时,计算、存储和网络资源的API化使得软硬件近一步融合,让数据仓库系统的自动化运维甚至是智能化运维成为可能。简丽荣更是直言:“云平台几乎无限的资源(对某一个特定系统或应用而言)和弹性属性,将数据仓库的存储资源和计算资源的规划彻底送进了历史博物馆。”
酷克数据联合创始人兼CEO 简丽荣
据了解,作为一家专注于云端数据仓库的初创公司,酷克数据(HashData)通过与青云等基础设施即服务(IaaS)云服务提供商合作,提供完全托管、PB级别的数据仓库即服务。
简丽荣介绍道,HashData数据仓库具有三方面特点:
同时,HashData提供了丰富的分析功能,并通过灵活、高速的数据连接器,实现与云平台其他数据服务的互联互通,有效缓解客户面临的数据孤岛问题。另外,拥抱开源也是HashData的一个特点,消除数据绑架的风险。
当然,说到数据即服务,就不能抛开作为基础的IaaS服务。目前,HashData部署在青云QingCloud IaaS层之上, IaaS层的改进对HashData的性能和功能有着重要影响,而作为国内IaaS创新企业青云的合作伙伴,酷克数据也时刻关注着青云的动向。
本月28日,作为一家以技术见长、立志打造云生态的公司,青云QingCloud将在北京国际饭店举办主题为“科技 · 洞见未来”的QingCloud Insight 2016大会(官网报名:http://insight.qingcloud.com/?bag_track=media)。届时,QingCloud还将公布SDS 2.0、SAN 2.0、NAS 2.0、Container Instance、Native PaaS等2016年度重量级产品和技术,并对IaaS层进行扩展,在支持Virtualization的基础上,新增对Container、Unikernel技术的支持。同时,QingCloud还将携手合作伙伴发布AppCenter 2.0全新云生态应用平台,令构建和使用集群应用更加简单。简丽荣表示:“HashData数据仓库本身也是一个集群应用,因此,我们对App Center 2.0非常期待。”
除此之外,简丽荣也将在大会上分享主题为“云端数据仓库的技术与应用”的演讲,除了数据即服务相较传统数据仓库的优势,简丽荣还认为Hadoop和Spark等大数据技术与以关系型数据库为基础的数据仓库不是你死我活的竞争关系,更多的是互补关系。他表示,每个系统都有自己擅长的应用场景,以统一数据架构的形式在云端共同构建完整的大数据生态系统。
此外,构建健康的云生态是青云举办此次大会的重中之重,随着青云将自己的定位明确为做资源层和平台框架层的调度和管理,它自身提供的服务与其客户的需求中间存在很大空缺,而通过建立自己的云生态,青云和众多合作伙伴,为企业客户构建以业务应用为核心的平台、框架、资源和服务体系,可以满足客户不同层次的需求。
简丽荣表示:“云计算正被越来越多的中国企业接受和使用,同时用户对云平台的需求也从最初的虚拟化资源逐步上升到企业级IT开发工具和完整应用解决方案层面。我个人认为,青云众多的企业客户,在资源层和平台框架层调度和管理方面出众的技术,技术驱动的公司文化,以及拥抱第三方应用开发者的开放心态,是其云生态的优势。从我们自身角度看,青云作为中国云计算市场重要的玩家,有着众多政企和互联网企业客户。加入到青云的云生态,意味着更多潜在的新客户,更大的市场。”
酷克数据公司简介:
酷克数据是一家专注于云端数据仓库的初创公司,由Apache HAWQ(Pivotal开源的SQL-on-Hadoop解决方案)创始团队成员创立。核心团队由来自Pivotal,Teradata,IBM,Yahoo!等公司资深的分布式数据库、云计算和Hadoop专家组成。今年5月份,我们在青云QingCloud上面推出国内第一个基于PostgreSQL和Greenplum Database的SQL-on-Cloud解决方案--HashData数据仓库,一个高性能、完全托管的PB级数据仓库。
好文章,需要你的鼓励
OpenAI CEO描绘了AI温和变革人类生活的愿景,但现实可能更复杂。AI发展将带来真正收益,但也会造成社会错位。随着AI系统日益影响知识获取和信念形成,共同认知基础面临分裂风险。个性化算法加剧信息茧房,民主对话变得困难。我们需要学会在认知群岛化的新地形中智慧生存,建立基于共同责任而非意识形态纯洁性的社区。
杜克大学等机构研究团队通过三种互补方法分析了大语言模型推理过程,发现存在"思维锚点"现象——某些关键句子对整个推理过程具有决定性影响。研究表明,计划生成和错误检查等高层次句子比具体计算步骤更重要,推理模型还进化出专门的注意力机制来跟踪这些关键节点。该发现为AI可解释性和安全性研究提供了新工具和视角。
传统数据中心基础设施虽然对企业至关重要,但也是预算和房地产的重大负担。模块化数据中心正成为强有力的替代方案,解决企业面临的运营、财务和环境复杂性问题。这种模块化方法在印度日益流行,有助于解决环境问题、满足人工智能的电力需求、降低成本并支持新一代分布式应用。相比传统建设需要数年时间,工厂预制的模块化数据中心基础设施可在数周内部署完成。
法国索邦大学团队开发出智能医学文献管理系统Biomed-Enriched,通过AI自动从PubMed数据库中识别和提取高质量临床案例及教育内容。该系统采用两步注释策略,先用大型AI模型评估40万段落质量,再训练小型模型处理全库1.33亿段落。实验显示该方法仅用三分之一训练数据即可达到传统方法效果,为医学AI发展提供了高效可持续的解决方案。