3月24日,星环科技举行2021线上发布会,支持10种主流数据模型的多模数据平台和数据云产品、实现AI建模的全生命周期管理人工智能等产品新版本齐齐亮相。
这些产品融入了星环科技长期在大数据领域积淀的技术能力和服务客户的经验,具有更好的性能、更完善的功能以及更好用和易用,能更全面地满足企业数据存储、管理和分析需求,包括各种复杂的数据类型、各种复杂的应用场景,进而助力用户更快速地向数字化、智能化方向转型。
大数据底座TDH:存算解耦,构建多模数据平台
一站式多模型数据管理平台TDH是星环科技的当家产品,也是公司成立最早推出的产品,从2013年上市以来,今天已经演进到TDH 8.0。每次大版本升级都会带来创新的架构思路和性能升级。和之前的版本相比,新发布TDH 8.0版本真正把多模型数据平台的性能发挥到极致,支持的数据类型达到了10种,存储引擎也达到了8个。
最近几年TDH一直围绕多模数据平台进行探索。据悉,目前在对多模数据类型的支持上有以下技术路线:不同数据类型分别采用不同计算引擎和存储引擎,比如,Oracle;用同样的计算引擎和存储引擎(存储引擎可选,但不能同时)应对所有数据类型,如MySQL;第三种和第一种类似,区别在于,它有一个统一的API接口提供给开发人员,看起来是统一的平台,如Couchbase。而星环的技术路线与前面都不同,它采用不同的存储引擎来分别存储各种不同类型的数据,但采用同一个的计算引擎和同样的数据管理策略。星环科技创始人、CEO孙元浩介绍说,在业界星环科技这条技术路线算是有点特立独行,但有如下好处:
第一,存储和计算解耦后可以根据业务需求单独对存储和计算资源分别进行扩容,从而可以提升资源利用率,如果存储和计算耦合,这是不可能实现的。第二,采用统一的存储可以分别对应多个不同的计算实例,避免数据拷贝,减少数据冗余。第三,统一的计算引擎,让开发人员可以一套代码来处理不同类型数据,降低了开发和运维成本。
“‘合久必分,分久必合’用在数据库产品上也是合适的,过去是不同数据类型用不同数据库,这增加了开发层面和运维成本,对客户并不友好。”孙元浩表示。
他说,技术的发展一定是越来越简洁:使用越来越简单,性能越来越好,体验越来越好。数据库的发展也一定是这样,一定是极简化的,最终数据库能自动全部帮用户搞定:数据扔进来,怎么完成查询不用人管,系统全部自动化,这是大趋势。
随同TDH的升级,星环科技的两款自研的关系型分布式数据库也迎来了最新版:一款是具备多模型、联邦等特性的高性能分析型数据库ArgoDB 3.0,另一款是支持SQL标准语言的交易型分布式数据库KunDB 2.0。ArgoDB和KunDB通过不断的打磨、对业务场景不断的落地实践,已成为具有完全自主知识产权的成熟的国产数据库,能够为更多的客户提供高可靠、高性能、成熟的数据库产品服务。
数据云TDC: 以数据为中心的容器云平台
数据云TDC是星环科技最近几年重点布局的一款产品。早在 2015 年,星环科技就发布了基于云原生技术的云操作系统 Transwarp Cloud Operating System (简称TCOS),为星环科技进军数据云奠定了基础,2018 年星环科技基于 TCOS 发布了数据云TDC 1.0 版本,这也是国内最早推出数据云产品和解决方案的企业之一。到今天推出TDC 2.4版,已经经过了五个大版本的迭代。
数据云TDC主要面向企业私有化场景,以数据为中心,打通了数据 PaaS、分析 PaaS、应用 PaaS 三类 PaaS 能力,底层统一基于容器云平台构建,可帮助企业解决协作数据分析、数据管理混乱、规范应用开发流程、存量应用治理、资源冲突与效率管理的困难与问题。除此之外,星环 TDC 基于云原生技术实现了分布式计算与存储的解耦合,实现计算单元和存储单元的独立弹性伸缩,更好支撑有状态的工作负载,也更能满足企业与日俱增的数据处理与管理需求。
TDC 2.4版本具备五大特性:统一支持多种业务类型的工作负载、云原生调度实现数据与计算局部性、分布式计算执行单元场景化扩缩容、支持GPU 多租户共享调度、支持异构 CPU 和操作系统混合部署。
数据云TDC是星环科技大数据、数据科学、云计算等技术的集大成者。比如,数据云从星环科技的存算解耦技术中受益,从而可以根据具体的业务需求来单独考虑计算集群和存储集群,从而实现灵活部署和动态调度。比如可以根据时间部署来应对潮汐计算的需求,可以根据指标实时进行快速的、高性能的扩展,以满足爆发性计算需求。
有必要指出的是,同为云但数据云与传统云有着重要区别的。比如,传统云是以资源为中心,而数据云是以数据为中心;传统云一般是IaaS,基于虚拟机,数据云是以容器技术为核心,同时也会去兼容虚拟机。另外,传统云是独立管控和烟囱式的架构,而数据云是互通融合,分层架构。
把数据用起来 让价值展现出来
企业的数字化进程一般可以分为建云上云、聚数用数、创智赋智这三个阶段,星环科技的产品和技术主要服务于后面两个阶段,其中上面提到的TDH和TDC的主要用途在“聚数”,把数据汇聚起来,而下面这些产品则是“用数、创智、赋智”,让企业能尽可能地把数据用起来,实现数据辅助决策、数据驱动决策,把数据的价值最大程度地绽放出来。
其中,TDS 2.2是为实现数据全生命周期管理提供的一个一站式数据开发与治理平台。TDS能提供完整的数据开发、数据治理、数据资产管理、数据标签与服务、数据共享与交易等一系列数据全生命周期的处理工具。
与上一代产品相比,TDS 2.2中新增了两个产品:一个是数据质量管理工具 Governor,用于管理数据全生命周期里中可能的数据质量问题;另一个是数据商城 Transwarp Foresight,它整合了 TDS 的数据服务开发工具 Midgard 和标签开发工具 StarViewer,为业务人员提供数据资产的检索、下载、共享的能力,结合着数据血缘帮助数据使用者、开发者和管理者做整体协同,构建其数据运营能力。
随着AI智能技术的不断进步和周边环境(数据、计算资源等)的改善,今天,越来越多企业开始部署AI应用,星环科技的一站式人工智能平台Sophon就是为满足此需求而推出的,它能帮助企业实现AI建模的全生命周期管理。
新发布的星环科技Sophon 2.7 LTS是Sophon 2.X系列的最后一个长期支持(LTS)版本,它提供了企业数据、信息资产和智能设备的全链路AI方案,覆盖AI模型和数据全生命周期,支持从数据导入、数据探索、数据预处理、特征工程、模型训练、性能验证、模型部署、模型管理的全流程,实现AI建模的全生命周期管理。Sophon 2.7 LTS的三大子产品,分别是数据科学平台Sophon Base 2.7 LTS、知识图谱Sophon KG 2.7 LTS,以及边缘计算平台 Sophon Edge 2.7 LTS,性能得以大幅度提升,功能进一步扩展,可靠性持续增强。
除了产品的升级之外,星环科技话还推出了用于大数据和人工智能人才培养的一站式综合实训平台Transwarp University Online(简称TUO)。TUO集理论教学与动手实践为一体的一站式综合实训平台。配套星环大学团队累计超过五年持续打造的丰富课程资源,助力企业、高校快速构建大数据人工智能人才培养体系。
数据价值发展是一个旅程,数据价值能多大程度地得到挖掘和利用,一方面要取决于数据平台和工具;另一方面也取决于技术与应用场景的融合。今天的星环科技正在从这两个方面着手,用其技术和服务能力为用户服务,为其赋智,助其创智。
好文章,需要你的鼓励
施耐德电气以“新质服务+产业向‘新’行”为主题,第六次参会,展示全新升级的“新质服务体系”,围绕创新驱动、生态协同和行业赋能三大核心领域,以全新升级的“新质服务体系”,助力中国产业向高端化、智能化、绿色化迈进。
香港中文大学联合上海AI实验室推出Dispider系统,首次实现AI视频"边看边聊"能力。通过创新的三分式架构设计,将感知、决策、反应功能独立分离,让AI能像人类一样在观看视频过程中进行实时交流,在StreamingBench测试中显著超越现有系统,为教育、娱乐、医疗、安防等领域的视频AI应用开启新可能。
甲骨文正在成为大规模基础设施供应商的可靠选择。该公司通过AI技术推动应用开发,构建GenAI模型并将智能代理集成到应用套件中。CEO萨弗拉·卡茨透露,公司剩余履约义务达4553亿美元,同比增长4.6倍,并预测OCI收入将从2026财年的180亿美元增长至2030财年的1440亿美元。甲骨文正积极布局AI推理市场,凭借其作为全球最大企业私有数据托管方的优势地位,有望在云计算领域实现重大突破。
Atla公司发布Selene Mini,这是一个仅有80亿参数的AI评估模型,却在11个基准测试中全面超越GPT-4o-mini。通过精心的数据筛选和创新训练策略,该模型不仅能准确评判文本质量,还能在医疗、金融等专业领域表现出色。研究团队将模型完全开源,为AI评估技术的普及和发展做出贡献。