3月24日,星环科技举行2021线上发布会,支持10种主流数据模型的多模数据平台和数据云产品、实现AI建模的全生命周期管理人工智能等产品新版本齐齐亮相。
这些产品融入了星环科技长期在大数据领域积淀的技术能力和服务客户的经验,具有更好的性能、更完善的功能以及更好用和易用,能更全面地满足企业数据存储、管理和分析需求,包括各种复杂的数据类型、各种复杂的应用场景,进而助力用户更快速地向数字化、智能化方向转型。
大数据底座TDH:存算解耦,构建多模数据平台
一站式多模型数据管理平台TDH是星环科技的当家产品,也是公司成立最早推出的产品,从2013年上市以来,今天已经演进到TDH 8.0。每次大版本升级都会带来创新的架构思路和性能升级。和之前的版本相比,新发布TDH 8.0版本真正把多模型数据平台的性能发挥到极致,支持的数据类型达到了10种,存储引擎也达到了8个。
最近几年TDH一直围绕多模数据平台进行探索。据悉,目前在对多模数据类型的支持上有以下技术路线:不同数据类型分别采用不同计算引擎和存储引擎,比如,Oracle;用同样的计算引擎和存储引擎(存储引擎可选,但不能同时)应对所有数据类型,如MySQL;第三种和第一种类似,区别在于,它有一个统一的API接口提供给开发人员,看起来是统一的平台,如Couchbase。而星环的技术路线与前面都不同,它采用不同的存储引擎来分别存储各种不同类型的数据,但采用同一个的计算引擎和同样的数据管理策略。星环科技创始人、CEO孙元浩介绍说,在业界星环科技这条技术路线算是有点特立独行,但有如下好处:
第一,存储和计算解耦后可以根据业务需求单独对存储和计算资源分别进行扩容,从而可以提升资源利用率,如果存储和计算耦合,这是不可能实现的。第二,采用统一的存储可以分别对应多个不同的计算实例,避免数据拷贝,减少数据冗余。第三,统一的计算引擎,让开发人员可以一套代码来处理不同类型数据,降低了开发和运维成本。
“‘合久必分,分久必合’用在数据库产品上也是合适的,过去是不同数据类型用不同数据库,这增加了开发层面和运维成本,对客户并不友好。”孙元浩表示。
他说,技术的发展一定是越来越简洁:使用越来越简单,性能越来越好,体验越来越好。数据库的发展也一定是这样,一定是极简化的,最终数据库能自动全部帮用户搞定:数据扔进来,怎么完成查询不用人管,系统全部自动化,这是大趋势。
随同TDH的升级,星环科技的两款自研的关系型分布式数据库也迎来了最新版:一款是具备多模型、联邦等特性的高性能分析型数据库ArgoDB 3.0,另一款是支持SQL标准语言的交易型分布式数据库KunDB 2.0。ArgoDB和KunDB通过不断的打磨、对业务场景不断的落地实践,已成为具有完全自主知识产权的成熟的国产数据库,能够为更多的客户提供高可靠、高性能、成熟的数据库产品服务。
数据云TDC: 以数据为中心的容器云平台
数据云TDC是星环科技最近几年重点布局的一款产品。早在 2015 年,星环科技就发布了基于云原生技术的云操作系统 Transwarp Cloud Operating System (简称TCOS),为星环科技进军数据云奠定了基础,2018 年星环科技基于 TCOS 发布了数据云TDC 1.0 版本,这也是国内最早推出数据云产品和解决方案的企业之一。到今天推出TDC 2.4版,已经经过了五个大版本的迭代。
数据云TDC主要面向企业私有化场景,以数据为中心,打通了数据 PaaS、分析 PaaS、应用 PaaS 三类 PaaS 能力,底层统一基于容器云平台构建,可帮助企业解决协作数据分析、数据管理混乱、规范应用开发流程、存量应用治理、资源冲突与效率管理的困难与问题。除此之外,星环 TDC 基于云原生技术实现了分布式计算与存储的解耦合,实现计算单元和存储单元的独立弹性伸缩,更好支撑有状态的工作负载,也更能满足企业与日俱增的数据处理与管理需求。
TDC 2.4版本具备五大特性:统一支持多种业务类型的工作负载、云原生调度实现数据与计算局部性、分布式计算执行单元场景化扩缩容、支持GPU 多租户共享调度、支持异构 CPU 和操作系统混合部署。
数据云TDC是星环科技大数据、数据科学、云计算等技术的集大成者。比如,数据云从星环科技的存算解耦技术中受益,从而可以根据具体的业务需求来单独考虑计算集群和存储集群,从而实现灵活部署和动态调度。比如可以根据时间部署来应对潮汐计算的需求,可以根据指标实时进行快速的、高性能的扩展,以满足爆发性计算需求。
有必要指出的是,同为云但数据云与传统云有着重要区别的。比如,传统云是以资源为中心,而数据云是以数据为中心;传统云一般是IaaS,基于虚拟机,数据云是以容器技术为核心,同时也会去兼容虚拟机。另外,传统云是独立管控和烟囱式的架构,而数据云是互通融合,分层架构。
把数据用起来 让价值展现出来
企业的数字化进程一般可以分为建云上云、聚数用数、创智赋智这三个阶段,星环科技的产品和技术主要服务于后面两个阶段,其中上面提到的TDH和TDC的主要用途在“聚数”,把数据汇聚起来,而下面这些产品则是“用数、创智、赋智”,让企业能尽可能地把数据用起来,实现数据辅助决策、数据驱动决策,把数据的价值最大程度地绽放出来。
其中,TDS 2.2是为实现数据全生命周期管理提供的一个一站式数据开发与治理平台。TDS能提供完整的数据开发、数据治理、数据资产管理、数据标签与服务、数据共享与交易等一系列数据全生命周期的处理工具。
与上一代产品相比,TDS 2.2中新增了两个产品:一个是数据质量管理工具 Governor,用于管理数据全生命周期里中可能的数据质量问题;另一个是数据商城 Transwarp Foresight,它整合了 TDS 的数据服务开发工具 Midgard 和标签开发工具 StarViewer,为业务人员提供数据资产的检索、下载、共享的能力,结合着数据血缘帮助数据使用者、开发者和管理者做整体协同,构建其数据运营能力。
随着AI智能技术的不断进步和周边环境(数据、计算资源等)的改善,今天,越来越多企业开始部署AI应用,星环科技的一站式人工智能平台Sophon就是为满足此需求而推出的,它能帮助企业实现AI建模的全生命周期管理。
新发布的星环科技Sophon 2.7 LTS是Sophon 2.X系列的最后一个长期支持(LTS)版本,它提供了企业数据、信息资产和智能设备的全链路AI方案,覆盖AI模型和数据全生命周期,支持从数据导入、数据探索、数据预处理、特征工程、模型训练、性能验证、模型部署、模型管理的全流程,实现AI建模的全生命周期管理。Sophon 2.7 LTS的三大子产品,分别是数据科学平台Sophon Base 2.7 LTS、知识图谱Sophon KG 2.7 LTS,以及边缘计算平台 Sophon Edge 2.7 LTS,性能得以大幅度提升,功能进一步扩展,可靠性持续增强。
除了产品的升级之外,星环科技话还推出了用于大数据和人工智能人才培养的一站式综合实训平台Transwarp University Online(简称TUO)。TUO集理论教学与动手实践为一体的一站式综合实训平台。配套星环大学团队累计超过五年持续打造的丰富课程资源,助力企业、高校快速构建大数据人工智能人才培养体系。
数据价值发展是一个旅程,数据价值能多大程度地得到挖掘和利用,一方面要取决于数据平台和工具;另一方面也取决于技术与应用场景的融合。今天的星环科技正在从这两个方面着手,用其技术和服务能力为用户服务,为其赋智,助其创智。
好文章,需要你的鼓励
OpenAI在最新博客中首次承认,其AI安全防护在长时间对话中可能失效。该公司指出,相比短对话,长对话中的安全训练机制可能会退化,用户更容易通过改变措辞或分散话题来绕过检测。这一问题不仅影响OpenAI,也是所有大语言模型面临的技术挑战。目前OpenAI正在研究加强长对话中的安全防护措施。
北航团队推出VoxHammer技术,实现3D模型的精确局部编辑,如同3D版Photoshop。该方法直接在3D空间操作,通过逆向追踪和特征替换确保编辑精度,在保持未修改区域完全一致的同时实现高质量局部修改。研究还创建了Edit3D-Bench评估数据集,为3D编辑领域建立新标准,展现出在游戏开发、影视制作等领域的巨大应用潜力。
谷歌宣布计划到2026年底在弗吉尼亚州投资90亿美元,重点发展云计算和AI基础设施。投资包括在里士满南部切斯特菲尔德县建设新数据中心,扩建现有设施,并为当地居民提供教育和职业发展项目。弗吉尼亚州长表示这项投资是对该州AI经济领导地位的有力认可。此次投资是谷歌北美扩张战略的一部分。
宾夕法尼亚大学研究团队开发出PIXIE系统,这是首个能够仅通过视觉就快速准确预测三维物体完整物理属性的AI系统。该技术将传统需要数小时的物理参数预测缩短至2秒,准确率提升高达4.39倍,并能零样本泛化到真实场景。研究团队还构建了包含1624个标注物体的PIXIEVERSE数据集,为相关技术发展奠定了重要基础,在游戏开发、机器人控制等领域具有广阔应用前景。