AIGC时代带给PingCAP创始人兼CEO刘奇最大的两个思考是代码和数据。
在过去一段时间,大家都不自觉的变成了程序员。刘奇说,今天我们用生成式AI做总结、写文章、生成图片,这些工作在之前都是需要用程序来完成,而在今天我们只要向AI提出需求就等于完成了编程工作。
短短7个月间,GitHub上面新增的原代码已经有超过46%是由AI生成,如果从软件开发效率的角度去看,AI已经完成了差不多一半的人类工作。
现在只要用自然语言描述就能得到想要的结果,还能用图表展示。“消费数据的门槛降低,意味着只要能连接上电脑与AI交互就可以消费数据,所以在接下来几年中数据将成十倍到百倍规模增长。”刘奇认为,这个增速对数据库是一个巨大的挑战。
刘奇过去一段时间最大的感受是,当我们大量应用AI的时候,在快速变化的时候,我们都做出了最直观的选择,那就是拥抱先进性的技术。PingCAP的客户都在讨论成本和效率,这在现在的经济环境下已经成为所有人的共同选择,而TiDB要做到的就是帮助客户的更好的关注业务创新,做到降本增效。
AIGC时代带给PingCAP创始人兼CEO刘奇
打造世界级产品
TiDB的发展分为几个段落,稳定性的提升、性能的提升、应用性的提升、工具的提升等。刘奇说,我们还需要有比较好的演进策略和分层架构设计。
过去一年PingCAP投入了大量资源解决规模化场景下稳定性和性能问题。PingCAP 研发副总裁唐刘介绍,在TiDB 7系列版本中,在线DDL性能提升10倍以上,OOM降低99%,50TB数据导入从天缩减到小时级,数据同步输出延迟低至秒级。
而且中国用户也迎来了专属福利“平凯数据库?”的发布,随着TiDB逐步进入中国用户的核心场景以及TiDB规模化进入国产化生态,PingCAP联合创始人崔秋发布了面向中国企业级用户的“平凯数据库?”。
平凯数据库基于TiDB Open Core提供增强型企业级功能,提升国产化需求的收集、研发和交付速度,提供更多元的企业级服务支持方案,以更完善的国产化生态降低中国用户升级数据基础设施的成本和复杂性。
刘奇说,从第一天开始TiDB就致力于成为一款全球化的数据库,但是从第一天开始我们就相信中国用户一直是我们持续不断创新的核心发动机。据统计,最新版本里仍有50%的需求来自中国用户,70%的外部贡献来自中国,PingCAP也希望携手中国用户,打造世界级产品。
对于PingCAP的中国战略,PingCAP副总裁陈煜琦表示,PingCAP 致力于构建“行业x区域x生态”的客户成功体系,协同生态合作伙伴为中国客户提供更贴近行业场景的解决方案,实现更具时效性的服务支持联动。
面向未来数据库
几年前,刘奇和PingCAP另一位联合创始人兼CTO黄东旭有过探讨,为全球开发者提供一个免费并且做到实时在线,拥有开放生态能够和消费端更好对接的数据库,到底应该是什么架构。他们的结论出奇一致,这个数据库必须是云原生架构。
PingCAP 联合创始人兼 CTO 黄东旭
现在TiDB Cloud Serverless完成了PingCAP人的一个梦想,有能力为全球开发者提供一个免费的数据库。
黄东旭说,如果用TiDB原有架构搬到云上,支撑这个想法成本是不可想象的,所以设计TiDB Cloud Serverless时,他当时定下了几个规范,其中一条就是做数据库的服务化,而不是服务化的数据库。
这应该如何理解?传统的云数据库首先需要云管平台,为每个租户部署一套TiDB,但是TiDB Cloud Serverless有三个新,第一换了新的云原生引擎Cloud-native Storage Engine (CSE) 架构,第二引入逻辑上的Key Space,第三资源管控技术(Resource Control)、资源组配置用量 (RU)实现从上到下做全局流控。
TiDB Cloud Serverless实现了无需资源规划、秒级启动、0 元起步、按使用付费、极致弹性的数据库服务,产品上线后的几个月时间便吸引了 10,000 多个活跃用户。
这也给很多客户提出能否支持多租户作出了回答。关于TiDB Cloud Serverless黄东旭强调了三点,第一,TiDB Cloud Serverless在设计时考虑了系统的可以执行,未来也可以在私有环境里部署;第二,数据库的最前沿发展方向就是云原生和极致弹性,要进一步思考数据库本身底层架构的变革;第三,Serverless是很好的练兵场,目前已经实现了上万用户的打磨,很快会在企业版和云上托管版本里落地。
好文章,需要你的鼓励
亚马逊发布Lens Live AI功能,用户可通过手机摄像头扫描任何物品进行实时购物。该技术利用人工智能识别用户拍摄的物品,并在亚马逊平台上匹配相关商品,提供即时购买选项。这一创新功能将大幅简化购物流程,用户只需"看到即可购买",为在线购物体验带来革命性改变。
巴黎理工学院研究团队发现了比传统深度伪造更隐蔽的"局部伪造"技术威胁。这种只修改视频局部区域的新型AI造假技术让人类检测准确率下降30%以上,AI检测系统性能下降高达43%。研究团队构建了包含25000个样本的全球首个局部伪造检测数据库FakePartsBench,揭示了现有防御体系面对精细化伪造攻击的脆弱性,为未来开发更强大的检测技术奠定重要基础。
谷歌AI研究助手NotebookLM宣布推出三种全新音频摘要格式:简要、评论和辩论模式。这一更新将为用户提供更多选择,让已经备受欢迎的音频概览功能更加丰富多样。简要模式提供1-2分钟的精简概述,评论模式对材料进行建设性反馈,辩论模式则让两个AI主持人就内容展开深入讨论。这些新格式有助于用户从不同角度理解学习材料,使NotebookLM成为更加细致入微的学习工具。
Meta等机构研究发现,让大语言模型学会使用外部工具比死记硬背所有知识更高效。研究通过数学证明和实验验证,传统的参数记忆存在严格容量限制,而工具学习能实现无限扩展且不损害原有能力。这为AI发展提供了新思路:从堆叠参数转向构建智能工具协作系统。