数据库巨头Oracle近日推出了Oracle Cloud Infrastructure Generative AI服务,发布的同时推出了各种创新技术,使大型企业能够利用生成式AI技术的最新成果。
这次推出的OCI Generative AI服务是一项全面管理的、云托管的产品,使企业能够利用强大的大型语言模型,例如Meta Platform的开源Llama 2和Cohere的专有算法,并与现有系统进行了集成,这样企业就能够对那些目前由人类执行的很多手动业务流程实施自动化。
据Oracle介绍,OCI Generative AI服务支持100多种语言,针对GPU提供了改进的集群管理体验,以及灵活的微调选项。
Oracle表示,这项新服务通过应用程序编程接口就可以调用这些模型,用于解决文本生成、摘要和语义相似性等任务。客户可以把生成式AI安全地嵌入到他们现有的技术堆栈中,并且带有严格的数据安全和治理协议。
Oracle在去年6月公布了OCI Generative AI服务,将其描述为微软Azure OpenAI服务的替代品,该服务允许客户部署大型语言模型,以对话方式响应人类的提示内容。
尽管Cohere的AI模型和Llama 2众所周知是非常强大的,但对于大多数企业来说并不是那么有用,除非它们可以利用内部数据进行增强和完善。为此,客户可以使用OCI Generative AI Agents服务,该服务允许他们使用自己的数据来增强大型语言模型的能力。
OCI Generative AI Agents目前已经投入Beta测试,它使用检索增强生成技术来微调生成式AI模型,以便模型可以提供更有用的、情境化的响应。该服务提供了对RAG代理的访问,后者利用基于OCI Open Search构建的企业搜索功能来帮助大型语言模型获取最新的信息,为他们的响应和预测提供信息。
尽管初始版本通过OCI OpenSearch支持RAG,但Oracle计划集成更广泛的数据搜索和聚合工具,包括Oracle Database 23c with AI Vector Search以及MySQL HeatWave with Vector Store,还将支持Oracle软件即服务应用套件中的预构建代理操作,包括Oracle Fusion Cloud Applications Suite、Oracle NetSuite和Oracle Cerner。
Oracle表示,OCI Generative AI服务目前已经在Oracle Cloud的多个区域上线了,客户也可以通过Oracle OCI Dedicated Region平台在本地访问。该服务还与Oracle基于云的业务应用组合进行了集成,包括Oracle Enterprise Resource Planning、Human Capital Management、Supply Chain Management以及Customer Experiences应用。此外,Oracle表示,这项生成式AI服务将通过Oracle的Autonomous Database Select AI功能进入到Oracle的数据库产品组合中。
在相关更新中Oracle表示,将对OCI Data Science平台的功能进行扩展,将在下个月的测试版中添加新的AI Quick Actions功能,为无代码访问各种开源大型语言模型铺平道路。该功能将帮助客户从Hugging Face的Transformers或者PyTorch开源库构建、训练、部署和管理大型语言模型。
OCI人工智能和数据管理高级副总裁Greg Pavlik表示,Oracle专注于使用生成式AI来解决现实世界的各种业务用例,并为更多企业采用该技术铺平道路。他说:“为了做到这一点,我们将生成式AI集成到我们的应用和融合数据库中,并提供新的大型语言模型和托管服务,将AI嵌入技术堆栈的所有层中。我们不是提供需要组装的工具包,而是提供一套强大的预构建的生成式AI服务和功能,这些服务和功能相互之间协同工作,帮助客户更智能、更快速地解决业务问题。”
Constellation Research副总裁、首席分析师Andy Thurai认为,这项新服务提供了基于API的访问,这对一些企业来说可能是有吸引力的,因为它在云端和本地环境中都可以访问,这有点不同寻常。不过,该服务也有一些局限性,特别是它只支持Cohere和Meta Llama 2的大型语言模型,而且只针对一小部分用例,例如文本生成和总结。
Thurai表示:“就其整体的生成式AI产品而言,Oracle仍然远远落后于微软、谷歌和亚马逊,这些厂商都提供了更强大的功能和更灵活的部署选项。但是,如果价格合适,和运行在OCI上的ERP、HCM、SCM和CX应用集成的选项,可能会使该产品对于很多企业来说都是有吸引力的。但如果不是的话,AWS则可能会轻松获胜,因为AWS的生成式AI服务目前远远领先于Oracle。”
这项新服务的推出至少应该有助于Oracle成为企业进行生成式AI开发的一个选择。Oracle在努力成为基础设施方面的一个关键参与者,提供对Nvidia最强大GPU的、基于云的访问路径。
好文章,需要你的鼓励
铠侠正在测试最新的UFS v4.1嵌入式闪存芯片,专为智能手机和平板电脑设计,可提供更快的下载速度和更流畅的设备端AI应用性能。该芯片采用218层TLC 3D NAND技术,提供256GB、512GB和1TB容量选择。相比v4.0产品,随机写入性能提升约30%,随机读取性能提升35-45%,同时功耗效率改善15-20%。新标准还增加了主机发起碎片整理、增强异常处理等功能特性。
上海AI实验室团队提出创新的异步拍摄方案,仅用普通相机就能实现高速4D重建。该方法通过错开相机启动时间将有效帧率从25FPS提升至100-200FPS,并结合视频扩散模型修复稀疏视角导致的重建伪影。实验结果显示,新方法在处理快速运动场景时显著优于现有技术,为低成本高质量4D内容创作开辟新路径。
谷歌在伦敦云峰会上发布Firebase Studio更新,新增Gemini命令行界面集成、模型上下文协议支持和"代理模式"。代理模式提供三种AI协作层次:对话式"询问"模式用于头脑风暴,人机协作代理需开发者确认代码变更,以及几乎完全自主的代理模式。尽管谷歌声称已有数百万应用使用该平台,但目前仍需精心设计提示词,非工程师用户还无法直接创建成熟应用。
上海AI实验室联手复旦大学提出了POLAR方法,这是一种革命性的奖励模型训练技术。通过让AI学会识别不同策略间的差异而非死记评分标准,POLAR在多项任务上实现了显著提升,7B参数模型超越72B现有最强基线,为AI对齐问题提供了全新解决思路。