数据库巨头Oracle近日推出了Oracle Cloud Infrastructure Generative AI服务,发布的同时推出了各种创新技术,使大型企业能够利用生成式AI技术的最新成果。
这次推出的OCI Generative AI服务是一项全面管理的、云托管的产品,使企业能够利用强大的大型语言模型,例如Meta Platform的开源Llama 2和Cohere的专有算法,并与现有系统进行了集成,这样企业就能够对那些目前由人类执行的很多手动业务流程实施自动化。
据Oracle介绍,OCI Generative AI服务支持100多种语言,针对GPU提供了改进的集群管理体验,以及灵活的微调选项。
Oracle表示,这项新服务通过应用程序编程接口就可以调用这些模型,用于解决文本生成、摘要和语义相似性等任务。客户可以把生成式AI安全地嵌入到他们现有的技术堆栈中,并且带有严格的数据安全和治理协议。
Oracle在去年6月公布了OCI Generative AI服务,将其描述为微软Azure OpenAI服务的替代品,该服务允许客户部署大型语言模型,以对话方式响应人类的提示内容。
尽管Cohere的AI模型和Llama 2众所周知是非常强大的,但对于大多数企业来说并不是那么有用,除非它们可以利用内部数据进行增强和完善。为此,客户可以使用OCI Generative AI Agents服务,该服务允许他们使用自己的数据来增强大型语言模型的能力。
OCI Generative AI Agents目前已经投入Beta测试,它使用检索增强生成技术来微调生成式AI模型,以便模型可以提供更有用的、情境化的响应。该服务提供了对RAG代理的访问,后者利用基于OCI Open Search构建的企业搜索功能来帮助大型语言模型获取最新的信息,为他们的响应和预测提供信息。
尽管初始版本通过OCI OpenSearch支持RAG,但Oracle计划集成更广泛的数据搜索和聚合工具,包括Oracle Database 23c with AI Vector Search以及MySQL HeatWave with Vector Store,还将支持Oracle软件即服务应用套件中的预构建代理操作,包括Oracle Fusion Cloud Applications Suite、Oracle NetSuite和Oracle Cerner。
Oracle表示,OCI Generative AI服务目前已经在Oracle Cloud的多个区域上线了,客户也可以通过Oracle OCI Dedicated Region平台在本地访问。该服务还与Oracle基于云的业务应用组合进行了集成,包括Oracle Enterprise Resource Planning、Human Capital Management、Supply Chain Management以及Customer Experiences应用。此外,Oracle表示,这项生成式AI服务将通过Oracle的Autonomous Database Select AI功能进入到Oracle的数据库产品组合中。
在相关更新中Oracle表示,将对OCI Data Science平台的功能进行扩展,将在下个月的测试版中添加新的AI Quick Actions功能,为无代码访问各种开源大型语言模型铺平道路。该功能将帮助客户从Hugging Face的Transformers或者PyTorch开源库构建、训练、部署和管理大型语言模型。
OCI人工智能和数据管理高级副总裁Greg Pavlik表示,Oracle专注于使用生成式AI来解决现实世界的各种业务用例,并为更多企业采用该技术铺平道路。他说:“为了做到这一点,我们将生成式AI集成到我们的应用和融合数据库中,并提供新的大型语言模型和托管服务,将AI嵌入技术堆栈的所有层中。我们不是提供需要组装的工具包,而是提供一套强大的预构建的生成式AI服务和功能,这些服务和功能相互之间协同工作,帮助客户更智能、更快速地解决业务问题。”
Constellation Research副总裁、首席分析师Andy Thurai认为,这项新服务提供了基于API的访问,这对一些企业来说可能是有吸引力的,因为它在云端和本地环境中都可以访问,这有点不同寻常。不过,该服务也有一些局限性,特别是它只支持Cohere和Meta Llama 2的大型语言模型,而且只针对一小部分用例,例如文本生成和总结。
Thurai表示:“就其整体的生成式AI产品而言,Oracle仍然远远落后于微软、谷歌和亚马逊,这些厂商都提供了更强大的功能和更灵活的部署选项。但是,如果价格合适,和运行在OCI上的ERP、HCM、SCM和CX应用集成的选项,可能会使该产品对于很多企业来说都是有吸引力的。但如果不是的话,AWS则可能会轻松获胜,因为AWS的生成式AI服务目前远远领先于Oracle。”
这项新服务的推出至少应该有助于Oracle成为企业进行生成式AI开发的一个选择。Oracle在努力成为基础设施方面的一个关键参与者,提供对Nvidia最强大GPU的、基于云的访问路径。
好文章,需要你的鼓励
前谷歌资深工程师David Petrou创立的AI初创公司Continua宣布完成800万美元种子轮融资,由GV领投。该公司开发AI智能体技术,可加入SMS、iMessage和Discord等群聊平台,为用户协作提供智能支持。Continua能够在群聊中自动设置提醒、发起投票、添加日历邀请或生成待办清单,解决群聊混乱问题。公司通过微调技术让AI理解群聊动态,具备社交智能,只在需要时提供帮助。
艾伦人工智能研究院开发的MolmoAct是首个开源的机器人空间推理模型,通过"看懂-规划-执行"三步思考法让机器人具备类人的空间理解能力。它不仅在多项基准测试中表现优异,还支持直观的视觉轨迹调教,用户可直接在屏幕上画线指导机器人行为。研究团队完全开源了模型、代码和数据集,为全球机器人研究提供强大基础平台。
Anthropic宣布为企业客户增加Claude单次提示词的信息处理量,以吸引更多开发者使用其AI编程模型。Claude Sonnet 4现支持100万token上下文窗口,可处理75万词或7.5万行代码的请求,是此前限制的5倍,超过OpenAI GPT-5的40万token。该功能也将通过Amazon Bedrock和Google Cloud等云合作伙伴提供。更大的上下文窗口有助于AI模型更好地处理软件工程问题和长期自主编程任务。
这项由北京大学和清华大学联合完成的研究首次提出时间自奖励语言模型,通过"锚定拒绝"和"未来引导选择"策略解决了AI自学习中的梯度消失问题。该方法让AI既能从过去的低水平样本中学习反面教材,又能向未来的高水平样本学习正面目标,成功维持了清晰的学习对比信号,在多个基准测试中显著优于传统自奖励方法。