IBM正在与微软合作,向想要部署生成式AI和改进业务流程的企业提供IBM的专业知识。
这次公告主要是围绕IBM Consulting的,正在为那些试图在Azure云平台上使用微软Azure OpenAI服务的公司提供专门的服务,用户可以通过Azure Marketplace找到新的IBM Consulting Azure OpenAI Service产品。
IBM表示,这是一项完全托管的AI服务,专注于帮助开发人员和数据科学家使用OpenAI强大的大型语言模型来构建新型应用。通过该服务,开发人员可以访问OpenAI所有的大型语言模型,包括为ChatGPT提供支持的GPT系列和Codex LLM。
IBM表示,该服务可以帮助公司定义生成式AI的采用策略,然后开始创建更具体的生成式AI应用,而且IBM已经与微软合作开发了许多针对一些非常具体用例的生成式AI应用。
例如,IBM开发了一个采购和来源支付应用,将Azure Open AI Service与Microsoft Power平台相结合,以对寻源和采购等手动和分散流程实施自动化。IBM表示,这一切都是为了提高运营效率、节省时间、为客户创造可行的洞察。
另外一个IBM针对的明显用例是摘要和内容生成,创建可以高效处理和总结财务报告等的应用。
第三个应用旨在简化医疗流程。IBM Consulting解释了他们是如何使用Azure OpenAI Service构建一个平台,平台可以自动提取和分析医疗记录和政策文档,以自动执行事先授权的流程。同时,IBM为护士和医生开发了虚拟助理,使他们更容易访问患者的医疗记录。
最后,IBM提供了企业搜索和知识库体验,旨在满足公司员工的需求。在许多组织中,员工信息是分散且孤立的,这使得员工很难找到他们想要的信息。因此,IBM创建了一个知识提取工具,能够从多个知识库检索所请求的信息,从而减少手动搜索的时间。
Constellation Research分析师Holger Mueller表示,大多数公司都了解了生成式AI的潜力,但许多公司还在努力制定适当的战略,因为他们在这方面不具备足够的专业知识。因此,IBM的服务对他们来说可能是非常有价值的。他说:“IBM带来了很多东西,包括在平台方面提供帮助的AI服务,这不仅可以帮助企业创建AI应用和服务,还可以从这些项目中创造收入。”
Pund-IT分析师Charles King认为,这次的公告说明IBM强化了对多云合作伙伴及其解决方案的支持。他表示:“IBM和微软与数千家企业客户展开合作,因此支持微软的生成式AI产品和战略是非常有意义的。除此之外,IBM是业界最有经验的人工智能企业解决方案供应商之一。当微软推出自己的人工智能服务时,很难想象还有比这更好的公司来合作了。”
在Azure OpenAI咨询服务推出之前,IBM Consulting已经投入了巨资,专注于围绕最先进的生成式AI平台对他们的顾问进行培训。今年早些时候,IBM Consulting宣布成立一个新的生成式AI卓越中心,有1000多名顾问,随时准备提供专业知识来帮助企业客户。
除了这个卓越中心之外,IBM最近还发布了watsonx工具,供开发人员开始构建生成式AI应用。watsonx系列与IBM更有名的Watson AI服务不同,后者更专注于分析和处理数据。
IBM还通过watsonx支持其他生成式AI模型例如Meta Platforms的开源LlaMA 2 LLM,这意味着企业不仅限于使用OpenAI的模型。
好文章,需要你的鼓励
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。
这项由中国人民大学高瓴人工智能学院研究团队发表的研究解决了大语言模型评判中的自我偏好问题。研究提出了DBG分数,通过比较模型给自身回答的分数与黄金判断的差异来测量偏好度,有效分离了回答质量与自我偏好偏差。实验发现,预训练和后训练模型都存在自我偏好,但大模型比小模型偏好度更低;调整回答风格和使用相同数据训练不同模型可减轻偏好。研究还从注意力分析角度揭示了自我偏好的潜在机制,为提高AI评判客观性提供了重要指导。
这篇研究提出了DenseDPO,一种改进视频生成模型的新方法,通过三大创新解决了传统方法中的"静态偏好"问题:使用结构相似的视频对进行比较,采集细粒度的时序偏好标注,并利用现有视觉语言模型自动标注。实验表明,DenseDPO不仅保留了视频的动态性,还在视觉质量方面与传统方法相当,同时大大提高了数据效率。这项技术有望推动AI生成更加自然、动态的视频内容。