ZDNet至顶网软件频道消息:微软在本月早些时候发布了一项名为Azure机器学习的最新云服务预览,一些合作伙伴已经利用该服务构建某些高成本且在过去只能由数据科学家团队才能涉足的应用。
商业智能技术是对数据进行处理分析,了解过去发生了什么,而机器学习(也被称为预测分析)则是通过分析历史数据来预测未来会发生什么。
Azure机器学习服务是一项基于公有云的服务,让开发者们能够将预测分析嵌入他们的应用之中,微软云及企业群组副总裁Joseph Sirosh表示。
虽然机器学习软件已经问世有几年时间了,但是并不易于使用或者部署,而且非常昂贵。微软通过将机器学习即云服务打包来解决这些问题,并且首次将其推向市场,以此抗衡Google、Amazon和IBM等竞争对手。Sirosh表示:“我认为,在这个特殊的市场领域,我们是领导者。”
而对于微软来说,将Sirosh招致麾下给公司来了一项变革。他在去年7月从Amazon加入微软,他曾经在Amazon工作9年时间,担任过各种机器学习相关角色的副总裁。Sirosh表示,前微软首席执行官Steve Ballmer和现任首席执行官Satya Nadella(曾经是云及企业群组领头人)聘请他帮助微软打造一个可以实现机器学习“民主化”的平台。“之所以机器学习需要民主化,是因为到目前为止,这还是一个只有少数高科技人才才能碰触的领域。”
微软从1992年开始开发机器学习技术,如今在其Xbox、Bing以及Windows Phone的数字助理Cortana中使用这项技术。机器学习还可以有效地防止欺诈和预测消费者的购买行为。Sirosh表示,微软有100多家合作伙伴正在使用Azure机器学习预览版。
Versium是一家总部在华盛顿雷蒙德的微软合作伙伴公司,该公司在其专有的LifeData预测分析服务中采用Azure机器学习技术,将其与来自客户的CRM、市场营销及其他内部系统的数据相结合,让Versium生成预测消费者行为的“分数”,Versium首席执行官Chris Matty表示。
信用分数就是一个简单的例子,但是Versium目前正在开发其他多种类型的分析,借助领先的消费者品牌,而且使用微软Azure机器学习服务进行构建。Versium的分数可用于验证网上购物者的身份,预测他们取消一项服务而转向竞争对手的可能性,并评估他们在社交媒体上的影响力等等。Matty指出,“他们都设计回答这些问题:我的哪些客户可能会欺诈我?谁会对我的业务做出贡献?”利用Azure机器学习,“我们可以注入数据,建立我们的模型,调整并且在数周时间内进行部署。”
Neal Analytics是一家总部在西雅图的微软合作伙伴公司,该公司销售副总裁Greg Gomez表示,他的公司正在使用Azure机器学习来帮助一家电子商务公司获得更好的广告位置。Neal Analytics正在使用Azure机器学习来预测获取特定的广告位置需要出价多少。这项服务配合Neal Analutics自己的超过10万个关键字组合,每个都包含像卖方和买方的位置、这个词条多久被搜索一次等属性。“Azure机器学习让我们能够自动搜索和发现这些与竞价和位置相关的不同属性之间的关联。”Gomez这样表示。
MAX451是一家总部在西雅图的微软合作伙伴公司,这家公司也是Azure机器学习技术的早期采用者,他们使用这项服务来构建一个可以自动变更管理流程的应用。MAX451公司首席执行官Kristian Kimbro Rickard表示,这项服务能够处理一些以前需要高薪聘请数据科学家才能完成的任务。
数据科学家可能是今天科技行业中最抢手的人才了,因此Azure机器学习对于那些不能负担得起聘请这些科学家的公司具有很大吸引力。
当微软将其作为一项付费服务发布的时候,价格大约是每小时0.38美元,微软还将为每1000条预测收取0.18美元的费用,外加部署网络服务收取每小时0.75的计算费用。Sirosh表示,这个定价比市场中现有机器学习软件便宜100倍。这是因为微软是根据使用率和计算小时数收费的,而不是高昂的前端软件许可费用。
Sirosh表示,Azure机器学习预览服务目前功能已经齐全,但是微软仍然在进行微调使其可以满足服务等级协议。“它需要一些打磨的时间使其能够符合SLA,并且足以令人信服,我猜还需要几个月的时间。”Sirosh这样表示。
微软正在与多家厂商就Azure机器学习服务谈合作,Sirosh表示,一些大公司将利用这项服务构建预测分析应用,而且这将在未来几个月内公布。
“机器学习一直很难做到,因此人们只把它运用于解决最高价值的难题上。现在这项技术易于使用,每个开发者都可以开始使用它了。”Sirosh这样表示。
好文章,需要你的鼓励
这项由加州大学圣地亚哥分校和微软研究院合作开发的REAL框架,通过程序分析反馈训练大型语言模型生成高质量代码。与传统方法不同,REAL采用强化学习将代码安全性和可维护性作为奖励信号,不依赖人工标注或特定规则。研究在多个数据集上的实验表明,REAL在保证功能正确性的同时显著提高了代码质量,有效解决了"即兴编程"中的安全漏洞和维护性问题,为AI辅助编程提供了新的范式。
加州大学伯克利分校与Meta FAIR研究团队开发了"Self-Challenging"框架,让大语言模型通过自己创建和解决任务来提升能力。该方法引入创新的"Code-as-Task"格式,包含指令、验证函数、示例解决方案和失败案例,确保生成的任务既可行又有挑战性。在工具计算、网页浏览、零售服务和航班预订四种环境测试中,仅使用自生成训练数据,Llama-3.1-8B模型性能提升了两倍多,证明AI可以通过自我挑战实现有效学习,减少对人类标注的依赖。
南洋理工大学与SenseTime Research合作提出了PoseFuse3D-KI,一种创新的人体中心关键帧插值框架。该方法将3D人体模型信息融入扩散过程,解决了现有技术在处理复杂人体动作时产生扭曲结果的问题。研究团队开发了专门的SMPL-X编码器直接从3D空间提取几何信息,并设计了融合网络将3D线索与2D姿态无缝整合。他们还构建了CHKI-Video数据集,包含2,614个视频片段及完整的人体标注。实验结果显示,PoseFuse3D-KI在PSNR上提升9%,LPIPS减少38%,显著超越现有方法。
这项研究提出了LongGuide算法,解决了大型语言模型在长文本生成任务中的局限性。研究团队发现,仅依靠上下文学习无法使模型充分掌握文本的语言和格式特性。LongGuide通过自动生成两种指导原则:度量指导原则和输出约束指导原则,显著提升了模型性能。在七种长文本生成任务中,该方法使开源和闭源模型的ROUGE-L评分平均提高约6%。LongGuide具有通用性强、易于学习、成本效益高等优点,为提升AI长文本生成能力提供了新方向。