ZD至顶网软件频道消息:在第八届中国云计算大会召开期间,微软中国技术顾问总监赵立威接受了大会承办方ZD至顶网的独家视频专访。利用微软的机器学习技术,可以帮助糖尿病人进行自我管理和科学恢复,而这其中正是云计算大数据的推动,才让机器学习取得了如此惊人成果。应该说微软通过自身技术深入到医疗行业,推动医疗行业早日实现互联网+,也让传统行业在互联网时代迸发出更多活力。
微软中国技术顾问总监赵立威
赵立威:今天下午的分论坛我将会介绍基于微软的机器学习技术如何帮助糖尿病管理,这是一个挺大的话题,大家也知道,在中国糖尿病患者过亿,但是目前来说,我们糖尿病专科医生的数量非常有限,可能只有不到一万名。在这种情况下,我们如何利用方兴未艾的云计算、大数据,特别是今天下午会介绍的机器学习技术,去帮到糖尿病患者,让他们在可承受的成本范围内,利用机器学习技术对病人以往很多数据进行预测性的分析,指导病人如何去规范饮食,如何去用药,保证糖尿病人更好地康复,做日常生活的管理。
赵立威:这个标题起的非常好,在这个项目里面,不光是传统意义上的IT管理人员、架构师参与到项目中来,很重要的包括医疗行业的专家、数据分析师、数据科学家大家共同工作,我们把各种新兴技术融合在一起。在行业角度上,我觉得医疗是一个传统行业,从微软的角度我们一直致力于利用数据计算包括机器学习,帮助传统行业实现转型。
赵立威:从整个社会发展过程当中,我们如何保证我们每一个患者,在他们就医过程中可以充分享受到我们技术发展带来的好处,这些好处不仅包括是说他们日常就医成本极大的降低,更重要的提高他们的技术?传统糖尿病患者没有大数据、没有机器学习的时候,如果不追踪历史数据,胰岛素使用不可靠,还有可能造成低血糖,危及人的生命安全。而随着技术的出现,我们可以想像,国内超过一亿糖尿病患者都能够有望享受到数据分析带来的好处。
赵立威:我觉得可能有两个大的话题尤其会关注,第一个跟刚才相关的,在过去几年云计算大会都参与了,大家可能看到说有很多技术的讨论,也有一些新技术的讨论。从今年大会可以看到一个趋势,就是说越来越多的新技术走到了行业里面,跟我们的行业应用相结合,在这个结合过程当中,我们传统上很多看起来传统行业,跟互联网结合不那么紧密的行业,我们利用新的技术对传统行业进行改造,某种程度上,这是互联网+,这和国家倡导大的趋势是密切相关的。另外一方面,我们看到对人工智能,大家最近可能看到在微软刚刚结束的开发者大会上,我们也分享了微软人工智能一些新的创新,一些新的黑科技。随着大数据、云计算技术的出现,人工智能这是一个老话题,60年前就有人工智能、AI这个词,那时候因为你的单位计算成本、因为你的单位存储成本非常高,即使有一些算法不断地演进,计算能力的不足也导致人工智能的发展其实很缓慢。在过去一段时间大家可以看到人工智能是快速爆发。人工智能技术的出现,结合越来越成熟的大数据技术、物联网技术让我们云计算变得更加成熟。
赵立威:在2010年之前这是一个新技术,虽然很多人关注它,但是很多人不知道使用。但是从去年、前年开始,特别在今年云计算大会上,越来越多的人探讨云计算技术、大数据技术跟自身的结合,能够带动自身的业务快速转型,这是一个大趋势。我也非常相信云计算在三到五年的时间里面一定焕发出更大的动力,能够创造出更多的奇迹。
好文章,需要你的鼓励
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。
这项由中国人民大学高瓴人工智能学院研究团队发表的研究解决了大语言模型评判中的自我偏好问题。研究提出了DBG分数,通过比较模型给自身回答的分数与黄金判断的差异来测量偏好度,有效分离了回答质量与自我偏好偏差。实验发现,预训练和后训练模型都存在自我偏好,但大模型比小模型偏好度更低;调整回答风格和使用相同数据训练不同模型可减轻偏好。研究还从注意力分析角度揭示了自我偏好的潜在机制,为提高AI评判客观性提供了重要指导。
这篇研究提出了DenseDPO,一种改进视频生成模型的新方法,通过三大创新解决了传统方法中的"静态偏好"问题:使用结构相似的视频对进行比较,采集细粒度的时序偏好标注,并利用现有视觉语言模型自动标注。实验表明,DenseDPO不仅保留了视频的动态性,还在视觉质量方面与传统方法相当,同时大大提高了数据效率。这项技术有望推动AI生成更加自然、动态的视频内容。