微软公司表示会逐步停止对旗下一些由人工智能驱动的面部识别工具的访问,包括一项基于视频和图像识别情绪的服务。
微软在今天宣布这一决定的同时还公布了一份27页的“负责任的人工智能标准”,标准解释了微软在公平的和值得信赖的人工智能方面的目标。微软为了达到这些标准而限制了一些面部识别工具的访问,包括旗下的AzureFace API、计算机视觉和视频索引器服务提供的面部识别工具。
微软表示,新用户将不会有机会使用这些功能,而现有客户则必须在今年年底前停止使用这些功能。
面部识别技术已经成了民权和隐私团体的一个主要关注点。此前的研究表明,面部识别技术远非完美,经常大比例地误判女性对象及皮肤较黑的人。这在人工智能用于识别犯罪嫌疑人和其他监控情况时可能会导致很大的潜在问题。
而检测情绪的人工智能工具的使用则更是具争议性。今年早些时候,Zoom Video Communications Inc曾宣布考虑增加“情感人工智能”功能,隐私组织Fight for the Future其时曾发起一项运动敦促Zoom不要这样做,因为担心该技术可能被滥用。
围绕面部识别的争议得到各科技公司的重视,亚马逊网络服务公司和Facebook的母公司Meta Platforms Inc.都在缩减对此类工具的使用。
微软首席人工智能负责人Natasha Crampton在一篇博文中表示,微软认识到要使人工智能系统值得信赖,人工智能系统必须是其所要解决的问题的适当解决方案。Crampton表示,面部识别则被认为是不合适的解决方案,微软将搁置推断“情绪状态和身份属性,如性别、年龄、微笑、面部毛发、头发和化妆”的Azure服务。
她还表示,“人工智能系统有可能加剧社会偏见和不平等,可以说是有关这些系统的最广泛认可的危害之一。我们的法律还没有跟上人工智能的独特风险或社会需求。我们看到有迹象表明政府在人工智能方面的行动正在扩大,但我们也认识到我们有责任采取行动。”
分析师们对于微软的决定是否是一个好决定的看法存在分歧。Pund-IT公司的Charles King告诉记者,除了面部识别技术的争议之外,人工智能归类剖析工具的效果也往往不尽如人意,很少能达到其创造者所声称的效果。King表示,“同样重要的是,寻求更好生活的难民及有色人种在这么多地方受到攻击,归类剖析工具被滥用的可能性非常大。因此,我相信微软限制这一类工具使用的决定是非常合理的。”
而Enderle集团的Rob Enderle则表示,看到微软退避面部识别令人失望,这种工具已经从早期的许多错误中取得了很大的进展。他表示,围绕面部识别的负面宣传已经迫使一些大公司远离该领域。
Enderle表示,“基于人工智能的面部识别技术对于抓捕罪犯、恐怖分子和间谍来说太有价值了,所以政府机构也不会停止使用这种技术。然而,微软的退避意味着他们最终将使用来自专业防务公司或外国供应商的工具,这些工具的效果很可能不会太好,而且也缺乏相同种类的控制。妖怪已经放出来了,再扼杀面部识别技术只会令整个社会不能从中获益。”
微软表示,旗下负责任的人工智能标准并不局限于面部识别。微软还会将这些标准应用于Azure人工智能定制神经语音,Azure人工智能定制神经语音是一种语音到文本的服务,可用于支持转录工具。微软的解释是,2020年3月的一项研究发现,非裔美国人和黑人社区使用该软件时错误率较高,鉴于此,微软已经采取措施改进该软件。
好文章,需要你的鼓励
Coursera在2025年连接大会上宣布多项AI功能更新。10月将推出角色扮演功能,通过AI人物帮助学生练习面试技巧并获得实时反馈。新增AI评分系统可即时批改代码、论文和视频作业。同时引入完整性检查和监考系统,通过锁定浏览器和真实性验证打击作弊行为,据称可减少95%的不当行为。此外,AI课程构建器将扩展至所有合作伙伴,帮助教育者快速设计课程。
腾讯ARC实验室推出AudioStory系统,首次实现AI根据复杂指令创作完整长篇音频故事。该系统结合大语言模型的叙事推理能力与音频生成技术,通过交错式推理生成、解耦桥接机制和渐进式训练,能够将复杂指令分解为连续音频场景并保持整体连贯性。在AudioStory-10K基准测试中表现优异,为AI音频创作开辟新方向。
英国政府研究显示,神经多样性员工从AI聊天机器人中获得的收益远超普通同事。在Microsoft 365 Copilot试点中,神经多样性员工满意度达90%置信水平,推荐度达95%置信水平,均显著高于其他用户。患有ADHD和阅读障碍的员工表示AI工具为他们提供了前所未有的工作支持,特别是在报告撰写方面。研究表明,AI工具正在填补传统无障碍技术未能解决的职场差距,为残障人士提供了隐形的工作辅助。
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。