微软首席技术官办公室属下增设了新的“数据尊严”的团队,已开始扩员。数据尊严团队的工作是研究如何让用户更好地掌控自己的个人数据,或许未来的某一天,用户甚至可以购买个人数据或将其出售给第三方机构。
微软近端时间来在隐私领域里摇旗呐喊,微软希望能将自己和谷歌、Facebook等科技公司区分开来,这些公司由于其数据收集方法而陷入法律和政治问题泥潭。微软在隐私行家眼里也曾犯过大忌,尤其是微软利用Windows 10利用遥测功能收集姓名数据一事,最近又被曝出使用人类承包商将Skype通话做成文字记录(https://www.zdnet.com/article/microsoft-contractors-are- listening-to-some-skype-translation-calls-report/)。数据尊严之举或许可以令微软让自己表面上看起来是用户隐私倡导者(至少在理论上是这样)。
笔者今年早些时候曾发过关于微软 “巴厘岛项目”的文章,我知道微软在研究如何让用户能对自己的数据有更多的控制权。巴厘岛项目是微软研究院的一个孵化项目,今年1月时似乎还在私下测试,据项目资料的介绍,巴厘岛项目是一个“新的个人资料库,可以令用户控制被收集的自己的所有数据。” (https://www.zdnet.com/article/microsoft-is-privately-testing-bali-a-way-to- give-users-control-of-data-collected-about-them/ )项目的基本想法是为用户提供关于存储、可视化、管理、控制、共享和货币化数据等各方面的方式。不过介绍资料的网页已经被微软隐藏起来了。
今天(9月23日)的纽约时报上有一篇Jaron Lanier的互动专题报道文章,重点讨论数据隐私, https://www.nytimes.com/interactive/2019/09/23/opinion/data-privacy-jaron-lanier.html)。Lanier是个虚拟现实开拓者及微软的首席科学家。
Lanier纽约时报文章的核心论点是,用户被糊弄了,已经放弃了他们最宝贵的资产(数据);用户的个人资料应该是需付费后才能使用。他描述了他的计划称可以纠正这种错误,他用了“数据尊严”一词。
稍微搜一下“数据尊严”( data dignity)即可找到一个theartofresearch.org网站(https://theartofresearch.org/contact-us/)。该网站称“研究的艺术”部门“嵌在”在Lanier领导的微软CTO办公室属下。网站的关于页还表示,“微软这有个由Christian Liensberger带领的全新数据尊严团队(现正招聘!)”
Liensberger身兼高级产品管理经理及微软首席技术官Kevin Scott.的顾问两职。他的LinkedIn个人资料(https://www.linkedin.com/in/christian-liensberger-476a952/)称自己的现职是管理“一个多学科团队,团队里含项目经理、设计师和开发人员,团队的目标是孵化颠覆性ML/AI产品,这些ML/AI产品直接由微软高级领导团队倡议,其中包括一组关键跨公司的举措及项目,用于发展微软和整个行业数据的ML/AI方法“。
猛料十足。貌似数据尊严要火了。
而首席技术官办公室(OCTO)这边则在三个重叠的领域下功夫,微软在旧金山设计研究员的招聘启事(https://careers.microsoft.com/us/en/job/690434/Senior-Design-Researcher)含以下内容:令深度学习“清晰可辨”,运用混合现实,用于实际应用的深度学习和数据尊严。
相关的边注:OCTO更广泛的使命是与公司的工程师一起共同探索“技术发展趋势,如智能边缘、智能汽车、AI/ML、OSS、数据安全和隐私以及区块链。我们助力将最好的创意点子转化成业务策略和产品。”
可能相关的边注:微软CTO办公室今年年初聘了Bill Stasior,他是苹果前AI副总裁和Siri团队负责人(https://www.zdnet.com/article/microsoft-nabs-former-apple-siri-chief- william-stasior/)。
笔者询问过微软,想知道微软是否会分享关于数据尊严的详细信息,我收到发言人的回复是“无可分享”。但微软的公关机器已经开动,笔者觉得我们可能很快会听到一些相关的消息。也许在未来几个月里会听到一些关于巴厘岛项目的消息?
好文章,需要你的鼓励
这项由索非亚大学INSAIT和苏黎世联邦理工学院共同完成的研究,揭示了大语言模型在数学定理证明中普遍存在的"迎合性"问题。研究团队构建了BrokenMath基准测试集,包含504道精心设计的错误数学命题,用于评估主流AI模型能否识别并纠正错误陈述。
约翰斯·霍普金斯大学研究团队提出了创新的隐私保护AI文本生成方法,通过"控制代码"系统指导AI生成虚假敏感信息来替代真实数据。该方法采用"藏身于众"策略,在医疗法律等敏感领域测试中实现了接近零的隐私泄露率,同时保持了高质量的文本生成效果,为高风险领域的AI应用提供了实用的隐私保护解决方案。
实验室和真实使用测试显示,iPhone Air电池续航能够满足一整天的典型使用需求。在CNET进行的三小时视频流媒体压力测试中,iPhone Air仅消耗15%电量,表现与iPhone 15相当。在45分钟高强度使用测试中表现稍逊,但在实际日常使用场景下,用户反馈iPhone Air能够稳定支撑全天使用,有线充电速度也比较理想。
这项由Reactive AI提出的稀疏查询注意力机制通过减少查询头数量而非键值头数量,直接降低了注意力层的计算复杂度,实现了2-3倍的训练和编码加速。该方法在长序列处理中表现出色,在20万词汇序列上达到3.5倍加速,且模型质量损失微乎其微,为计算密集型AI应用提供了新的优化路径。