ZD至顶网软件频道消息: 微软在过去几年里,对软件开源产生了越来越大的兴趣。他们宣布了Office移动端免费,发布安卓Office测试版和免费使用Office 365服务;开源.NET,为Visual Studio加入linux、Mac、Android和iOS应用开发支持;向Linux内核贡献代码,还开放了.NET核心服务器、Visual Studio Code编辑器、甚至是Chakra JavaScript引擎的源代码,而在和公司内部的开发者进行了漫长的谈判之后,微软又对博客工具Windows Live Writer进行了开源......这些也只是冰山一角。
在微软坚定了开源之路的背后,我们不禁要问,微软的开源之路走到了哪里?微软接下来还将开源什么?微软的开源策略是什么?
反观中国开发者,对微软软件工具再熟悉不过,但与开发它们的大神却无缘谋面。如果说,现在有一个机会,这些大神将集体出现在你面前,将他们的法宝和盘托出,你会心动吗?
这个日子即将到来——6月1日,2016年微软开发者峰会来北京了!
为开源而狂
两个月前在旧金山,微软在Build2016开发者大会展现出完全不同的气质,以一种更开放、更包容的方式对待软件开发,通过人工智能、微软认知服务、Azure云服务等向全球开发者展示了全新的一系列的智能创新。2个月后的北京,微软又会给中国开发者带来哪些彩蛋?
此次2016微软开发者峰会的讲师团队空前盛大,其中微软首席执行官萨提亚·纳德拉(Satya Nadella)、微软杰出工程师Erich Gamma、Xamarin技术顾问Nish Anil均是首次与中国开发者在华公开对话。
在中国开发者眼中,微软公司首席执行官萨提亚·纳德拉可谓是微软的传奇人物。他的传奇,除了多次主导微软的重要战略转型,更名声在外的是,领导微软迈向云计算。
自从萨提亚掌权,在“云为先”的战略下,Microsoft Azure牵引着微软内部很多相对封闭的传统强势产品,带它们一步一步走向开放,融入开源。
尽管官方对他这次的主题演讲还在保密阶段,我们不妨猜测一下,开发者是否会听到他对开源领域的判断,以及他是否会透露微软下一步的打算。
一提到Erich Gamma,很多开发者或许就会开始兴奋,这跟他的多重权威身份相关。他是Jazz项目的主要领导人;是Eclipse的项目管理委员会成员,被业界称为“Eclipse之父”; 是经典书《设计模式》的作者四人帮之一,1998年与Kent Beck一起开发JUnit,使其成为Java社区的单元测试工具;有“敏捷开发方法的创始人”之称 ……你或许没见过他,但肯定用过他开发的产品。
2011年加入微软后,Erich Gamma主持微软设立在瑞士苏黎世的一个开发实验室。微软的多个产品如 Visual Studio Online、Visual Studio Code和 Office 365 开发工具里都应用了由这个实验室开发出来的基于浏览器的开发套组件“Monaco”。
他在峰会上的演讲主题是《微软爱开源》,不知道从他的理解中,开发者会收集到哪些微软和开源之间的信息。
微软收购印度公司Xamarin之后,就将Xamarin 技术免费提供给所有的 Visual Studio 开发者,让 Xamarin 一度成为当前最火的移动跨平台开发技术。
现在,单一开发者就能够开发 iOS、Android 与 Windows Phone 原生 app。Xamarin 更能够与微软现有的 DevOps 平台密切集成, 实现 Mobile DevOps 的完整解决方案。
在此峰会上,微软请来了Xamarin 团队的技术专家Nish Anil,他曾获得微软.NET 最有价值专家奖,尤其在Web 和 Windows 平台的软件编写方面有着天赋一般的才能。Nish十分热衷于推广C# 和 Xamarin,他在C#的高超技能在IT开发界广为人知。
Nish Anil的演讲主题是《微软爱移动跨平台》,他将解读移动跨平台开发技术的全球趋势、以及重现四月份 Xamarin Evolve 大会中的最新发布,包括:
Xamarin 开源计划,可以在 Mac 上使用的 Xamarin Studio 6,Xamarin 在 Visual Studio 开发场景上提供的 iOS 模拟器并支持 USB remoting 的方式,跨移动平台 App 使用介面设计的新方法Xamarin.Forms,以及如何集成 XTC Live 与 HockeyApp、实现 Mobile DevOps。
最吸引人的是,这三位大咖都是首次在中国公开亮相,光凭这一点,就吊足了中国开发者的胃口。
更接中国地气的智能创新
每次微软的开发者大会,都将向全球开发者展示一系列引人入胜的智能创新。从 “Build 2016”旧金山的发布来看,微软在这次峰会上可能发布的技术创新可能包括:
开发者峰会虽不是新品发布会,而且有些技术并不一定在这次北京峰会上展现。微软的侧重点在于,为开发者和生态圈打造一个开放、免费、跨平台的创新空间,开发者往往能从峰会上获得微软生态发展和未来规划的关键点。详情可以直击2016微软开发者峰会直播:http://soft.zdnet.com.cn/special/Microsoft_Developer_Summit_2016。
好文章,需要你的鼓励
这项研究由浙江大学、复旦大学等机构联合完成,提出了ReVisual-R1模型,通过创新的三阶段训练方法显著提升了多模态大语言模型的推理能力。研究发现优化的纯文本冷启动训练、解决强化学习中的梯度停滞问题、以及分阶段训练策略是关键因素。ReVisual-R1在各类推理基准测试中超越了现有开源模型,甚至在某些任务上超过了商业模型,为多模态推理研究开辟了新途径。
这项研究提出了一种名为"批评式微调"的创新方法,证明仅使用一个问题的批评数据就能显著提升大语言模型的推理能力。研究团队对Qwen和Llama系列模型进行实验,发现这种方法在数学和逻辑推理任务上都取得了显著提升,平均提高15-16个百分点,而且只需要强化学习方法1/20的计算资源。这种简单高效的方法为释放预训练模型的潜在推理能力提供了新途径。
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。