ZDNet至顶网软件频道消息:我见过大量微软观察者和用户称,这一举措表明,新上任的CEO Satya Nadella正带领公司走向前CEO鲍尔默及其领导团队不敢涉足的方向。
负责微软程序员部门的公司副总Soma Somasegar在Build 2014在Build 2014上告诉记者,将.Net进一步开源的工作从三年前就开始了。Somasegar称,公司的管理层意识到微软对开源的接纳程度还不够。微软应该首先把高级别的.Net框架开源,然后考虑逐步开放堆栈。但是,关于微软是否应该真正采用社区的贡献,还存在争议,按照最低的预计,如果不是全部开源,也会开源许可证——或者只是提供代码查看,而不允许对代码进行修改。
对于移动工具制造商——Xamarin,是微软的重要合作商及谏言者,也不再是向以前那样存在抗拒或畏惧,Somasegar说。微软内部有些人最初都很怀疑Xamarin帮助.Net程序员写安卓和iOS应用的目的,因为这些平台都是微软Windows的竞争对手。但是,随着时间的推移,微软对Xamarin的态度更加友好——尽管还是有谣言称微软正打算收购Xamarin。(上周的Build 2014展商,微软和Xamarin官方都未对此消息进行确认。)
Xamarin官方从未就开源.Net的问题向微软施压,Somasegar说。但是,他们“确实影响了我们,使我们愿意接纳社区,”他说。Xamarin确实想要更多有关.Net界面的信息以及相关文档,Somasegar承认道。
在.Net众多技术中,微软正实现Roslyn编译器的开源,这是Visual Basic和C#未来版本的基石。微软上周的声明意味着所有这些编译器未来的迭代产品都将在Apache 2.0许可证的基础上实现开源。
一年前,Somasegar就表示正在与微软卓越的工程师兼Roslyn领导者Anders Hejlsberg讨论是否要让Roslyn开源,以及何时实现开源的问题。在2013年秋季,微软决定在出预览版/终端用户版本的时候开源Roslyn(也就是上周),并接受社区的贡献,Somasegar说。Somasegar主张创建单独基金的想法获得认同——.Net基金,专为审查新的开源工作而设立的基金。
早在一年前(Nadella成为CEO之前),Nadella还在领导微软Server和Tools业务的时候,Somasegar就谏言称,.Net开源对程序员有益。
“他(Nadella)后来说,如果你认为这对程序员有好处,那就去做吧,”Somasegar说。
Scott Guthrie现在是负责微软云和企业业务的执行副总,他也是持赞同意见的关键人物,Somasegar称。
所以,微软会继续开源的路子,开放核心.Net,包括Base Class Libraries (BCL)和Common Language Runtime (CLR)吗?
“我们会一步一步来,”Somasegar。“如果对我们和社区确实有益,”微软会考虑的,Somasegar说。但是,必须得有证据表明确实有益,他强调道。例如,微软上周向Xamarin提供BCL文档是在Xamarin证明其必要性之后的事情。
我不得不承认,我此前并不确定,微软进一步开源.Net的提议是否会在Build展上受到人们的欢迎。我好奇的是,程序员们会不会误以为微软不再看重.Net的价值,.Net成了没人疼的孩子。好在,我在展会上交谈过的大部分程序员都对.Net开源持欢迎态度。
Build展会期间,Hejlsberg告诉与会媒体团,微软并不会抛弃.Net。
为了回答听众关于微软是否要将.Net束之高阁的问题时,Hejlsber说:“我们正积极投资.Net的发展。”
“我们不是要抛弃.Net,”Hejlsberg说。“而是全力以赴。”
好文章,需要你的鼓励
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。
这项由中国人民大学高瓴人工智能学院研究团队发表的研究解决了大语言模型评判中的自我偏好问题。研究提出了DBG分数,通过比较模型给自身回答的分数与黄金判断的差异来测量偏好度,有效分离了回答质量与自我偏好偏差。实验发现,预训练和后训练模型都存在自我偏好,但大模型比小模型偏好度更低;调整回答风格和使用相同数据训练不同模型可减轻偏好。研究还从注意力分析角度揭示了自我偏好的潜在机制,为提高AI评判客观性提供了重要指导。
这篇研究提出了DenseDPO,一种改进视频生成模型的新方法,通过三大创新解决了传统方法中的"静态偏好"问题:使用结构相似的视频对进行比较,采集细粒度的时序偏好标注,并利用现有视觉语言模型自动标注。实验表明,DenseDPO不仅保留了视频的动态性,还在视觉质量方面与传统方法相当,同时大大提高了数据效率。这项技术有望推动AI生成更加自然、动态的视频内容。