至顶网软件与服务频道消息: 如果一家公司赢得了一份价值100亿美元的合同,它就能获得很大的声势。
这是微软公司与美国政府之间达成的一项交易的总金额,该公司经过激烈的竞争,于上个月赢得了这份合约,为美国国防部的Joint Enterprise Defense Infrastructure(JEDI)云项目提供技术服务。参加本周一开幕的微软Ignite大会的与会者们显然也非常看重这份合约。
微软Ignite大会在佛罗里达州奥兰多举行,在开幕日,SiliconANGLE Media移动直播平台theCUBE的联合主持人Stu Miniman分析说:“这真的是一份很大的订单,微软在过去几年中确实花费了大量时间深耕政府行业,以确保他们符合监管要求……微软还需要做一些工作。他们还没有获六级安全认证,而亚马逊已经做到了,而且他们必须在不到一年的时间里实现这一目标。”
联合主持人Rebecca Knight和Miniman一起参加了这次会议,他们讨论了公民开发人员在计算中日益重要的作用,以及微软在混合云世界中最新的发布具有的意义(点击这里查看完整的讨论及文字记录)。
“公民开发人员”的工具
尽管微软的首席执行官萨提亚.纳德拉在周一的主题演讲中并没有详细介绍JEDI的合同,但是他确实提到该公司围绕着Azure云平台新工具发布的产品公告。他还指出250万“公民开发人员”的影响力,并指出微软今天推出的很多产品都是为了让应用程序编写和开发变得更加容易。
Knight表示:“今天推出的很多工具都是围绕着创造力、协作、时间管理和生产力的……微软在说的是‘我们是为公民开发人员服务的,我们希望让计算能够民主化。’”
微软发布的一个主要产品是Azure Arc,这是一个可以在Azure平台之外为客户提供云服务和管理的解决方案,适用于Amazon Web Services和Google Cloud环境。
Miniman表示:“凭借着Azure Arc,我可以在任何环境中自动更新我的策略,而不仅仅局限于Azure……我们在这里听到的是对混合云的全面重新思考。微软一直是混合云技术的领导者,他们意识到他们需要对旗下的产品系列进行重大的调整,才能真正兑现混合云和多云的承诺。”
好文章,需要你的鼓励
这项研究介绍了VisCoder,一个经过专门微调的大语言模型,用于生成可执行的Python可视化代码。研究团队创建了包含20万样本的VisCode-200K数据集,结合了可执行代码示例和多轮修正对话。在PandasPlotBench基准测试中,VisCoder显著优于同等规模的开源模型,甚至在某些方面超越了GPT-4o-mini。研究还引入了自我调试评估模式,证明了反馈驱动学习对提高代码可执行性和视觉准确性的重要性。
这项研究提出了"适应再连续学习"(ACL)框架,一种创新的方法解决预训练模型在连续学习中的稳定性-可塑性困境。通过在学习新任务前先对模型进行适应性调整,ACL使模型既能更好地学习新知识(提高可塑性),又能保留已有知识(维持稳定性)。实验证明,该框架能显著提升各种连续学习方法的性能,为解决人工智能系统中的"灾难性遗忘"问题提供了有效途径。
这篇研究首次关注了CLIP模型文本编码器的对抗鲁棒性问题,提出了LEAF方法(Levenshtein高效对抗性微调)来增强文本编码器的稳健性。实验表明,LEAF显著提高了模型在面对文本扰动时的性能,在AG-News数据集上将对抗准确率从44.5%提升至63.3%。当集成到Stable Diffusion等文本到图像生成模型中时,LEAF显著提高了对抗噪声下的生成质量;在多模态检索任务中,它平均提高了10个百分点的召回率。此外,LEAF还增强了模型的可解释性,使文本嵌入的反演更加准确。
BenchHub是由韩国KAIST和Yonsei大学研究团队开发的统一评估平台,整合了38个基准中的30万个问题,按技能、学科和目标类型进行精细分类。研究显示现有评估基准存在领域分布偏差,而BenchHub通过自动分类系统和用户友好界面,让用户能根据特定需求筛选评估数据。实验证明模型在不同领域的排名差异巨大,强调了定制化评估的重要性。该平台支持多语言扩展和领域特化,为研究人员和开发者提供了灵活评估大语言模型的强大工具。