当计算机突破了人的计算极限,当互联网将全世界连为一体,当人工智能一步步走进生产线和我们的生活场景,当算法的偏见成为公平的干扰因素,当数据安全话题的热度高低不下,当基因编辑技术走上“灰色地带”……“黑客帝国式”的场景遐想将科技与人类的矛盾再次推向了风口浪尖。甚至有人提出,“当今世界的很多问题,都是由科技公司造成的。”
对于这样的论断,IBM的回应是,“人,才是科技的尺度,人类的价值观与责任决定了科技的未来。”这不只是IBM的期许,也是IBM正在做的事情。除了通过长期的基础研究为人类谋福祉,在今年的IBM中国论坛上,IBM全球副总裁、大中华区首席营销官周忆也向我们描画了IBM的“另一面”。
举个例子。2018年,IBM与联合国、红十字会以及其他GNO组织共同发起了名为“CALL FOR CODE(代码集结号)”的项目,号召全球开发者贡献自己的编程力量,一起应对地震、泥石流、火山爆发、飓风等自然灾害带来的网络瘫痪、建筑坍塌、疾病蔓延等灾后困境。为了调动开发者的积极性,IBM在这一过程中出资3000万美元,连续5年在全球举行编程大赛,用以招募天下“英雄好汉”,集结救灾所需的各种硬件设备和软件代码。所有代码已经开发便会立即发布到开源平台,供全球的就在组织和开发者免费使用。
在去年的编程大赛中获奖的冠军是名为“Project Owl”(猫头鹰计划)的组织,该团队利用科技和代码建立起即使通讯网络,其研发的探测器就像猫头鹰的眼睛,可以通过无线网络热点在网络瘫痪的极端环境下迅速了解现场灾情,并穿越各种屏障向指挥总部传送信息,解决救灾救援过程中的信息不对称问题。同时,通过云平台,还可以形成可视地图并显示幸存者位置,提升救援效率的同时保障救援队员和被救人员的安全。这便是向善的科技。
除此之外,为了应对全球范围内的“科技人才荒”,IBM还率先在全球开创了一种全新的教育模式——“P-TECH”(Pathway To Technology)。这是由政府、教育机构与企业三方合作的为期6年的项目,面向初中毕业生,通过4+2高中、职业教育、高等教育贯通式的教学模式,进行职场软技术培养,为企业培养定向可用人才。在完成学业后,学员将拿到应用科学副学士学位,并优先获得工作机会。这是科技的责任,与此同时,也是IBM作为一个科技企业的担当。
作为百年科技企业,IBM正在用行动传递这样的价值观:让科技造福于人,这既是科技发展的起点也是归属。这样的价值观不仅体现在一个个对外的项目中,也体现在每一个普通员工身上。他们关心食品安全、保护信息安全、温暖空巢老人,甚至用科技实现教育普惠、防控慢性疾病、开发救灾应用……他们在不同的工作岗位上,承担科技责任的重量,用“向善而行”的科技推动“向上而行”的发展。他们正身体力行肩负科技使命,以责任作为科技进步的动力,并用科技强化承担责任的能力。
致敬每一位“向善而行”的科技人
如果每个人、每个企业、每个机构都能所思如此,那么人与科技将建立起更稳固的信任基础,未来将变得更可期,我们也将走得更远。
好文章,需要你的鼓励
这项研究由浙江大学、复旦大学等机构联合完成,提出了ReVisual-R1模型,通过创新的三阶段训练方法显著提升了多模态大语言模型的推理能力。研究发现优化的纯文本冷启动训练、解决强化学习中的梯度停滞问题、以及分阶段训练策略是关键因素。ReVisual-R1在各类推理基准测试中超越了现有开源模型,甚至在某些任务上超过了商业模型,为多模态推理研究开辟了新途径。
这项研究提出了一种名为"批评式微调"的创新方法,证明仅使用一个问题的批评数据就能显著提升大语言模型的推理能力。研究团队对Qwen和Llama系列模型进行实验,发现这种方法在数学和逻辑推理任务上都取得了显著提升,平均提高15-16个百分点,而且只需要强化学习方法1/20的计算资源。这种简单高效的方法为释放预训练模型的潜在推理能力提供了新途径。
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。