当计算机突破了人的计算极限,当互联网将全世界连为一体,当人工智能一步步走进生产线和我们的生活场景,当算法的偏见成为公平的干扰因素,当数据安全话题的热度高低不下,当基因编辑技术走上“灰色地带”……“黑客帝国式”的场景遐想将科技与人类的矛盾再次推向了风口浪尖。甚至有人提出,“当今世界的很多问题,都是由科技公司造成的。”
对于这样的论断,IBM的回应是,“人,才是科技的尺度,人类的价值观与责任决定了科技的未来。”这不只是IBM的期许,也是IBM正在做的事情。除了通过长期的基础研究为人类谋福祉,在今年的IBM中国论坛上,IBM全球副总裁、大中华区首席营销官周忆也向我们描画了IBM的“另一面”。
举个例子。2018年,IBM与联合国、红十字会以及其他GNO组织共同发起了名为“CALL FOR CODE(代码集结号)”的项目,号召全球开发者贡献自己的编程力量,一起应对地震、泥石流、火山爆发、飓风等自然灾害带来的网络瘫痪、建筑坍塌、疾病蔓延等灾后困境。为了调动开发者的积极性,IBM在这一过程中出资3000万美元,连续5年在全球举行编程大赛,用以招募天下“英雄好汉”,集结救灾所需的各种硬件设备和软件代码。所有代码已经开发便会立即发布到开源平台,供全球的就在组织和开发者免费使用。
在去年的编程大赛中获奖的冠军是名为“Project Owl”(猫头鹰计划)的组织,该团队利用科技和代码建立起即使通讯网络,其研发的探测器就像猫头鹰的眼睛,可以通过无线网络热点在网络瘫痪的极端环境下迅速了解现场灾情,并穿越各种屏障向指挥总部传送信息,解决救灾救援过程中的信息不对称问题。同时,通过云平台,还可以形成可视地图并显示幸存者位置,提升救援效率的同时保障救援队员和被救人员的安全。这便是向善的科技。
除此之外,为了应对全球范围内的“科技人才荒”,IBM还率先在全球开创了一种全新的教育模式——“P-TECH”(Pathway To Technology)。这是由政府、教育机构与企业三方合作的为期6年的项目,面向初中毕业生,通过4+2高中、职业教育、高等教育贯通式的教学模式,进行职场软技术培养,为企业培养定向可用人才。在完成学业后,学员将拿到应用科学副学士学位,并优先获得工作机会。这是科技的责任,与此同时,也是IBM作为一个科技企业的担当。
作为百年科技企业,IBM正在用行动传递这样的价值观:让科技造福于人,这既是科技发展的起点也是归属。这样的价值观不仅体现在一个个对外的项目中,也体现在每一个普通员工身上。他们关心食品安全、保护信息安全、温暖空巢老人,甚至用科技实现教育普惠、防控慢性疾病、开发救灾应用……他们在不同的工作岗位上,承担科技责任的重量,用“向善而行”的科技推动“向上而行”的发展。他们正身体力行肩负科技使命,以责任作为科技进步的动力,并用科技强化承担责任的能力。
致敬每一位“向善而行”的科技人
如果每个人、每个企业、每个机构都能所思如此,那么人与科技将建立起更稳固的信任基础,未来将变得更可期,我们也将走得更远。
好文章,需要你的鼓励
这项由加州大学圣地亚哥分校和微软研究院合作开发的REAL框架,通过程序分析反馈训练大型语言模型生成高质量代码。与传统方法不同,REAL采用强化学习将代码安全性和可维护性作为奖励信号,不依赖人工标注或特定规则。研究在多个数据集上的实验表明,REAL在保证功能正确性的同时显著提高了代码质量,有效解决了"即兴编程"中的安全漏洞和维护性问题,为AI辅助编程提供了新的范式。
加州大学伯克利分校与Meta FAIR研究团队开发了"Self-Challenging"框架,让大语言模型通过自己创建和解决任务来提升能力。该方法引入创新的"Code-as-Task"格式,包含指令、验证函数、示例解决方案和失败案例,确保生成的任务既可行又有挑战性。在工具计算、网页浏览、零售服务和航班预订四种环境测试中,仅使用自生成训练数据,Llama-3.1-8B模型性能提升了两倍多,证明AI可以通过自我挑战实现有效学习,减少对人类标注的依赖。
南洋理工大学与SenseTime Research合作提出了PoseFuse3D-KI,一种创新的人体中心关键帧插值框架。该方法将3D人体模型信息融入扩散过程,解决了现有技术在处理复杂人体动作时产生扭曲结果的问题。研究团队开发了专门的SMPL-X编码器直接从3D空间提取几何信息,并设计了融合网络将3D线索与2D姿态无缝整合。他们还构建了CHKI-Video数据集,包含2,614个视频片段及完整的人体标注。实验结果显示,PoseFuse3D-KI在PSNR上提升9%,LPIPS减少38%,显著超越现有方法。
这项研究提出了LongGuide算法,解决了大型语言模型在长文本生成任务中的局限性。研究团队发现,仅依靠上下文学习无法使模型充分掌握文本的语言和格式特性。LongGuide通过自动生成两种指导原则:度量指导原则和输出约束指导原则,显著提升了模型性能。在七种长文本生成任务中,该方法使开源和闭源模型的ROUGE-L评分平均提高约6%。LongGuide具有通用性强、易于学习、成本效益高等优点,为提升AI长文本生成能力提供了新方向。