“有两次我曾经被问到这样一个问题,计算先驱查尔斯.巴贝奇(Charles Babbage)在1864年的时候写道:‘祈祷吧,巴贝奇先生,如果你把错误的数字放进机器里,会有正确的答案出来吗?’我没办法正确理解可能引发这个问题的混乱思路。”
因此,“垃圾进,垃圾出”的基本软件原理诞生了。然而,今天,人工智能(AI)已经增加了对巴贝奇难题的赌注,因为来自人工智能的“垃圾输出”导致了令人震惊的偏见。
人工智能——特别是机器学习和深度学习——将大数据集作为输入,从这些数据中提取基本规律,并根据它们提供结论。
例如,如果你想使用人工智能在招聘时给出哪位候选人是最佳选择的建议,你提供为算法提供了过去成功的候选人的相关数据,它将会把这些数据和目前的候选人进行对比,并给出建议。
这里只有一个问题。如果输入的数据带有偏见——比如说,主要由年轻的白人男性组成(也就是我们所说的“垃圾进”),那么人工智能会向你推荐谁呢?你猜对了:大多是年轻的白人男性(这是可以预料得到的结果,也就是“垃圾出”)。
正如巴贝奇可能可以肯定的那样,这里的问题在于输入的数据,而不是人工智能算法本身。但是这更多的是数据带有偏见,而不是坏数据。“数据本身就是数据,”Fourkind的机器学习合作伙伴Max Pagels表示。“这不是社会偏见,这只是一堆数字。需要仔细构建数据集以避免引入社会偏见,但是它本身并没有偏见。”
人工智能算法本身是否带有偏见也是一个悬而未决的问题。“(机器学习算法)尚未针对公平性的任何定义进行优化,”加州大学伯克利分校信息学院副教授Deirdre Mulligan表示。 “他们已经进行的优化都是针对完成任务的。”
好文章,需要你的鼓励
灰鲸近年开始在旧金山湾意外停留,频繁遭遇船只碰撞威胁。2025年已有21头灰鲸在湾区死亡,其中40%死于船撞。为此,WhaleSpotter公司于2026年5月推出基于AI的鲸鱼检测系统,通过安装在天使岛的热成像摄像头捕捉鲸鱼喷水画面,结合AI模型识别后由人工核实,再向附近船只发出预警。系统已在运行约一周半内记录了6600次检测,据称可将船撞风险降低90%。
清华大学等机构提出首个实时双工多模态交互评测基准Omni-DuplexEval,含660个视频、9项任务,揭示当前最佳AI模型综合得分仅39.6分,远低于人类81.8分。
戛纳电影节今年将AI议题推至焦点。导演达伦·阿罗诺夫斯基认为AI是扩展电影创作工具箱的手段,而非替代人类创作者。史蒂文·索德伯格与Meta合作,将AI用于约10%的纪录片画面。彼得·杰克逊将AI比作早期电影的定格动画技术。但吉尔莫·德尔·托罗表示宁死不用AI,赛斯·罗根也批评AI辅助编剧毫无意义。戛纳主竞赛单元禁止纯AI生成影片参赛,业界对AI的边界与规范仍争议不断。
上交大与腾讯ARCLab提出SGT方法,通过将图像分割作为生成代理任务,有效打通统一多模态模型中理解与生成两种能力的表示空间,在多个主流评测上取得一致性提升。