至顶网软件频道消息: 从前,车、马、邮件都很慢。人与人的文字交流多是一群人写、另一群人看,缺乏即时互动性。
现在,设备、网络、信息都很快。人与人的沟通离得再远也像是面对面,虽然拉近了亲密距离,但也扩大了冲突范围,导致舆论环境“乱象丛生”。
正因如此,网络暴力和言论攻击成了摆在所有社交平台面前的棘手问题。为解决这一难题,这几年来Facebook、Google、Instagram等互联网社交巨头尝试了各种方法,除了不断增加人工审核的力度之外,也开始利用人工智能等技术手段来打造和谐的互联网环境。以Instagram为例,通过使用Facebook推出的DeepText机器学习算法,它已经实现了对内容的智能化筛选、对垃圾邮件的删除以及对不友善评论的过滤。
然而,何为“不友善”?这个问题是难以界定的。
比如,以前“呵呵”表达的是一种不失礼貌的微笑,但现在却常被解读成具有嘲讽意味的词汇。而如果放到不同的语境中,它既可能是朋友之间的调侃,也可能是陌生人之间带有攻击性的交流态度。
所以,要重整互联网环境首先要解决的其实是尺度和标准的问题。
第一步:找到社区的“最大公约数”
对此,在国内,知识分享平台知乎早在2013年就推出了社区内的良性讨论公约,并在2016年上线了评论折叠功能和社区管理机器人“瓦力”,利用人工智能技术对社区进行治理。
上线后的一年里,知乎不断优化“瓦力”的算法和功能,目前已经能够实现答非所问、不友善识别、广告导流、敏感图片识别、低质提问识别等功能。而据知乎社区治理团队介绍,接下来 “瓦力”机器人还将上线“阴阳怪气”(反讽语言)识别功能,通过对用户行为数据的分析、学习,基于语义和用户关系进行更深层次的理解和建模。
6月23日-24日,知乎以“阴阳怪气”为主题办了一场书法展,用别具一格的方式展示了知乎平台上许多具有“阴阳怪气”意味的评论内容,比如:“嗯 你很棒棒”、“没有好好学语文?”、“该吃药了”、“答主你还活着吗?”、“哈哈哈 太好笑了”等等。
对应保罗·格雷厄姆提出的有关“反驳的八个层次”,知乎把这类言论归结为“不针对发言内容,而是批评对方的语气”以及“提出反对意见,但不给或给出极少数论据支持”两个层级,并认为这通常会给创作者和交流者带来负面的体验。
当然,回到最初提出的“尺度和标准”问题,由于网络语言和情感分析的复杂性,加上中华文化的博大精深,不同的人物关系、对话场景和时间下,一千个人眼中可能解读出两千个“哈姆雷特”。因此,“阴阳怪气”言论的判定也很难拿捏,每个人的情绪阈值不同,同样的语料在不同语境下也会引发不同情绪,即便由人工来审核判定都存在差异化,对于人工智能算法而言挑战也就更加显而易见。
对此,知乎认为,除了语义分析,其中非常重要的还要基于用户普遍感受要找到社区的“最大公约数”,让数据标注、用户体验和算法三方的尺度对齐,然后再交由“瓦力”反复学习和训练。
综合三大模型,多维度提升识别准确率
基于此,知乎团队从情感倾向性、亲密关系、文本特征三方面入手,构建了情感模型、用户亲密度模型和文本识别模型三大模型,通过多维度交叉分析的方式对算法进行训练,大大提升了“瓦力”的阴阳怪气识别准确率。
具体是怎么回事?据知乎内容质量管理团队技术负责人刘兆来介绍,首先是通过知乎社区里的举报、反踩等负向用户行为进行收集和标注,为机器提供训练数据;随后在训练中把文本特征、数值特征、反讽词表,以及一些表现符特征等融入到模型中,并通过各种同义替换、规则模版方式对训练数据进行扩展和增强,以缓解训练数据不足的问题。
与此同时,“瓦力”还会提取文本、句法、表情符等特征,并利用一个带attention的CNN和LSTM融合模型进行分类,最终判断出内容是否为“阴阳怪气”语料。
知乎运营总监孙达云表示,目前“瓦力”对阴阳怪气评论文本的识别准确率已非常接近“社区最大公约数”,能够实现对95%以上违法违规、垃圾广告信息和不友善内容的主动打击、覆盖和筛选,每日可处理内容近万条。
同时,知乎将在近期对该技术进行产品化尝试,向用户提供“瓦力”阴阳怪气智能过滤选项。也就是说,以后当我们回复“瞧把你能的”之类有反讽嫌疑的评论时,就可能被“瓦力”无情处理。当然,为了不影响体验,用户可以自由选择开启或关闭该功能。
具体来说,如今“瓦力”已能实现对“暗藏玄机夸奖”(比如忍不住关注答主了,你的答案很有水平!你博士快毕业了吧!)、“好为人师”(比如我觉得你挺惨,虽然长这么大了,还真应该回小学改造)、“强行反驳”(比如你开心就好、请开始你的表演)等数类阴阳怪气的内容进行识别。当然,孙达云也强调,由算法筛选出来的内容最后还会由人工进行一轮审核,从而避免遗漏或误伤。
“未来我们还会将不断优化‘瓦力’的识别能力,提高模型泛化能力,同时不断迭代更新模型,紧跟学术前沿的同时,适应网络语言的变化潮流,不断提升准确率和召回率,最终将阴阳怪气识别技术全面应用到社区治理中。”
除此之外,刘兆来还指出,知乎接下来将会把AI技术应用去其它场景中,比如对站内数据进行知识图谱的构建、识别图文相关性、实现视频理解等等。
我们看到,截止到今年5月,知乎的注册用户已经达到1.6亿,并收获了超过1亿的回答。在这样庞大的社交平台上,通过人工智能技术的投入,对于解决网络暴力问题、优化互联网社交礼仪是极具意义的。
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。