知乎再优化社区管理机器人“瓦力”，挑战反讽语言暴力难题原创

作者：高玉娴

6月23日-24日，知乎以“阴阳怪气”为主题办了一场书法展。据知乎社区治理团队介绍，接下来知乎“瓦力”机器人将上线“阴阳怪气”（反讽语言）识别功能，通过对用户行为数据的分析、学习，基于语义和用户关系进行更深层次的理解和建模。

至顶网软件频道消息：从前，车、马、邮件都很慢。人与人的文字交流多是一群人写、另一群人看，缺乏即时互动性。

现在，设备、网络、信息都很快。人与人的沟通离得再远也像是面对面，虽然拉近了亲密距离，但也扩大了冲突范围，导致舆论环境“乱象丛生”。

正因如此，网络暴力和言论攻击成了摆在所有社交平台面前的棘手问题。为解决这一难题，这几年来Facebook、Google、Instagram等互联网社交巨头尝试了各种方法，除了不断增加人工审核的力度之外，也开始利用人工智能等技术手段来打造和谐的互联网环境。以Instagram为例，通过使用Facebook推出的DeepText机器学习算法，它已经实现了对内容的智能化筛选、对垃圾邮件的删除以及对不友善评论的过滤。

然而，何为“不友善”？这个问题是难以界定的。

比如，以前“呵呵”表达的是一种不失礼貌的微笑，但现在却常被解读成具有嘲讽意味的词汇。而如果放到不同的语境中，它既可能是朋友之间的调侃，也可能是陌生人之间带有攻击性的交流态度。

所以，要重整互联网环境首先要解决的其实是尺度和标准的问题。

第一步：找到社区的“最大公约数”

对此，在国内，知识分享平台知乎早在2013年就推出了社区内的良性讨论公约，并在2016年上线了评论折叠功能和社区管理机器人“瓦力”，利用人工智能技术对社区进行治理。

上线后的一年里，知乎不断优化“瓦力”的算法和功能，目前已经能够实现答非所问、不友善识别、广告导流、敏感图片识别、低质提问识别等功能。而据知乎社区治理团队介绍，接下来 “瓦力”机器人还将上线“阴阳怪气”（反讽语言）识别功能，通过对用户行为数据的分析、学习，基于语义和用户关系进行更深层次的理解和建模。

6月23日-24日，知乎以“阴阳怪气”为主题办了一场书法展，用别具一格的方式展示了知乎平台上许多具有“阴阳怪气”意味的评论内容，比如：“嗯你很棒棒”、“没有好好学语文？”、“该吃药了”、“答主你还活着吗？”、“哈哈哈太好笑了”等等。

知乎“阴阳怪气”书法展

对应保罗·格雷厄姆提出的有关“反驳的八个层次”，知乎把这类言论归结为“不针对发言内容，而是批评对方的语气”以及“提出反对意见，但不给或给出极少数论据支持”两个层级，并认为这通常会给创作者和交流者带来负面的体验。

当然，回到最初提出的“尺度和标准”问题，由于网络语言和情感分析的复杂性，加上中华文化的博大精深，不同的人物关系、对话场景和时间下，一千个人眼中可能解读出两千个“哈姆雷特”。因此，“阴阳怪气”言论的判定也很难拿捏，每个人的情绪阈值不同，同样的语料在不同语境下也会引发不同情绪，即便由人工来审核判定都存在差异化，对于人工智能算法而言挑战也就更加显而易见。

对此，知乎认为，除了语义分析，其中非常重要的还要基于用户普遍感受要找到社区的“最大公约数”，让数据标注、用户体验和算法三方的尺度对齐，然后再交由“瓦力”反复学习和训练。

综合三大模型，多维度提升识别准确率

基于此，知乎团队从情感倾向性、亲密关系、文本特征三方面入手，构建了情感模型、用户亲密度模型和文本识别模型三大模型，通过多维度交叉分析的方式对算法进行训练，大大提升了“瓦力”的阴阳怪气识别准确率。

具体是怎么回事？据知乎内容质量管理团队技术负责人刘兆来介绍，首先是通过知乎社区里的举报、反踩等负向用户行为进行收集和标注，为机器提供训练数据；随后在训练中把文本特征、数值特征、反讽词表，以及一些表现符特征等融入到模型中，并通过各种同义替换、规则模版方式对训练数据进行扩展和增强，以缓解训练数据不足的问题。

知乎内容质量管理团队技术负责人刘兆来

与此同时，“瓦力”还会提取文本、句法、表情符等特征，并利用一个带attention的CNN和LSTM融合模型进行分类，最终判断出内容是否为“阴阳怪气”语料。

知乎运营总监孙达云表示，目前“瓦力”对阴阳怪气评论文本的识别准确率已非常接近“社区最大公约数”，能够实现对95%以上违法违规、垃圾广告信息和不友善内容的主动打击、覆盖和筛选，每日可处理内容近万条。

知乎运营总监孙达云

同时，知乎将在近期对该技术进行产品化尝试，向用户提供“瓦力”阴阳怪气智能过滤选项。也就是说，以后当我们回复“瞧把你能的”之类有反讽嫌疑的评论时，就可能被“瓦力”无情处理。当然，为了不影响体验，用户可以自由选择开启或关闭该功能。

具体来说，如今“瓦力”已能实现对“暗藏玄机夸奖”（比如忍不住关注答主了，你的答案很有水平！你博士快毕业了吧！）、“好为人师”（比如我觉得你挺惨，虽然长这么大了，还真应该回小学改造）、“强行反驳”（比如你开心就好、请开始你的表演）等数类阴阳怪气的内容进行识别。当然，孙达云也强调，由算法筛选出来的内容最后还会由人工进行一轮审核，从而避免遗漏或误伤。

“未来我们还会将不断优化‘瓦力’的识别能力，提高模型泛化能力，同时不断迭代更新模型，紧跟学术前沿的同时，适应网络语言的变化潮流，不断提升准确率和召回率，最终将阴阳怪气识别技术全面应用到社区治理中。”

除此之外，刘兆来还指出，知乎接下来将会把AI技术应用去其它场景中，比如对站内数据进行知识图谱的构建、识别图文相关性、实现视频理解等等。

我们看到，截止到今年5月，知乎的注册用户已经达到1.6亿，并收获了超过1亿的回答。在这样庞大的社交平台上，通过人工智能技术的投入，对于解决网络暴力问题、优化互联网社交礼仪是极具意义的。

来源：至顶网软件频道

0赞

好文章，需要你的鼓励

知乎再优化社区管理机器人“瓦力”，挑战反讽语言暴力难题 原创

来源：至顶网软件频道

2018

06/26

12:34

分享

点赞

OpenAI CEO计划投入数万亿美元建设AI基础设施

心理学家和心理健康专家推动使用自定义指令让AI成为治疗辅助工具

HPE焕新品牌战略，进一步拓展中国市场合作伙伴生态

浏览器是智能体AI未来的关键吗？Opera和Perplexity这样认为

福特颠覆传统装配线生产模式 制造低成本美国电动车

研究员将OpenAI开源大语言模型逆向还原为无推理"基础模型"

Asmi Linux 13 Debian版本发布：Xfce桌面焕然一新

英伟达发布大规模AI就绪欧洲语言数据集和工具

企业通用智能将比AGI更快实现商业突破

闪迪重回增长轨道：NAND供应短缺推动营收飙升

"便宜"的开源AI模型实际上在消耗你的计算预算

SK Telecom打造主权AI基础设施，支持韩国国家AI模型开发

最热门的 AI 模型：它们的功能和使用方法

这款古怪的 AI 智能手机可以创建你的数字分身

Faireez 获 750 万美元融资，为租赁市场提供 AI 驱动的酒店式管家服务

Broadcom 大获全胜：70% 大型 VMware 客户购买其最全面解决方案

Peer 获得1050万美元元宇宙引擎投资，推出3D个人星球功能

获 3000 万美元融资，Crogl 发布面向安全分析师的全新 AI "钢铁侠战衣"

Turing 获得 1.11 亿美元融资，估值达到 22 亿美元，为 OpenAI 等大语言模型公司提供关键代码支持

Tavus 推出系列 AI 模型，实现实时人脸交互技术突破

Welevel 获得 570 万美元融资，革新程序化游戏开发

AI 驱动的卓越运营：企业如何通过人人可及的流程智能提升成功

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

IEEE专家委员胡凝：消解AI幻觉“阴影”，洞见“超级个体”价值锚点

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

知乎再优化社区管理机器人“瓦力”，挑战反讽语言暴力难题原创

福特颠覆传统装配线生产模式制造低成本美国电动车