至顶网软件频道消息:最近的一项研究表明,看到机器抢走任务会让人类员工士气低落。这项研究是由康奈尔和耶路撒冷的希伯来大学(Cornell and Hebrew University of Jerusalem)的研究人员进行的,旨在通过一系列游戏研究人类是如何对抗机器的。(Dan Robitzski对结果进行了很好的总结。)
正如一位研究参与者(人类)所说:“与机器人竞争我感到非常有压力。在一些回合中,我一直看到机器人的分数越来越高,这让我感到非常神经紧张。”
关键是帮助员工获得舒适感,提供培训让他们准备好与人工智能系统协作。企业领导者希望他们的员工在工作中接受人工智能,因为公司对人工智能有很大的计划——并且希望它最终能够扩展——而不是取代——人类员工的能力。埃森哲研究所最近对1,200名商业领袖和14,000名工人进行的一项研究表明,人工智能将为人们的日常工作带来重大变化,从根本上重新定义或重新设计他们目前的工作岗位。接受调查的高管中有近一半(46%)的人表示,由于机器承担了日常任务,而且人们转向基于项目的工作,“传统的职位描述已经过时”。29%的最先进的人工智能公司的负责人表示,他们已经对工作进行了大量重新设计。
埃森哲的调查发现,近四分之三的高管(74%)计划在未来三年内使用人工智能将任务自动化的可能性“大”或“非常大”。与此同时,几乎所有人(97%)也表示其目的是提高工人的能力。他们设想他们的员工能与智能机器进行富有成效的合作。
埃森哲的报告作者Ellyn Shook和Mark Knickrehm表示,与此同时,高管们低估了员工获得相关技能的意愿。平均而言,高管们认为只有约四分之一(26%)的员工“准备好采用人工智能”,并将员工的抵制视为一个主要障碍。然而,从工人的角度来看,68%的高技能员工和近一半(48%)的低技能员工对人工智能对他们的工作的影响持肯定态度。总体而言,67%的员工认为发展与人工智能协同工作的技能非常重要。
因此,高管们乐观地认为人工智能会改善工作,但似乎并没有完全理解他们的员工希望开始学习如何与人工智能协同工作。为了解决这种脱节问题,Shook和Knickrehm提供了以下建议:“重新构想工作”,并在即将到来的人工智能时代推动员工队伍:
不断评估任务和技能,而不是工作。“公司需要确定必须执行的新任务” ,并“将这些任务分配给人类员工或机器”。这样的努力正在进行中,并且需要不断进行重新评估,“一些公司发现他们需要纠正他们对机器的初始工作分配。毕竟,许多人工智能系统不是完全自动化的,需要人类的大量输入和调整。”
创建新角色。Shook和Knickrehm表示,这是至关重要的,因为“人工智能使人们能够承担更高价值的工作。”他们表示:“运营工作将变得更具洞察力和战略性,而单一技能角色将变成多技能。”例如,“消费者品牌将越来越依赖人工智能聊天机器人在大众市场中代表他们。人格培训师将被要求为不同情况开发适当的语调、幽默感和同理心。医疗保健人工智能代理面对患者所需要的敏感度与面对杂货顾客的超市人工智能代理不同。”
将技能映射到新角色。埃森哲的作者表示,在许多情况下,那些工作角色被自动化取代的员工可以从事更高价值的工作,埃森哲的作者们表示:“使用人工智能和其他技术为客户提供更明智的服务。”他们表示:“接收订单处理和应付账款收款。埃森哲的一个客户已经生成了人类-人工智能混合劳动力,其中算法可以预测哪些订单存在问题,例如取消或支付纠纷的风险。因此,员工可以花更多时间关注高风险的情况并用积极主动的方式应对可能出现的负面结果。这种方法需要培训人员,帮助他们培养一系列专业知识和能力——从行业知识到分析和数据解释,再到以新方式与客户合作所需的软技能。”
需要优先考虑发展的技能。在埃森哲的调查中,有效部署人工智能的最重要技能包括资源管理、领导力、沟通、复杂的问题解决和判断/决策。Shook和Knickrehm表示:“对于与人工智能合作来说,需要的最有价值的人类技能将是在机器无能为力的时候,干预、制定或纠正决策所需的判断技能。”
应用数字化学习体验。这些作者表示:“数字学习方法,如虚拟现实和增强现实技术,可以提供真实的模拟,帮助工人掌握新的手工任务,使他们可以使用智能机器。”
好文章,需要你的鼓励
这项研究介绍了VisCoder,一个经过专门微调的大语言模型,用于生成可执行的Python可视化代码。研究团队创建了包含20万样本的VisCode-200K数据集,结合了可执行代码示例和多轮修正对话。在PandasPlotBench基准测试中,VisCoder显著优于同等规模的开源模型,甚至在某些方面超越了GPT-4o-mini。研究还引入了自我调试评估模式,证明了反馈驱动学习对提高代码可执行性和视觉准确性的重要性。
这项研究提出了"适应再连续学习"(ACL)框架,一种创新的方法解决预训练模型在连续学习中的稳定性-可塑性困境。通过在学习新任务前先对模型进行适应性调整,ACL使模型既能更好地学习新知识(提高可塑性),又能保留已有知识(维持稳定性)。实验证明,该框架能显著提升各种连续学习方法的性能,为解决人工智能系统中的"灾难性遗忘"问题提供了有效途径。
这篇研究首次关注了CLIP模型文本编码器的对抗鲁棒性问题,提出了LEAF方法(Levenshtein高效对抗性微调)来增强文本编码器的稳健性。实验表明,LEAF显著提高了模型在面对文本扰动时的性能,在AG-News数据集上将对抗准确率从44.5%提升至63.3%。当集成到Stable Diffusion等文本到图像生成模型中时,LEAF显著提高了对抗噪声下的生成质量;在多模态检索任务中,它平均提高了10个百分点的召回率。此外,LEAF还增强了模型的可解释性,使文本嵌入的反演更加准确。
BenchHub是由韩国KAIST和Yonsei大学研究团队开发的统一评估平台,整合了38个基准中的30万个问题,按技能、学科和目标类型进行精细分类。研究显示现有评估基准存在领域分布偏差,而BenchHub通过自动分类系统和用户友好界面,让用户能根据特定需求筛选评估数据。实验证明模型在不同领域的排名差异巨大,强调了定制化评估的重要性。该平台支持多语言扩展和领域特化,为研究人员和开发者提供了灵活评估大语言模型的强大工具。