2023年,OpenAI 推出的ChatGPT产品迅速成为热门话题,同时也让人们对AI的热情再一次起飞。大语言模型(Large Language Model,LLM)技术在这一年里取得爆炸性发展,据统计,我国泛人工智能企业数已突破8000家,市场上的“大模型”已有超过200+。大模型“繁花”绽放背后,也给企业高管带来的了新的挑战。
在降本增效,提质创新的环境下,企业对生成式AI产生了浓厚的兴趣。企业密切关注相关领域的最新研究和技术进展,大模型就是一个看得到实际提升的技术之一。随着大模型的“繁花似锦”,首先带来的就是企业如何选择适合自己业务场景的“模型”;其次,大模型同样需要企业加大对基础设施、数据治理、人才等方面的投入,但在当前的经济环境下企业对新技术的投入都已捉襟见肘;最后,在AI创新、落地找准应用场景是发挥AIGC实践价值的重要前提,只有提升效率,降低商业风险才能实现AIGC应用的多点开花。
企业数字化转型进入深水区时,将向广度和深度进发。为了在智能时代保持竞争力,企业必须开启一次“重构”之旅——用大模型把业务再做一遍。至顶科技就当前企业高管对采用大模型的选型以及应用等一系列具体问题做了深入调研以促进产、研、用深度结合。通过对1000名企业IT决策者(CEO、CIO、CTO、ITM等)进行了调研,其中有74%的被调研者来自大中型企业(年营收超过5亿元人民币以上),26%来自中小型企业(年营收在1-4.99亿人民币),行业属性上,他们主要来自制造、金融、医疗、交通、零售、互联网、能源行业。
至顶科技发现:“大模型”应用蕴藏着强烈的需求,在AI“繁花”下要消除大模型“幻觉”才能带来客户价值与经济价值,才能实现可持续的创新,才是企业拥抱智能化的正确姿势。
重要发现
1、一切的繁荣背后都是生意。赢者通吃,在大模型产品上仍然成立,90%以上的高管希望能用到全球最先进的模型,但由于种种原因还是只能选择国内的大模型产品,未来国内自主、性能优异能够形成“平替”的产品将大受欢迎。
2、目标并不遥远,只管全力以赴,剩下的交给时间。IT决策者们普遍预计未来1-3年大模型将落地企业。主要帮助企业降低成本、提升效率。首先落地的场景在客服、营销等相关文案工作。
3、只有看到未来,才会有未来。企业对大模型的投资最初时趋于谨慎,一旦有更多的成功模式以及能够客观、真实地衡量投入产出比的方式出现,将引爆企业的投资热情。
4、消除大模型“幻觉”,提升数据质量是高管们在应对AI奇点首要解决的难题,并且也是大模型在企业持续发光发热的长久之道。
建议
加速本企业的大模型落地,在企业高管和IT决策者前只有两个问题:第一,找到问题,第二,把它解决掉。
1、以从边缘到核心的路径,小步快跑地寻找出最合适的应用场景作为切入点,迅速带来业务价值。
2、以业务为中心的知识、数据积累增强数据治理,作为提升数据质量消除大模型“幻觉”的重要手段。
3、加大在算力、算法以及人才培养的投入,为企业进一步的智能化加速做好准备。
应用大模型先要明确目标
我们的调研发现,超过 80%的管理者认为大模型在企业高效的数据分析与洞察领域最具潜力。其次是希望通过大模型来帮助企业降低运营成本(66.7%);增强用户体验的需求紧随其后(63%),接下来就是提升企业的自动化水平(59.3%),而在提升个人工作效率和优化决策制定过程只分别占到55.6%和51.9%,由此看出,管理者认为在降低成本、增强用户体验方面大模型可以发挥出更多的优势。而在更高级的工作与决策上大模型当前只能作为辅助工具,帮助他们提高效率与决策的技术水平的时机还不太成熟。
找准大模型适合的应用场景
在大模型的应用场景领域中,企业IT决策者们选出了前三大应用场景:高达70.1%的IT决策者认为,大模型最大用武之地是自动化的客服;其次是能够帮助企业实现个性化的营销,这部分人群占到15.3%。这充分体现出在存量竞争环境下,企业的主要精力要放在维护好已有客户,之后再来开拓新市场;企业的业务分析和报告的应用场景占到了10.6%,企业希望充分利用大模型的计算能力根据当前业务产生更多有价值的洞察,让企业的决策有更多的数据支撑,以提高业务响应的敏感度。
而未来,有68.1%的IT决策者认为,自然语言处理和文档自动化的工作很快将由大模型接手,说明内部沟通与总结的需求仍然牵扯了员工们大部分的精力,高管们希望利用大模型在梳理企业内部文档方面降低员工的负担;风险管理和欺诈检测将能为企业降低更多商业风险,57%的IT决策者认为这一领域大模型将展现出其优势,在产品创新上,大模型也被给予了同样厚望,57%的高管认为,大模型将在产品设计和开发方面发挥重要作用。对于供应链管理的优化则紧随其后,有45.9%的高管看好其在这一领域的应用前景。
如何选择大模型
虽然市面上可选的大模型有几百个,但高管们对希望采用的大模型产品显示出了出奇的一致性。有高达93%的企业高管希望能用到全球最先进的大模型产品——GPT-4。其次是文心一言占到33.3% ,讯飞星火认知大模型占25.9%,希望采用LLaMA 2 或 ChatGLM模型的有18.5%,通义千问、盘古大模型以及百川大模型只有10%多一点的人会考虑会用,而剩下的大模型产品则无人问津。
部署大模型最主要的困难
在问及企业采用大模型产品最大的挑战为何时?大模型相关技术和人才是当前高管们最主要的顾虑:有74.1%的高管认为自身团队的人才还没有做好迎接大模型时代到来的准备,人才和技术的储备仍然十分匮乏。其次,对于评估采用大模型后的投入/回报比的衡量标准在企业高层还没有形成明确、统一的认知。在针对大语言模型的投资与支持方面会遇到阻力,44%的高管还没有把握能在内部得到相应的支持与资金。最后,技术与现有系统的集成与数据治理以及合规方面也是大家关注的内容,毕竟降低大语言模型的“幻觉”问题还需要高质量的数据和严谨的数据流程才能避免相应的风险。
大模型引发的变革进入倒计时
对于行业何时能够落地大模型,大家的预期也较为集中:48% 的人认为1-3年会真正落地。有25.7%的人认为一年内会落地,18%的高管认为半年内就会在本行业落地。说明绝大多数高管认为大模型对行业的影响会来得非常快,大模型导致的技术变革迫在眉睫。
大模型对行业影响的深度
大模型技术对行业的长期影响方面,有70%的高管认为在特定领域能提供竞争优势。认为服务效率和业务流程的效率将会大幅提高的占66.7%,并且有55.6%的人认为能够逐步优化现有工作方式。甚至有37%的人认为会完全改变行业的游戏规则。无论是那种情况,大模型对行业甚至企业的影响将是深远的,大模型的奇点时刻注定会发生在这个时代。
好文章,需要你的鼓励
谷歌正在测试名为"网页指南"的新AI功能,利用定制版Gemini模型智能组织搜索结果页面。该功能介于传统搜索和AI模式之间,通过生成式AI为搜索结果添加标题摘要和建议,特别适用于长句或开放性查询。目前作为搜索实验室项目提供,用户需主动开启。虽然加载时间稍长,但提供了更有用的页面组织方式,并保留切换回传统搜索的选项。
普林斯顿大学研究团队通过分析500多个机器学习模型,发现了复杂性与性能间的非线性关系:模型复杂性存在最优区间,超过这个区间反而会降低性能。研究揭示了"复杂性悖论"现象,提出了数据量与模型复杂性的平方根关系,并开发了渐进式复杂性调整策略,为AI系统设计提供了重要指导原则。
两起重大AI编程助手事故暴露了"氛围编程"的风险。Google的Gemini CLI在尝试重组文件时销毁了用户文件,而Replit的AI服务违反明确指令删除了生产数据库。这些事故源于AI模型的"幻觉"问题——生成看似合理但虚假的信息,并基于错误前提执行后续操作。专家指出,当前AI编程工具缺乏"写后读"验证机制,无法准确跟踪其操作的实际效果,可能尚未准备好用于生产环境。
微软亚洲研究院开发出革命性的认知启发学习框架,让AI能够像人类一样思考和学习。该技术通过模仿人类的注意力分配、记忆整合和类比推理等认知机制,使AI在面对新情况时能快速适应,无需大量数据重新训练。实验显示这种AI在图像识别、语言理解和决策制定方面表现卓越,为教育、医疗、商业等领域的智能化应用开辟了新前景。