7月7日,由外交部、国家发展改革委、教育部、科技部、工业和信息化部、国家网信办、中国科学院、中国科协和上海市政府共同主办的2024世界人工智能大会(WAIC 2024)盛大收官。作为中国和全球人工智能前沿技术的重要展示平台,WAIC 2024融汇全球人工智能领域前沿思想,链接全球科技创新生态,持续探索人工智能发展新机遇并推动成果落地。
高质量的训练数据始终是人工智能产业链上的重要一环。自2019年始,澳鹏Appen(中国)已连续6届参与这一人工智能产业盛会,与产业链各环节领袖共商人工智能领域前沿技术、产业动向、向善治理。今年,澳鹏Appen(中国)很荣幸携技术驱动的双平台再次重磅亮相本次大会,展示如何以专业、精准、安全的高质量训练数据赋能AI+,助力各行业、各领域AI模型的高效开发和落地。

WAIC 2024 澳鹏展位前人头攒动
澳鹏大模型智能开发平台
澳鹏大模型智能开发平台支持大模型定制开发的全流程需求,集大模型数据准备、训练、推理、部署应用于一体,提供数据管理、模型调优、模型评估、模型管理等全栈产品,赋能医疗、金融、教育、代码、法律等多垂直领域的大模型部署,助力企业轻松拥抱大模型。

澳鹏大模型智能开发平台支持大模型定制开发的全流程需求
作为大模型产业链的基础环节,澳鹏Appen(中国)支持全栈式大模型数据服务,包括数据集、模型评估、模型调优、标注工具/训练平台部署、领域专家服务等;同时,平台集成的全套标注工具,如大模型智能体标注、多模态数据标注、基于LLM的自动标注能力等,紧跟市场技术前沿,是快速部署大模型应用的利器。

澳鹏支持全栈式大模型数据服务,包括数据集、模型评估、模型调优、标注工具/训练平台部署等
澳鹏提供700+个成品数据集,其中包括五万余小时ASR语音数据,一百六十万余张图片,81亿token、千万词条的大语言模型相关文本数据集。澳鹏多模态、多领域、多场景的丰富数据集可高效支持各类模型的各阶段训练。

澳鹏MatrixGo®高精度数据标注平台
持续优化数据精度是人工智能算法提升的关键。澳鹏MatrixGo®平台集成强大的标注工具箱和灵活、可视的工作流,具备多样化的平台部署方式和精细化的人力资源管理。AI行业领军者正在通过MatrixGo®平台强大的标注工具,大幅提升非结构化数据处理能力,赋能全球创新性AI项目部署。
澳鹏MatrixGo®高精度数据标注平台大幅提升非结构化数据处理能力
澳鹏MatrixGo®平台自动化数据标注回环,具备场景筛选 + 数据挖掘能力,为下游提供高质量预标注结果;通过引入交互式智能标注工具,人机协同提高标注效率;可自定义的自动化质检,实时反馈异常标注数据;动态迭代的模型推理能力,不断提升自动识别准确率,真正做到“以AI赋能AI”。

澳鹏MatrixGo®平台自动化数据标注回环
除了技术水平之外,澳鹏全球化的数据采集能力和多场景、定制化的数据标注服务是客户满意度的保障。澳鹏支持全数据类型的标注,包括大模型、图像视频、3D、语音、文本及内容相关性的标注;在全球范围拥有290+语言资源及100万+众包团队,澳鹏全球化的数据定制采集服务为AI部署提供数据保障。
数据,铸就非凡差异。一直以来,澳鹏Appen(中国)始终致力于以高质量的数据服务及持续不断的技术研发为全球领先人工智能的部署提供动力源泉。澳鹏Appen全球高级副总裁、大中国区及北亚区总经理田小鹏博士表示,“未来,澳鹏将持续以不断迭代的端到端数据平台、灵活高效的数据服务以及深厚的细分领域专业知识,铸就全球非凡的人工智能应用开发和落地,打造专业、精准、安全的高质量数据基石。”
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。