7月7日,由外交部、国家发展改革委、教育部、科技部、工业和信息化部、国家网信办、中国科学院、中国科协和上海市政府共同主办的2024世界人工智能大会(WAIC 2024)盛大收官。作为中国和全球人工智能前沿技术的重要展示平台,WAIC 2024融汇全球人工智能领域前沿思想,链接全球科技创新生态,持续探索人工智能发展新机遇并推动成果落地。
高质量的训练数据始终是人工智能产业链上的重要一环。自2019年始,澳鹏Appen(中国)已连续6届参与这一人工智能产业盛会,与产业链各环节领袖共商人工智能领域前沿技术、产业动向、向善治理。今年,澳鹏Appen(中国)很荣幸携技术驱动的双平台再次重磅亮相本次大会,展示如何以专业、精准、安全的高质量训练数据赋能AI+,助力各行业、各领域AI模型的高效开发和落地。

WAIC 2024 澳鹏展位前人头攒动
澳鹏大模型智能开发平台
澳鹏大模型智能开发平台支持大模型定制开发的全流程需求,集大模型数据准备、训练、推理、部署应用于一体,提供数据管理、模型调优、模型评估、模型管理等全栈产品,赋能医疗、金融、教育、代码、法律等多垂直领域的大模型部署,助力企业轻松拥抱大模型。

澳鹏大模型智能开发平台支持大模型定制开发的全流程需求
作为大模型产业链的基础环节,澳鹏Appen(中国)支持全栈式大模型数据服务,包括数据集、模型评估、模型调优、标注工具/训练平台部署、领域专家服务等;同时,平台集成的全套标注工具,如大模型智能体标注、多模态数据标注、基于LLM的自动标注能力等,紧跟市场技术前沿,是快速部署大模型应用的利器。

澳鹏支持全栈式大模型数据服务,包括数据集、模型评估、模型调优、标注工具/训练平台部署等
澳鹏提供700+个成品数据集,其中包括五万余小时ASR语音数据,一百六十万余张图片,81亿token、千万词条的大语言模型相关文本数据集。澳鹏多模态、多领域、多场景的丰富数据集可高效支持各类模型的各阶段训练。

澳鹏MatrixGo®高精度数据标注平台
持续优化数据精度是人工智能算法提升的关键。澳鹏MatrixGo®平台集成强大的标注工具箱和灵活、可视的工作流,具备多样化的平台部署方式和精细化的人力资源管理。AI行业领军者正在通过MatrixGo®平台强大的标注工具,大幅提升非结构化数据处理能力,赋能全球创新性AI项目部署。
澳鹏MatrixGo®高精度数据标注平台大幅提升非结构化数据处理能力
澳鹏MatrixGo®平台自动化数据标注回环,具备场景筛选 + 数据挖掘能力,为下游提供高质量预标注结果;通过引入交互式智能标注工具,人机协同提高标注效率;可自定义的自动化质检,实时反馈异常标注数据;动态迭代的模型推理能力,不断提升自动识别准确率,真正做到“以AI赋能AI”。

澳鹏MatrixGo®平台自动化数据标注回环
除了技术水平之外,澳鹏全球化的数据采集能力和多场景、定制化的数据标注服务是客户满意度的保障。澳鹏支持全数据类型的标注,包括大模型、图像视频、3D、语音、文本及内容相关性的标注;在全球范围拥有290+语言资源及100万+众包团队,澳鹏全球化的数据定制采集服务为AI部署提供数据保障。
数据,铸就非凡差异。一直以来,澳鹏Appen(中国)始终致力于以高质量的数据服务及持续不断的技术研发为全球领先人工智能的部署提供动力源泉。澳鹏Appen全球高级副总裁、大中国区及北亚区总经理田小鹏博士表示,“未来,澳鹏将持续以不断迭代的端到端数据平台、灵活高效的数据服务以及深厚的细分领域专业知识,铸就全球非凡的人工智能应用开发和落地,打造专业、精准、安全的高质量数据基石。”
好文章,需要你的鼓励
Allen AI研究所联合多家顶尖机构推出SAGE智能视频分析系统,首次实现类人化的"任意时长推理"能力。该系统能根据问题复杂程度灵活调整分析策略,配备六种智能工具进行协同分析,在处理10分钟以上视频时准确率提升8.2%。研究团队创建了包含1744个真实娱乐视频问题的SAGE-Bench评估平台,并采用创新的AI生成训练数据方法,为视频AI技术的实际应用开辟了新路径。
联想推出新一代NVMe存储解决方案DE6600系列,包含全闪存DE6600F和混合存储DE6600H两款型号。该系列产品延迟低于100微秒,支持多种连接协议,2U机架可容纳24块NVMe驱动器。容量可从367TB扩展至1.798PiB全闪存或7.741PiB混合配置,适用于AI、高性能计算、实时分析等场景,并配备双活控制器和XClarity统一管理平台。
中科院团队首次系统评估了AI视觉模型在文本压缩环境下的理解能力,发现虽然AI能准确识别压缩图像中的文字,但在理解深层含义、建立关联推理方面表现不佳。研究通过VTCBench测试系统揭示了AI存在"位置偏差"等问题,为视觉文本压缩技术的改进指明方向。