至顶网软件频道消息:12月19日,“2018 AI Challenger全球AI挑战赛”总决赛答辩暨颁奖典礼上传来了好消息: 金山软件集团(以下简称“金山”)旗下AI Lab的两支队伍第一次参加此项大赛,便以黑马姿态一路领先,与来自全球81个国家的企业、高校研发团队经过多轮比拼,最终以大比分优势包揽了本年度AI Challenger“英中文本机器翻译”比赛的冠亚军。
创新工场董事长兼首席执行官李开复与金山办公副总裁姚冬、金山AI Lab负责人李长亮博士合影
AI Challenger旨在“用AI挑战真实世界的问题”,架设了面向全球人工智能人才的开源数据集和编程竞赛平台,致力于推动AI在科研与商业领域结合,打造良性可持续的AI科研与应用新生态。
此次金山派出的两支参赛队伍双双获奖,不仅证明了金山团队在人工智能科技领域的团队实力与创新潜能,还以出色的成绩为金山成立三十周年奉上了一份贺礼。
全球AI挑战赛2018冠军团队合影
机器翻译技术领域 新生力量崛起
机器翻译被誉为自然语言处理领域“皇冠上的明珠”,它能够促进消弭文化隔阂、加强世界交流,使语言不再成为妨碍不同语言文化民众的沟通壁垒。
1954年,IBM启动了“Georgetown-IBM”实验,用一台大型机将60个俄语句子翻译成英文。这项实验被学术界视为历史上首次机器翻译。其后的几十年里,许多科学家不断尝试各种技术思路,如基于样例、基于规则、基于统计等等,机器翻译的研究几经起落,直到基于神经网络、深度学习的机器翻译技术出现,才让“全世界无障碍沟通”的梦想成为可能。
2018 AI Challenger“英中文本机器翻译”赛道上,所有的参赛队伍均可自由选择机器翻译技术,但都需要根据评测方提供的数据,训练自己的机器翻译系统。评测方使用机器翻译的客观考核指标(BLEU、NIST、TER)来评分,其中BLEU是最主要的评估指标。在今年的比赛中,数据总量达到1300万句对,且其中具有上下文情景的中英双语数据达到300万句对,相比去年大幅扩容。
来自金山AI Lab的一支参赛队伍以客观成绩领先其他对手3个BLEU值,答辩成绩超过其他队伍30分的明显优势获得冠军;另一支参赛团队则以优异成绩获得亚军。
第一次参加这样的世界性大赛,就能与斯坦福大学、清华大学、中科院、BAT、科大讯飞、网易等“顶级豪门”同享人工智能盛宴,并且在机器翻译主赛道取得不俗的成绩,这表明,近年来坚决投入AI研发的金山开始逐渐收获回报。机器翻译技术领域,新生力量已然崛起。
金山AI Lab年轻且富于朝气,事实上,团队参与本次比赛的初衷就是用奖项来检验团队能力——2017年5月,由雷总亲自挂帅,金山开始加大在AI领域的研发投入,成立了涵盖图像、语音、语言等多个研究方向的AI团队,汇集了来自中科院、北京大学、墨尔本大学、哈工大等高校的优秀毕业生。金山AI团队在短时间里建立了鲁棒的机器翻译框架,搭建了训练和调优的基础设施,并且配备了强大的底层计算服务能力,最终在本次大赛中全程领跑、一举折桂。
探索核心技术 加速AI落地
百年前,严复先生提出“信达雅”的翻译质量三原则,当前由机器翻译的文字刚刚触及“信”与“达”的层次,还远达不到“雅”的要求,但从实用的角度考虑,机器翻译技术已足以打造出高效、可依赖的跨语言智能辅助翻译服务。今后,金山将努力为WPS、词霸等产品的用户提供稳定的、接近人工水平的翻译,用户将可以体验即时文本转译、同声语音传译等智能服务。
除机器翻译以外,金山AI Lab还在图像、文本、语音等多个方向展开深入探索。金山邀请中科院李长亮博士加盟,主持AI Lab。正是在李博士的带领下,在此次大赛上,几名年轻研究人员才能创新出层次注意力机制、高斯搜索等独特算法,在工程细节、特征提取等方面积累先进经验。目前,金山已为相关算法、技术申请专利,并在国际顶级会议上发表相关论文。与此同时,金山更关注将技术与产品服务深度融合,完成技术落地。目前金山正在探索集成多种人工智能技术,实现人机协作,助力金山办公场景智能化。
周虽旧邦,其命维新。今天,三十岁的金山始终坚持技术立业,不断自我突破转型,不断打造创新产品,服务亿万用户。当前,AI已成为金山的长期战略,公司正全力以赴探索核心技术,寻求持续突破。
金山未来,AI在路上。
好文章,需要你的鼓励
宏碁Aspire 14 AI在Costco售价500美元,成为最便宜的Copilot Plus PC。该笔记本搭载英特尔Lunar Lake处理器,拥有现代化配置而非过时组件。配备16GB内存和1TB固态硬盘,电池续航近19小时。虽然设计和显示屏表现一般,但整体性能出色,AI处理能力达到40万亿次操作每秒,是预算有限用户的优质选择。
CORA是微软研究院与谷歌研究团队联合开发的突破性AI视觉模型,发表于2023年CVPR会议。它通过创新的"区域提示"和"锚点预匹配"技术,成功解决了计算机视觉领域的一大挑战——开放词汇目标检测。CORA能够识别训练数据中从未出现过的物体类别,就像人类能够举一反三一样。在LVIS数据集测试中,CORA的性能比现有最佳方法提高了4.6个百分点,尤其在稀有类别识别上表现突出。这一技术有望广泛应用于自动驾驶、零售、安防和辅助技术等多个领域。
博通公司第三季度业绩超预期,每股收益1.69美元,营收159.6亿美元,同比增长22%。公司获得来自新客户的100亿美元定制AI芯片订单,推动股价在盘后交易中上涨超3%。AI相关营收同比增长63%至52亿美元,预计第四季度将超过62亿美元。公司专注为超大规模云基础设施提供商设计定制芯片,已成为英伟达的主要竞争对手之一,年内股价上涨32%,市值超1.4万亿美元。
中国电信研究院联合重庆大学、北航发布T2R-bench基准,首次系统评估AI从工业表格生成专业报告的能力。研究涵盖457个真实工业表格,测试25个主流AI模型,发现最强模型得分仅62.71%,远低于人类专家96.52%。揭示AI在处理复杂结构表格、超大规模数据时存在数字计算错误、信息遗漏等关键缺陷,为AI数据分析技术改进指明方向。