商汤科技在本周六(12月16日)的一份声明中表示,创始人汤晓鸥于周五晚去世。商汤科技表示,汤教授因病救治无效。“汤教授的智慧、激情和对科学永无休止的探索,将永远激励我们不忘初心、砥砺前行。他制定的公司使命‘坚持原创,让人工智能引领人类进步’将激励所有商汤人,勇攀高峰,去完成他未竟的事业。”
1996年汤晓鸥获得麻省理工学院计算机视觉博士学位之后在香港中文大学任教。2014 年汤晓鸥与两位博士同学徐丽和徐冰共同创立了商汤科技。
汤教授被认为是最有影响力的人工智能科学家之一。汤教授是IEEE Fellow,2009年IEEE国际计算机视觉会议(ICCV)程序主席,2019年ICCV总主席。担任International Journal of Computer Vision杂志主编。计算机视觉(IJCV),计算机视觉领域的两大领先期刊之一。汤教授于2009年获得IEEE计算机视觉与模式识别会议(CVPR)最佳论文奖。他在面部识别方面的工作成为第一个超越人类表现的面部识别算法。该作品于2015年在最负盛名的人工智能会议之一 AAAI 上荣获杰出学生论文奖。
商汤科技是国内著名的一家人工智能软件公司。拥有深厚的学术积累,并长期投入于原创技术研究,不断增强行业领先的多模态、多任务通用人工智能能力,涵盖感知智能、自然语言处理、决策智能、智能内容生成等关键技术领域,同时包含AI芯片、AI传感器及AI算力基础设施在内的关键能力。
商汤前瞻性打造新型人工智能基础设施——商汤AI大装置SenseCore,打通算力、算法和平台,并在此基础上建立“商汤日日新SenseNova”大模型及研发体系,以低成本解锁通用人工智能任务的能力,推动高效率、低成本、规模化的AI创新和落地,进而打通商业价值闭环,解决长尾应用问题,引领人工智能进入工业化发展阶段。
商汤科技业务涵盖智慧商业、智慧城市、智慧生活、智能汽车四大板块。
商汤科技成立十年以来面临着诸多挑战。2019年被列入美国贸易黑名单黑名单,在获取美国供应和技术方面面临限制。2021年,就在该公司上市之前,美国将其列入了投资黑名单。
2021年12月成功首次公开募股后,曾多次遭受做空机构狙击。
2023年至今,商汤联合多家国內頂尖科研机构,投入了约10000张GPU在大语言模型的研发并获得了巨大进展:今年6月,首个综合能力超越GPT-3.5-turbo的大模型InternLM发布,参数量1040亿,使用1.6 万亿token的多语言语料训练,支持语言达20多种,并在此基础上于7月初发布了“商量SenseChat 2.0”。
今年8月,新模型InternLM-123B完成训练,新模型参数量提升至1230亿。新模型的语言、知识、理解、推理和学科五大能力均显著提高。InternLM-123B模型在全球51个知名评测集(包括 MMLU, AGIEval,ARC,C-Eval,RACE,GSM8K 等)共计30万道问题集合上测试成绩排名全球第二,超过GPT-3.5-turbo以及Meta新发布的LLaMA 2-70B等模型。
InternLM-123B不仅生成的内容 更加准确、可靠,可在复杂场景中进行多步推理 和计算,还具备了自主反思及修正错误的能力。 InternLM-123B也重点升级了代码解释器及插件调 用能力(function calling),可使用python解释器、API调用和搜索三类常用工具来解决复杂任务、灵 活搭建AI智能体应用。在此基础上商量SenseChat 已升级到3.0版本。
2023年上半年,商汤的生成式AI相关收入获得了670.4% 的同比增长,对集团业务的贡献从2022年的10.4%迅速提 升至20.3%。
截至2023年6月30日止六个月,收入为人民币 1.433亿元人民币;毛利率为45.3%。
此外,商汤科技还积极推进AI传感器与AI ISP芯片量产交付以及大模型进入手机终。得益于AI SDK、AI传感器、AI ISP芯片三位一体的战略,商汤科技的智能终端业务在今年全球手机行业下行的市况下展现出较好韧性。
商汤科技的计算器视觉算法通过SDK软 件、AI传感器、AI ISP持续量产至数亿台手机,市场持续渗透。同时,大语言模型的突破带来了“手机端AI助理”和“基于自然语言交互的AI操作系统”的机遇,成为手机行业新热点。
商汤科技基于InternLM的轻量级模型,结合自研推理加速算法,已与两家头部手机芯片厂商建立了研发合作,成功实现了大语言模型的手机端实时计算能力。当前正在积极与多家手机厂商客户合作,研发大语言模型与手机操作系统结合的新功能。
好文章,需要你的鼓励
OpenAI在最新博客中首次承认,其AI安全防护在长时间对话中可能失效。该公司指出,相比短对话,长对话中的安全训练机制可能会退化,用户更容易通过改变措辞或分散话题来绕过检测。这一问题不仅影响OpenAI,也是所有大语言模型面临的技术挑战。目前OpenAI正在研究加强长对话中的安全防护措施。
北航团队推出VoxHammer技术,实现3D模型的精确局部编辑,如同3D版Photoshop。该方法直接在3D空间操作,通过逆向追踪和特征替换确保编辑精度,在保持未修改区域完全一致的同时实现高质量局部修改。研究还创建了Edit3D-Bench评估数据集,为3D编辑领域建立新标准,展现出在游戏开发、影视制作等领域的巨大应用潜力。
谷歌宣布计划到2026年底在弗吉尼亚州投资90亿美元,重点发展云计算和AI基础设施。投资包括在里士满南部切斯特菲尔德县建设新数据中心,扩建现有设施,并为当地居民提供教育和职业发展项目。弗吉尼亚州长表示这项投资是对该州AI经济领导地位的有力认可。此次投资是谷歌北美扩张战略的一部分。
宾夕法尼亚大学研究团队开发出PIXIE系统,这是首个能够仅通过视觉就快速准确预测三维物体完整物理属性的AI系统。该技术将传统需要数小时的物理参数预测缩短至2秒,准确率提升高达4.39倍,并能零样本泛化到真实场景。研究团队还构建了包含1624个标注物体的PIXIEVERSE数据集,为相关技术发展奠定了重要基础,在游戏开发、机器人控制等领域具有广阔应用前景。