ZD至顶网软件频道消息:百度公司正准备将硅谷内对于人工智能人才的争夺提升至新的层次——不过中国技术巨头最近刚刚失去了其首席科学家兼机器学习专家Andrew Ng。
作为全球最大中文搜索引擎的所有者,百度公司于上周五公布计划在桑尼维尔开设研究机构,旨在寻求新的方法以利用神经网络并开发自动驾驶车辆软件。根据彭博社的报道,该园区所在位置距离百度目前位于硅谷的AI中心只有一英里远——后者于2013年建成,并随着一年后Ng的入驻而迎来新一轮规模扩展。目前这里拥有约200名工程师,并被百度视为自动驾驶车辆技术的重点研发区域。
作为规模扩张工作的一部分,这两座设施将在微软公司亚洲研究院前任部门负责人张亚勤(Ya-qin Zhang)的领导下进行。其在新角色上面临的最大挑战在于如何为第二座百度AI研发中心招募必要的约150名AI技术专家,特别是考虑到其它技术巨头对于此类专业人士的旺盛需求。目前人才市场对于此类从业者的争夺相当激烈,迫使中国搜索巨头甚至不得不对在职员工进行挖角。
就在上周,中国网络巨头腾讯控股公司披露称,其已经成功拉拢到原百度大数据实验室机器学习专家张潼引领腾讯方面的AI部门。而就在张潼离职后一周,搜索巨头再次失去另一位杰出成员:Andrew Ng——这位业界大牛在加入百度之前曾作为斯坦福大学与谷歌公司的自动语音与图像识别领域先驱。
当然,中国搜索巨头绝不是惟一一家遭遇AI人才短缺问题的企业。Facebook公司一直在积极对竞争对手旗下的研究人员开展猎头,并着手为现有员工提供技术培训以填补招聘工作中的空白。百度公司最近亦开始加强自身人才招聘工作,根据报道指出,其甚至愿意为乐于前往中国的科技人员提供高达15%的加薪——很明显,中国的AI人才短缺问题较美国更为显著。
其它技术巨头亦开始着眼于硅谷之外特色人才。微软公司最近亦宣布计划在蒙特利尔建立新的研究中心,因为这里比其它城市拥有更多深度学习研究人员。
好文章,需要你的鼓励
中国AI公司DeepSeek发布旗舰语言模型V3.1更新版,该模型已针对新一代国产芯片进行优化。新模型采用UE8M0数据类型训练,为即将发布的国产芯片做准备。V3.1统一了"思考"和"非思考"模式,单一模型支持两种范式,上下文窗口从65536扩展至131072个token,在工具调用能力上显著提升,Browsecomp基准测试得分从8.9提升至30。
KAIST研究团队提出黎曼扩散语言模型(RDLM),通过将文字映射到几何空间实现连续建模,解决了传统扩散模型在文本生成中的"跳跃"问题。该方法在多项测试中超越现有扩散模型,接近自回归模型性能,并支持并行生成和跨领域应用,为AI文本生成技术开辟了新方向。
VAST Data发布SyncEngine通用数据目录和高性能导入解决方案,能够发现、编目并捕获其他供应商存储系统中的文件和对象数据,将其导入VAST的AI专用系统。该工具提供跨文件系统、对象存储和SaaS应用的实时可搜索目录,使数PB到EB级数据集中的数万亿文件瞬间可被发现,消除了分布式非结构化数据集发现和调动的障碍。
谷歌DeepMind团队开发了革命性的WeatherFormer天气预测模型,这是首个能够同时处理多种天气预测任务的通用AI系统。该模型通过学习全球海量天气数据,掌握了天气系统的基本规律,然后可以快速适应各种具体预测需求。相比传统需要为每个任务单独训练模型的方法,WeatherFormer展现出显著的效率和精度优势,有望为农业、灾害防控、能源管理等领域提供更准确便捷的天气预测服务。