至顶网软件频道消息:5月18日,在美国加州山景城,Google I/O 2017拉开帷幕。Google CEO Sundar Pichai表示,Google公司的战略正在从“移动为先”转为“人工智能为先”。而从今年大会上发布的一系列产品和更新中,Google用行动阐述了它的态度:流水的产品,铁打的人工智能!
Google I/O大会是Google公司一年一度的开发者大会,讨论的焦点是用Google和开放网络技术开发网络应用。Google I/O 寓为“开放中创新”(Innovation in the Open),因此,谷歌一向喜欢在I/O开发者大会上公布各种重大创意,例如Android Wear、Google Glass、Google Assistant等。
不过,今年的大会一改以往求新求突破的风格,产品的发布更是没有特别惊人的爆点,这届大会的重点更像是在去年的基础上进行升级。
Pichai表示,Android 设备月活跃用户刚刚突破了 20 亿;YouTube 不仅有着 10 亿用户,更有着长达 10 亿小时的日播放时长;Google 地图日导航里程超 10 亿公里。但若是没有了计算机向移动设备转变的大潮流,这一切的增长都将是不可能实现的。这也让 Google 开始重新思考对产品的改造,以适应新型的交互模式,例如多点触控。
如今,计算机又面临着新的转变:从移动优先转变为人工智能优先。和以前一样,Google 将会努力构想一个能够进行更加自然、无缝的技术交互的世界。如 Google 搜索,它是被建立在对文本和页面的理解能力的基础上的。而现在,通过深度学习技术的革新,机器对图像、照片和视频的理解也逐渐成熟,这在以往都是不能实现的。现在,你的相机有了“视觉”,你能对手机说话,并得到回应——语音与图像对于计算机技术来说已经变得意义重大,其重要性甚至渐渐等同于键盘和多点触控。
在以上提到的诸多 AI 新进展中,Google Assistant 就是一个很好的例子。它已经能够在 1 亿个设备上运行,并且日益发挥更大的作用。现在,Google Home 已经可以辨别不同的声音,从而让用户在与设备互动时能够获得更个性化的体验。与此同时,智能手机的相机功能也可以帮助用户完成许多工作。 Google Lens 是一组基于视觉的计算功能,可以识别用户正在查看的内容,并帮助用户根据该信息采取行动。例如,用户趴在朋友家的地板上查看在路由器背面冗长且复杂的Wi-Fi密码。现在,用户的手机就可以识别该密码,并在察觉到用户登录该 Wi-Fi 的需求后自动完成登录。最关键的是,用户不需要事先通过学习来实现此功能 -人机交互体验比在智能手机上完成跨应用程序的复制和粘贴更为直观。Google 首先将会在 Google Assistant 和 Google Photots 中启用 Google Lens 功能,用户也可以期待在其他产品中使用 Google Lens.
所有的这一切都需要相应的计算架构。去年的 I/O,Google 发布了第一代 TPUs,这使得 Google 的机器学习算法能够更快更有效地运行。今天,Google 发布了下一代 TPUs-Cloud TPUs,新版的 TPUs 针对推理和训练进行了优化并且可以处理大量信息。Google 将把 Cloud TPUs 引入 Google Compute Engine,以便公司和开发人员更好地使用。
Google 致力于将日新月异的技术投入应用,使其能更好地为每个人服务,而不只是服务于 Google 产品的用户。 Google 相信,如果科学家和工程师可以拥有更好的计算机工具,创造出更强大的研究成果,那么复杂社会问题的解决将有巨大的突破。然而,目前看来要实现这样的突破,还面临着很多的障碍。
这就是 Google.ai 的创立初衷。它聚合了 Google 在人工智能领域做的所有努力,从而减少了研究过程中的障碍,并提升了研究人员、开发者以及公司在这一领域的工作效率。
Google 希望通过简化神经网络的机器学习模型的设计,降低人工智能的门槛。如今,设计神经网络是极其耗费时间的,其对专业知识的极高要求大大缩小了适用人群,只有科研人员和工程师才有机会接触到。这就是 Google 创造 AutoML 的原因,AutoML 表明神经网络设计神经网络也是可以实现的。Google 希望 AutoML 能拥有现在一些博士所具备的能力,在三到五年内使众多的开发者也能通过 AutoML 设计神经网络,来满足其特定的需求。
除此之外,Google.ai 已经与 Google 的研究人员、科学家以及开发者们进行合作,来解决各个领域的问题,并取得了前景广阔的结果。例如,使用机器学习来改进检测乳腺癌扩散到相邻淋巴结的算法。Google 也看到了人工智能在运算速度以及准确性上的巨大飞跃,使研究人员可以对分子性质进行预测,或是进行人类基因组排序。
此次转型不仅与建设未来设备和进行前沿研究有关,Google 同时也认为,它可以在此刻帮助数以百万计的民众,以普及化的渠道获取信息以及接触到新机会。例如,接近半数的美国雇主声称他们存在招募员工、填补职位方面的问题和困难;而另一方面,待业的雇员也时常对于就在身边的空闲职位毫不知情,因为这些工作的特点——高流动低业务量、与职位名称不符,使得搜索引擎很难准确的筛选这些工作。
而通过新启用的 Google for Jobs,Google 希望能帮助公司联系潜在的雇员,也帮助民众找到新的工作机会。在接下来的几周中,Google 将在“搜索”里加入新功能,从而帮助人们寻找跨越不同经验需求和不同工资水平的工作,包括在传统意义上很难分类和搜索的工作,比如服务和零售岗位。
Google 欣喜的看到,人工智能终于结出了每个人均可品尝享用的硕果。倘若 Google 能让人工智能技术越来越便捷地为民众所用——无论是在工具层面,还是应用方式层面——那么,所有人都会更快地从人工智能技术中获益。
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。