英伟达(Nvidia)首席执行官黄仁勋身着标志性黑色皮夹克本周二在美国佛罗里达州奥兰多的 Gartner IT 研讨会/XPO 大会上发表了备受瞩目的主题演讲,他在演讲中谈论了一系列的领导力话题。
英伟达首席执行官黄仁勋在 Gartner 的 IT 研讨会/XPO 上向首席信息官听众讲话。(图: Shane Snider)
Nvidia 公司的图形处理器(GPU)取得了迅速而耀眼的成功。GPU曾主要被视为用于处理视频游戏等图形密集型工作负载,但后来发现这种高性能GPU 也是大型语言模型(LLM)的高效工具。Open AI 的 ChatGPT 在两年前推出后几乎一夜成名,各公司随后竞相打造生成式人工智能( GenAI)平台。Nvidia 从中获益良多,一跃成为全球最有价值的公司之一。
因此,首席信息官们迫切希望听到老黄说说如何找到类似的成功之道。老黄的主题演讲开始前一个多小时,数百名与会者就整整齐齐地坐在下面了。
老黄在台上接受了 Gartner 分析师兼副总裁 Daryl Plummer 的采访。
Plummer 在老黄出场前表示,“Nvidia为我们展示了一条与众不同的道路,一条从图形芯片到数据中心再到大规模生成式人工智能之路,Nvidia提供的计算能力推动了人工智能的发展,对创新的冲击改变了今日的世界。”
Plummer 问了关于他的个人风格(总是穿着同样的黑色皮夹克)以及这种简约是否为他的领导愿景留下空间的问题。老黄在回答时表示,他的领导风格更多的是着眼未来,而不是注重风格本身。
他表示,“当你看到一些有影响力的事情、一些令人惊讶和意想不到的事情时,你必须问自己,‘这意味着什么、长期的影响是什么?’……接下来的部分就是,如果坚信某件事,就要采取行动。最好的方法就是开始行动。”
生活在未来与“token”
老黄表示,首席信息官应该拥抱前瞻性思维,前瞻性思维使他们能够适应快速变化的技术环境。他在掌声中说道,“活在未来比活在过去更容易。活在过去更加痛苦。”他表示,未来思维是“希望,是梦想,是信念……问题在于,你在脑海构想了那个未来,你为此会去采取什么行动呢?”
英伟达肯定采取了行动。英伟达迅速转型成为人工智能处理单元的关键供应商,转型已经得到了回报。该公司最近的财务报告显示,英伟达2024年第二季度的收入达到了300亿美元,环比增长了15%,同比增长了122%。
他谈到这个行业在迅速变化,从一个专注于硬件和软件的行业转变为一个专注于无形的“token”,这些token能够将视觉数据和语言数据转化为可用的商品。
他表示,“这个行业以前从未存在过,这个行业将会有工厂,是一些内部有计算机的建筑,这些计算机在将数据原材料转化为这种新的无形的东西,而且在这方面做得非常出色,这种无形的东西每小时将数百万个token进行货币化……浮点数(token的格式)可以重新构建成语言、图像和视频。”
老黄表示,最终,“我们将对机器人运动过程进行数字化,我们将能够对蛋白质和化学物质进行数字化……我们正在见证……这是一个新工业革命的开始。”
数字工人对阵人类工人
尽管许多人对于人工智能的快速发展可能取代大量劳动力表示担忧,老黄却提出了更为乐观的观点。数字工人与人类工人并肩工作将提高生产力并为每个人创造更多机会。
他表示,具有自主性代理能力的人工智能使得人类员工可以与数字工人互动。这些数字工人并不一定是要取代人类员工,而是要提升整个公司的生产力和增长。
老黄称,“所有这些数字员工……我给他们的指示或提示方式与生物员工是相同的。他们会以团队合作的方式相互联系,我们会给他们一些可以共同完成的任务。”
他补充表示,“我们首先需要创造更多的人工智能工作岗位,这样才能创造更多的人类工作岗位……如果你现在能够创造更多的人工智能工作岗位,你的公司将会成为一个更高效的公司。你会产生更多的收益,这将使你能够雇佣更多的人。”
好文章,需要你的鼓励
VSCO今日更新VSCO Capture应用,新增视频拍摄功能。用户现可在拍摄照片和视频时应用并调整VSCO的50多种滤镜预设,包括经典胶片到现代创作风格。新版本还推出胶片颗粒滤镜,可动态控制纹理强度、大小和色彩。用户能将颗粒滤镜叠加到Film X滤镜上,结合柯达、富士和爱克发胶片风格,保存个性化胶片配方。
瑞士ETH苏黎世联邦理工学院等机构联合开发的WUSH技术,首次从数学理论层面推导出AI大模型量化压缩的最优解。该技术能根据数据特征自适应调整压缩策略,相比传统方法减少60-70%的压缩损失,实现接近零损失的模型压缩,为大模型在普通设备上的高效部署开辟了新路径。
Instagram负责人Adam Mosseri表示,AI生成内容已经占据社交媒体主导地位,预计将超越非AI内容。他认为识别AI内容的技术效果不佳,建议转而为真实媒体建立指纹识别系统,由相机制造商在拍摄时进行加密签名。Mosseri还指出,创作者应优先发布"不完美"的原始图像来证明真实性,因为精美方形图片的时代已经结束。
弗吉尼亚大学团队创建了Refer360数据集,这是首个大规模记录真实环境中人机多模态交互的数据库,涵盖室内外场景,包含1400万交互样本。同时开发的MuRes智能模块能让机器人像人类一样理解语言、手势和眼神的组合信息,显著提升了现有AI模型的理解准确度,为未来智能机器人的广泛应用奠定了重要基础。