至顶网软件频道消息: 长久以来,人工智能和机器学习一直被吹捧为实现自动化和提高生产力的灵丹妙药,但很多技术挑战阻碍了人们的采用。从2007年职业生涯初期开始,Google应用人工智能技术总监Ron Bodkin就一直参与开发和部署机器学习。现在,工作十多年中,Bodkin终于看到这项技术开始走向成熟。
Bodkin说:“现在我们正处于这样一个阶段,很多公司将这些资产放在一起。你可以获得令人惊叹的云资源,就像Google提供的这些资源一样,不仅可以处理大量信息,而且开始真正采取行动,因为......与大数据演进并行的是算法的演进,以及获取大量数字数据的途径。”
在近日举行的BigData SV活动上,Bodkin谈到了人工智能从概念到产品化的演进。
这项不断成熟的技术开始结出硕果
在机器学习技术发展的早期,人们有一种误解,认为所有的数据都可以简单地被获取,而且其价值可以被轻易地提取出来。然而,根据Bodkin的说法,释放机器学习潜力的关键,是所使用的数据的质量。
“你必须至少有一定的数据结构;你必须尽力调整数据,以便获得有效的结果,”Bodkin说。
谷歌也在扩展自己的内部数据科学和机器学习基础设施,用于自己的产品,着重于以云服务的方式提供谷歌的技术。Bodkins的Applied AI团队负责与其他公司合作,利用这些服务(如自然语言处理或图像识别)提供价值。
“我们已经为我们自己的产品建立了这种强大的能力,我们现在可以为客户提供这些能力,客户也在说,我如何利用这些能力?我如何与谷歌合作?我如何使用这些产品?我如何使用这些功能?”Bodkin说。
好文章,需要你的鼓励
Jabra 推出 PanaCast 40 VBS:首款专为小会议室设计的 180° Android 智能音视频一体机
这是一项关于计算机视觉技术突破的研究,由多家知名院校联合完成。研究团队开发了LINO-UniPS系统,能让计算机像人眼一样从不同光照下的照片中准确识别物体真实的表面细节,解决了传统方法只能在特定光照条件下工作的局限性,为虚拟现实、文物保护、工业检测等领域带来重要应用前景。
字节跳动智能创作实验室发布革命性AI视频数据集Phantom-Data,解决视频生成中的"复制粘贴"问题。该数据集包含100万个跨场景身份一致配对,通过三阶段构建流程实现主体检测、多元化检索和身份验证,显著提升文本遵循能力和视频质量。
这篇文章介绍了北京人工智能研究院开发的OmniGen2模型,一个能够同时处理文字转图像、图像编辑和情境生成的全能AI系统。该模型采用双轨制架构,分别处理文本和图像任务,并具备独特的自我反思机制,能够自动检查和改进生成结果。研究团队还开发了专门的数据构建流程和OmniContext评测基准,展现了开源模型的强大潜力。