至顶网软件频道消息: 长久以来,人工智能和机器学习一直被吹捧为实现自动化和提高生产力的灵丹妙药,但很多技术挑战阻碍了人们的采用。从2007年职业生涯初期开始,Google应用人工智能技术总监Ron Bodkin就一直参与开发和部署机器学习。现在,工作十多年中,Bodkin终于看到这项技术开始走向成熟。
Bodkin说:“现在我们正处于这样一个阶段,很多公司将这些资产放在一起。你可以获得令人惊叹的云资源,就像Google提供的这些资源一样,不仅可以处理大量信息,而且开始真正采取行动,因为......与大数据演进并行的是算法的演进,以及获取大量数字数据的途径。”
在近日举行的BigData SV活动上,Bodkin谈到了人工智能从概念到产品化的演进。
这项不断成熟的技术开始结出硕果
在机器学习技术发展的早期,人们有一种误解,认为所有的数据都可以简单地被获取,而且其价值可以被轻易地提取出来。然而,根据Bodkin的说法,释放机器学习潜力的关键,是所使用的数据的质量。
“你必须至少有一定的数据结构;你必须尽力调整数据,以便获得有效的结果,”Bodkin说。
谷歌也在扩展自己的内部数据科学和机器学习基础设施,用于自己的产品,着重于以云服务的方式提供谷歌的技术。Bodkins的Applied AI团队负责与其他公司合作,利用这些服务(如自然语言处理或图像识别)提供价值。
“我们已经为我们自己的产品建立了这种强大的能力,我们现在可以为客户提供这些能力,客户也在说,我如何利用这些能力?我如何与谷歌合作?我如何使用这些产品?我如何使用这些功能?”Bodkin说。
好文章,需要你的鼓励
这项由浙江大学与阿里巴巴通义实验室联合开展的研究,通过创新的半在线强化学习方法,显著提升了AI界面助手在多步骤任务中的表现。UI-S1-7B模型在多个基准测试中创造了7B参数规模的新纪录,为GUI自动化代理的发展开辟了新的技术路径。
阿里巴巴联合浙江大学开发的OmniThink框架让AI学会像人类一样慢思考写作。通过信息树和概念池的双重架构,系统能够动态检索信息、持续反思,突破了传统AI写作内容浅薄重复的局限。实验显示该方法在文章质量各维度均显著超越现有最强基线,知识密度提升明显,为长文本生成研究开辟了新方向。
新加坡国立大学研究人员开发出名为AiSee的可穿戴辅助设备,利用Meta的Llama模型帮助视障人士"看见"周围世界。该设备采用耳机形态,配备摄像头作为AI伴侣处理视觉信息。通过集成大语言模型,设备从简单物体识别升级为对话助手,用户可进行追问。设备运行代理AI框架,使用量化技术将Llama模型压缩至10-30亿参数在安卓设备上高效运行,支持离线处理敏感文档,保护用户隐私。
腾讯混元3D 2.0是一个革命性的3D生成系统,能够从单张图片生成高质量的带纹理3D模型。该系统包含形状生成模块Hunyuan3D-DiT和纹理合成模块Hunyuan3D-Paint,采用创新的重要性采样和多视角一致性技术,在多项评估指标上超越现有技术,并提供用户友好的制作平台。作为开源项目,它将大大降低3D内容创作门槛,推动3D技术的普及应用。