至顶网软件频道消息: 为了帮助企业应对自己日益增加的数据,Box公司近日宣布与谷歌公司达成协议,利用搜索巨头的人工智能能力。

这家文件共享及云内容管理公司表示,将采用谷歌的Cloud Vision技术,后者利用机器学习来了解图像,从文件中找出像表格、收据、护照这样的有用图像信息。而以往这些信息经常被手动标记,而这种做法会花费大量时间并且可能存在人为错误。
Box公司产品营销副总裁Rand Wacker在接受采访时表示:"我们可以给这些图像带来智能性,且我们正在利用这些图像中发现信息,并使其能够非常容易使用这其中的信息。"
更具体来说,Box将利用Cloud Vision(被用于Google Photos和图像搜索中)的API,以便从图像中提取更多信息,而图像是Box增长最快的第二大业务内容。两者的集成将帮助企业检测图像中的对象甚至是理念,通过光学字符识别和捕获文本,自动添加关键字标签,并在图像目录上构建所谓的元数据用于各种业务流程和应用程序中。
例如,牛仔裤和牛仔布的图片可以自动识别出来,并做标记以创建一个更快速更容易的可搜索目录。或者一家需要保存员工驾驶执照的公司,也可以这么做,用手机摄像头对驾驶执照拍照,发送到一个安全的文件夹,用Cloud Vision API对其进行处理,提取出执照上的文字。根据这些信息还可以 自动处理现场保险索赔。
Constellation Research副总裁、首席分析师Alan Lepofsky表示:"真正的价值在于增强人们完成工作的方式。大多数企业有数量庞大的各种图片、视频和Office文档,他们目前并没有最大限度利用这些内容。自动化工作流程(例如标记、过滤和搜索)可以大大改进人们发现和共享内容的方式。"
斯坦福大学计算机科学教授、Google Cloud AI首席科学家Fei-Fei Li在声明中补充说,"两者的集成将展现人工智能在企业领域的潜力,最终这将使人工智能面向更多大众和更多企业。"
Wacker表示,对于Box来说好处是显而易见的,因为Box一直在尝试朝着基本的文件存储领域外发展,这个市场已经非常拥挤了,而且盈利空间很小。"无论何时我们可以为客户的内容添加更多功能,这样他们就可以将更多的核心流程迁移到Box上。"
有多家Box的客户,例如Creative Artists Agency和加州大学圣芭芭拉分校,一直在测试这次双方之间的整合(现在已经在私人测试阶段)。定价信息将在今年底公布,到时候功能会面向客户全面提供。
在这个领域谷歌并不是Box的唯一合作伙伴。6月底,Box与微软签订广泛的合作伙伴协议,其中就包括"探索"将微软Azure云的Cognitive Services与Box进行集成。两家公司表示,这可能会包含高级内容处理技术例如视频索引,这样媒体和娱乐公司就可以利用这个功能发现相关内容,或者为他们的Box内容提供建议。
好文章,需要你的鼓励
AI颠覆预计将在2026年持续,推动企业适应不断演进的技术并扩大规模。国际奥委会、Moderna和Sportradar的领导者在纽约路透社峰会上分享了他们的AI策略。讨论焦点包括自建AI与购买第三方资源的选择,AI在内部流程优化和外部产品开发中的应用,以及小型模型在日常应用中的潜力。专家建议,企业应将AI建设融入企业文化,以创新而非成本节约为驱动力。
字节跳动等机构联合发布GAR技术,让AI能同时理解图像的全局和局部信息,实现对多个区域间复杂关系的准确分析。该技术通过RoI对齐特征重放方法,在保持全局视野的同时提取精确细节,在多项测试中表现出色,甚至在某些指标上超越了体积更大的模型,为AI视觉理解能力带来重要突破。
Spotify在新西兰测试推出AI提示播放列表功能,用户可通过文字描述需求让AI根据指令和听歌历史生成个性化播放列表。该功能允许用户设置定期刷新,相当于创建可控制算法的每周发现播放列表。这是Spotify赋予用户更多控制权努力的一部分,此前其AI DJ功能也增加了语音提示选项,反映了各平台让用户更好控制算法推荐的趋势。
Inclusion AI团队推出首个开源万亿参数思维模型Ring-1T,通过IcePop、C3PO++和ASystem三项核心技术突破,解决了超大规模强化学习训练的稳定性和效率难题。该模型在AIME-2025获得93.4分,IMO-2025达到银牌水平,CodeForces获得2088分,展现出卓越的数学推理和编程能力,为AI推理能力发展树立了新的里程碑。