至顶网软件频道消息: 为了帮助企业应对自己日益增加的数据,Box公司近日宣布与谷歌公司达成协议,利用搜索巨头的人工智能能力。
这家文件共享及云内容管理公司表示,将采用谷歌的Cloud Vision技术,后者利用机器学习来了解图像,从文件中找出像表格、收据、护照这样的有用图像信息。而以往这些信息经常被手动标记,而这种做法会花费大量时间并且可能存在人为错误。
Box公司产品营销副总裁Rand Wacker在接受采访时表示:"我们可以给这些图像带来智能性,且我们正在利用这些图像中发现信息,并使其能够非常容易使用这其中的信息。"
更具体来说,Box将利用Cloud Vision(被用于Google Photos和图像搜索中)的API,以便从图像中提取更多信息,而图像是Box增长最快的第二大业务内容。两者的集成将帮助企业检测图像中的对象甚至是理念,通过光学字符识别和捕获文本,自动添加关键字标签,并在图像目录上构建所谓的元数据用于各种业务流程和应用程序中。
例如,牛仔裤和牛仔布的图片可以自动识别出来,并做标记以创建一个更快速更容易的可搜索目录。或者一家需要保存员工驾驶执照的公司,也可以这么做,用手机摄像头对驾驶执照拍照,发送到一个安全的文件夹,用Cloud Vision API对其进行处理,提取出执照上的文字。根据这些信息还可以 自动处理现场保险索赔。
Constellation Research副总裁、首席分析师Alan Lepofsky表示:"真正的价值在于增强人们完成工作的方式。大多数企业有数量庞大的各种图片、视频和Office文档,他们目前并没有最大限度利用这些内容。自动化工作流程(例如标记、过滤和搜索)可以大大改进人们发现和共享内容的方式。"
斯坦福大学计算机科学教授、Google Cloud AI首席科学家Fei-Fei Li在声明中补充说,"两者的集成将展现人工智能在企业领域的潜力,最终这将使人工智能面向更多大众和更多企业。"
Wacker表示,对于Box来说好处是显而易见的,因为Box一直在尝试朝着基本的文件存储领域外发展,这个市场已经非常拥挤了,而且盈利空间很小。"无论何时我们可以为客户的内容添加更多功能,这样他们就可以将更多的核心流程迁移到Box上。"
有多家Box的客户,例如Creative Artists Agency和加州大学圣芭芭拉分校,一直在测试这次双方之间的整合(现在已经在私人测试阶段)。定价信息将在今年底公布,到时候功能会面向客户全面提供。
在这个领域谷歌并不是Box的唯一合作伙伴。6月底,Box与微软签订广泛的合作伙伴协议,其中就包括"探索"将微软Azure云的Cognitive Services与Box进行集成。两家公司表示,这可能会包含高级内容处理技术例如视频索引,这样媒体和娱乐公司就可以利用这个功能发现相关内容,或者为他们的Box内容提供建议。
好文章,需要你的鼓励
Docker公司通过增强的compose框架和新基础设施工具,将自己定位为AI智能体开发的核心编排平台。该平台在compose规范中新增"models"元素,允许开发者在同一YAML文件中定义AI智能体、大语言模型和工具。支持LangGraph、CrewAI等多个AI框架,提供Docker Offload服务访问NVIDIA L4 GPU,并与谷歌云、微软Azure建立合作。通过MCP网关提供企业级安全隔离,解决了企业AI项目从概念验证到生产部署的断层问题。
中科院联合字节跳动开发全新AI评测基准TreeBench,揭示当前最先进模型在复杂视觉推理上的重大缺陷。即使OpenAI o3也仅获得54.87%分数。研究团队同时提出TreeVGR训练方法,通过要求AI同时给出答案和精确定位,实现真正可追溯的视觉推理,为构建更透明可信的AI系统开辟新路径。
马斯克的AI女友"Ani"引爆全球,腾讯RLVER框架突破情感理解边界:AI下半场竞争核心已转向对人性的精准把握。当技术学会共情,虚拟陪伴不再停留于脚本应答,而是通过"心与心的循环"真正理解人类孤独——这背后是强化学习算法与思考模式的化学反应,让AI从解决问题转向拥抱情感。
PyVision是上海AI实验室开发的革命性视觉推理框架,让AI系统能够根据具体问题动态创造Python工具,而非依赖预设工具集。通过多轮交互机制,PyVision在多项基准测试中实现显著性能提升,其中在符号视觉任务上提升达31.1%。该框架展现了从"工具使用者"到"工具创造者"的AI能力跃迁,为通用人工智能的发展开辟了新路径。