至顶网软件频道消息: 为了帮助企业应对自己日益增加的数据,Box公司近日宣布与谷歌公司达成协议,利用搜索巨头的人工智能能力。
这家文件共享及云内容管理公司表示,将采用谷歌的Cloud Vision技术,后者利用机器学习来了解图像,从文件中找出像表格、收据、护照这样的有用图像信息。而以往这些信息经常被手动标记,而这种做法会花费大量时间并且可能存在人为错误。
Box公司产品营销副总裁Rand Wacker在接受采访时表示:"我们可以给这些图像带来智能性,且我们正在利用这些图像中发现信息,并使其能够非常容易使用这其中的信息。"
更具体来说,Box将利用Cloud Vision(被用于Google Photos和图像搜索中)的API,以便从图像中提取更多信息,而图像是Box增长最快的第二大业务内容。两者的集成将帮助企业检测图像中的对象甚至是理念,通过光学字符识别和捕获文本,自动添加关键字标签,并在图像目录上构建所谓的元数据用于各种业务流程和应用程序中。
例如,牛仔裤和牛仔布的图片可以自动识别出来,并做标记以创建一个更快速更容易的可搜索目录。或者一家需要保存员工驾驶执照的公司,也可以这么做,用手机摄像头对驾驶执照拍照,发送到一个安全的文件夹,用Cloud Vision API对其进行处理,提取出执照上的文字。根据这些信息还可以 自动处理现场保险索赔。
Constellation Research副总裁、首席分析师Alan Lepofsky表示:"真正的价值在于增强人们完成工作的方式。大多数企业有数量庞大的各种图片、视频和Office文档,他们目前并没有最大限度利用这些内容。自动化工作流程(例如标记、过滤和搜索)可以大大改进人们发现和共享内容的方式。"
斯坦福大学计算机科学教授、Google Cloud AI首席科学家Fei-Fei Li在声明中补充说,"两者的集成将展现人工智能在企业领域的潜力,最终这将使人工智能面向更多大众和更多企业。"
Wacker表示,对于Box来说好处是显而易见的,因为Box一直在尝试朝着基本的文件存储领域外发展,这个市场已经非常拥挤了,而且盈利空间很小。"无论何时我们可以为客户的内容添加更多功能,这样他们就可以将更多的核心流程迁移到Box上。"
有多家Box的客户,例如Creative Artists Agency和加州大学圣芭芭拉分校,一直在测试这次双方之间的整合(现在已经在私人测试阶段)。定价信息将在今年底公布,到时候功能会面向客户全面提供。
在这个领域谷歌并不是Box的唯一合作伙伴。6月底,Box与微软签订广泛的合作伙伴协议,其中就包括"探索"将微软Azure云的Cognitive Services与Box进行集成。两家公司表示,这可能会包含高级内容处理技术例如视频索引,这样媒体和娱乐公司就可以利用这个功能发现相关内容,或者为他们的Box内容提供建议。
好文章,需要你的鼓励
Anthropic发布了面向成本敏感用户的Claude Haiku 4.5大语言模型,定价为每百万输入令牌1美元,输出令牌5美元,比旗舰版Sonnet 4.5便宜三倍。该模型采用混合推理架构,可根据需求调整计算资源,支持多模态输入最多20万令牌。在八项基准测试中,性能仅比Sonnet 4.5低不到10%,但在编程和数学任务上超越了前代Sonnet 4。模型响应速度比Sonnet 4快两倍以上,适用于客服聊天机器人等低延迟应用场景。
上海AI实验室联合多家顶尖机构开发出全球首个科学推理大模型SciReasoner,该模型在2060亿科学数据上训练,支持103个科学任务,能够像科学家一样进行逻辑推理并展示思考过程。它实现了化学、生物学、材料科学等多领域知识整合,在分子设计、性质预测、文献分析等方面表现出色,为科学研究提供了强大的AI助手工具。
英国初创公司Nscale将为微软建设四个AI数据中心,总计部署约20万个GPU,合同价值高达240亿美元。首个数据中心将于明年在葡萄牙开建,配备1.26万个GPU。德州数据中心规模最大,将部署10.4万个GPU,容量从240兆瓦扩展至1.2吉瓦。所有设施将采用英伟达最新Blackwell Ultra显卡。
南洋理工大学研究团队开发出SHINE方法,这是一种无需额外训练就能实现高质量图像合成的新技术。该方法通过巧妙引导现有AI模型的潜能,能够在复杂光影条件下完美合成图像,包括准确的阴影生成和水面倒影效果。研究团队还创建了ComplexCompo基准测试集,验证了SHINE在各种挑战性场景中的卓越性能,为图像编辑技术的发展开辟了新方向。