至顶网软件频道消息: 为了帮助企业应对自己日益增加的数据,Box公司近日宣布与谷歌公司达成协议,利用搜索巨头的人工智能能力。
这家文件共享及云内容管理公司表示,将采用谷歌的Cloud Vision技术,后者利用机器学习来了解图像,从文件中找出像表格、收据、护照这样的有用图像信息。而以往这些信息经常被手动标记,而这种做法会花费大量时间并且可能存在人为错误。
Box公司产品营销副总裁Rand Wacker在接受采访时表示:"我们可以给这些图像带来智能性,且我们正在利用这些图像中发现信息,并使其能够非常容易使用这其中的信息。"
更具体来说,Box将利用Cloud Vision(被用于Google Photos和图像搜索中)的API,以便从图像中提取更多信息,而图像是Box增长最快的第二大业务内容。两者的集成将帮助企业检测图像中的对象甚至是理念,通过光学字符识别和捕获文本,自动添加关键字标签,并在图像目录上构建所谓的元数据用于各种业务流程和应用程序中。
例如,牛仔裤和牛仔布的图片可以自动识别出来,并做标记以创建一个更快速更容易的可搜索目录。或者一家需要保存员工驾驶执照的公司,也可以这么做,用手机摄像头对驾驶执照拍照,发送到一个安全的文件夹,用Cloud Vision API对其进行处理,提取出执照上的文字。根据这些信息还可以 自动处理现场保险索赔。
Constellation Research副总裁、首席分析师Alan Lepofsky表示:"真正的价值在于增强人们完成工作的方式。大多数企业有数量庞大的各种图片、视频和Office文档,他们目前并没有最大限度利用这些内容。自动化工作流程(例如标记、过滤和搜索)可以大大改进人们发现和共享内容的方式。"
斯坦福大学计算机科学教授、Google Cloud AI首席科学家Fei-Fei Li在声明中补充说,"两者的集成将展现人工智能在企业领域的潜力,最终这将使人工智能面向更多大众和更多企业。"
Wacker表示,对于Box来说好处是显而易见的,因为Box一直在尝试朝着基本的文件存储领域外发展,这个市场已经非常拥挤了,而且盈利空间很小。"无论何时我们可以为客户的内容添加更多功能,这样他们就可以将更多的核心流程迁移到Box上。"
有多家Box的客户,例如Creative Artists Agency和加州大学圣芭芭拉分校,一直在测试这次双方之间的整合(现在已经在私人测试阶段)。定价信息将在今年底公布,到时候功能会面向客户全面提供。
在这个领域谷歌并不是Box的唯一合作伙伴。6月底,Box与微软签订广泛的合作伙伴协议,其中就包括"探索"将微软Azure云的Cognitive Services与Box进行集成。两家公司表示,这可能会包含高级内容处理技术例如视频索引,这样媒体和娱乐公司就可以利用这个功能发现相关内容,或者为他们的Box内容提供建议。
好文章,需要你的鼓励
数字孪生技术正在改变网络安全防御模式,从被动响应转向主动预测。这种实时学习演进的虚拟副本让安全团队能够在威胁发生前预见攻击。组织可以在数字孪生环境中预演明日的攻击,将防御从事后反应转变为事前排演。通过动态更新的IT生态系统副本,团队可在真实条件下压力测试防御体系,模拟零日漏洞攻击并制定应对策略,从根本上重塑网络安全实践方式。
NVIDIA联合多所大学开发的Omni-RGPT实现了AI视觉理解的重要突破,首次让AI能同时精准理解图像和视频中用户指定的任何区域。通过独创的Token Mark机制,该系统解决了传统方法在视频中容易"跟丢"目标的问题,在视觉问答、区域描述等多项任务上达到最先进水平,为教育、安防、内容创作等领域的AI应用奠定了基础。
Linux内核开发面临动荡时期,Rust语言引入引发摩擦,多名核心开发者相继离职。文章介绍了三个有趣的替代方案:Managarm是基于微内核的操作系统,支持运行Linux软件;Asterinas采用Rust语言开发,使用新型framekernel架构实现内核隔离;Xous同样基于Rust和微内核设计,已有实际硬件产品Precursor发布。这些项目证明了除Linux之外,还有许多令人兴奋的操作系统研发工作正在进行。
这项由中国人民大学等机构合作完成的研究提出了Virgo系统,发现仅用5000个纯文本推理案例训练就能让AI在视觉推理任务上达到顶级商业系统水平。研究证实推理能力具有跨模态通用性,为更经济高效地开发多模态AI系统指明了新方向,同时也揭示了AI感知反思能力不足的局限性。