至顶网软件频道消息: 为了帮助企业应对自己日益增加的数据,Box公司近日宣布与谷歌公司达成协议,利用搜索巨头的人工智能能力。
这家文件共享及云内容管理公司表示,将采用谷歌的Cloud Vision技术,后者利用机器学习来了解图像,从文件中找出像表格、收据、护照这样的有用图像信息。而以往这些信息经常被手动标记,而这种做法会花费大量时间并且可能存在人为错误。
Box公司产品营销副总裁Rand Wacker在接受采访时表示:"我们可以给这些图像带来智能性,且我们正在利用这些图像中发现信息,并使其能够非常容易使用这其中的信息。"
更具体来说,Box将利用Cloud Vision(被用于Google Photos和图像搜索中)的API,以便从图像中提取更多信息,而图像是Box增长最快的第二大业务内容。两者的集成将帮助企业检测图像中的对象甚至是理念,通过光学字符识别和捕获文本,自动添加关键字标签,并在图像目录上构建所谓的元数据用于各种业务流程和应用程序中。
例如,牛仔裤和牛仔布的图片可以自动识别出来,并做标记以创建一个更快速更容易的可搜索目录。或者一家需要保存员工驾驶执照的公司,也可以这么做,用手机摄像头对驾驶执照拍照,发送到一个安全的文件夹,用Cloud Vision API对其进行处理,提取出执照上的文字。根据这些信息还可以 自动处理现场保险索赔。
Constellation Research副总裁、首席分析师Alan Lepofsky表示:"真正的价值在于增强人们完成工作的方式。大多数企业有数量庞大的各种图片、视频和Office文档,他们目前并没有最大限度利用这些内容。自动化工作流程(例如标记、过滤和搜索)可以大大改进人们发现和共享内容的方式。"
斯坦福大学计算机科学教授、Google Cloud AI首席科学家Fei-Fei Li在声明中补充说,"两者的集成将展现人工智能在企业领域的潜力,最终这将使人工智能面向更多大众和更多企业。"
Wacker表示,对于Box来说好处是显而易见的,因为Box一直在尝试朝着基本的文件存储领域外发展,这个市场已经非常拥挤了,而且盈利空间很小。"无论何时我们可以为客户的内容添加更多功能,这样他们就可以将更多的核心流程迁移到Box上。"
有多家Box的客户,例如Creative Artists Agency和加州大学圣芭芭拉分校,一直在测试这次双方之间的整合(现在已经在私人测试阶段)。定价信息将在今年底公布,到时候功能会面向客户全面提供。
在这个领域谷歌并不是Box的唯一合作伙伴。6月底,Box与微软签订广泛的合作伙伴协议,其中就包括"探索"将微软Azure云的Cognitive Services与Box进行集成。两家公司表示,这可能会包含高级内容处理技术例如视频索引,这样媒体和娱乐公司就可以利用这个功能发现相关内容,或者为他们的Box内容提供建议。
好文章,需要你的鼓励
IBM Spyre加速器将于本月晚些时候正式推出,为z17大型机、LinuxONE 5和Power11系统等企业级硬件的AI能力提供显著提升。该加速器基于定制芯片的PCIe卡,配备32个独立加速器核心,专为处理AI工作负载需求而设计。系统最多可配置48张Spyre卡,支持多模型AI处理,包括生成式AI和大语言模型,主要应用于金融交易欺诈检测等关键业务场景。
加拿大女王大学研究团队首次对开源AI生态系统进行端到端许可证合规审计,发现35.5%的AI模型在集成到应用时存在许可证违规。他们开发的LicenseRec系统能自动检测冲突并修复86.4%的违规问题,揭示了AI供应链中系统性的"许可证漂移"现象及其法律风险。
意大利初创公司Ganiga开发了AI驱动的智能垃圾分拣机器人Hoooly,能自动识别并分类垃圾和可回收物。该公司产品包括机器人垃圾桶、智能盖子和废物追踪软件,旨在解决全球塑料回收率不足10%的问题。2024年公司收入50万美元,已向谷歌和多个机场销售超120台设备,计划融资300万美元并拓展美国市场。
这项由剑桥大学、清华大学和伊利诺伊大学合作的研究首次将扩散大语言模型引入语音识别领域,开发出Whisper-LLaDA系统。该系统具备双向理解能力,能够同时考虑语音的前后文信息,在LibriSpeech数据集上实现了12.3%的错误率相对改进,同时在大多数配置下提供了更快的推理速度,为语音识别技术开辟了新的发展方向。