虽然自动提款机后面没有藏着人数钱,但是垃圾桶里面却有可能藏着“人”检查你倒的垃圾——这不是一个恐怖故事,也不是一个段子,而是发生在当下的真事。只不过这里的“人”是一个“机器人”。
AI定制化需求与日俱增
我们都知道,垃圾分类万般好,实行起来却是万般难。而为了帮助人们更主动、更方便地进行垃圾分类,人工智能在很多地方也派上了用场。举例来说,此前宁波蔚澜环保科技有限公司(以下简称“宁波蔚澜”)就使用百度EasyDL零门槛AI开发平台的软硬一体开发套件制作了这样一个智能厨余垃圾回收箱——人们只要将厨余垃圾投放到垃圾箱内,垃圾被识别并称重后就可以获得市民卡返点积分,这不仅培养了市民垃圾分类的习惯,同时也利于厨余垃圾的集中处理。
人工智能正在离我们越来越近,在很多生活和工作场景中,我们都在受益于此。但是,人工智能技术范围涉略很广,从计算机识别、机器学习,到语音识别、自然语言处理等等,在不同的场景下,往往会用到不同的人工智能技术,与此同时,由于具体需求不同,用于AI模型训练的数据以及最终输出的结果也会千差万别。
再举个例子,在建筑工地上,挖掘机、推土机等大型机械车辆在行驶时经常会造成光缆的损坏。为此,安徽恒科在工地现有的监控摄像头上,结合EasyDL训练的机械车辆识别模型,实现了对工地光缆下是否有机车出现的实时监控,从而保障了光缆安全。
在这两个例子中,宁波蔚澜仅使用了217张厨余垃圾图片迭代训练两版就获得了91.57%的厨余垃圾识别模型,而安徽恒科基于对挖掘机、推土机、压路机工地运行的640图片的训练,也得到了准确率达85%的机械车辆识别模型。虽然两者涉及的均是计算机识别技术,但很明显,使用的数据以及最终得出的AI模型并不相同。
“哪怕是在同一个场景下,比如同样去检测工地的工人有没有穿工服,有的企业可能就希望在室外场景进行高空监查,有的就希望在室内场景进行低空监查。这种差异就意味着大家需要的AI能力是不同的。”百度AI技术生态部高级产品经理李景秋在百度智能云技术创新沙龙上表示。因此,在百度看来,AI的定制化已经成为企业用户非常大的需求。但是,这对企业而言,不仅耗时同时对开发人员的技术能力和业务经验也提出了相当高的要求。
EasyDL为AI定制而生
正是基于这样的市场洞察,百度在2017年底推出了EasyDL,它是一个零门槛、定制化的AI开发平台,允许用户在没有任何的算法和代码基础的前提下,也可以基于这一平台自行定制高精度的AI模型。
据李景秋介绍,目前,EasyDL推出了三个版本:经典版、专业版和行业版。其中,经典版是EasyDL在2017年底就推出的最早版本,主要面向的是AI零算法基础或者追求高效模型训练和迭代的企业用户,训练过程完全无需了解网络选型和调参细节,只需上传数据操作训练,即可获得终端AI服务;专业版主要面向专业AI工程师,允许用户灵活调参、在Notebook编程获取定制的AI服务,并且网络选型丰富,可以满足各种业务场景的需要;行业版目前聚焦零售业,是专注适配快消行业商品检测场景推出的版本,可以系统解决货架巡检、商品检测等行业问题。
比如,某箱包生产企业就基于EasyDL开发了一套“检针识别模型”,用于箱包在出厂前的最后一道质检——检查是否有生产中遗落的针、线、剪刀等物品。“传统的方式是用X光进行检测,但针线在X光下是非常不好识别的,依然可能存在漏检风险。因此,新模型就可以有效帮助企业解决质检环节的这个问题。”李景秋表示。
如此看来,“零门槛”是EasyDL的标签,但并不是唯一标签。除此之外,EasyDL所提供的EasyData智能数据服务还可以帮助用户解决数据采集、清洗、标注等一站式的数据服务,帮助用户高效获取AI开发所需的高质量数据;而基于百度深度学习平台飞桨的大规模预训练模型,还能帮助企业低成本打造高精度模型,提升AI训练效果。
EasyDL不止是“零门槛”
数据规模和数据质量是AI结果可靠性的前提和基础,而数据的标注和预处理往往需要较高的成本和较长的时间。对此,EasyData在每一个环节都提供了支持。
具体来看:在数据采集方面,EasyData支持摄像头采集图片、云服务数据回流两种方式,其中,前一种方案支持定时拍照、视频抽帧等多种方式,用户只要在摄像头中集成EasyData就能自动将本地视频流数据上传至云端,而通过数据回流还能对模型进行长线迭代,持续优化模型效果;在数据清洗方面,EasyData开放了图片清晰的完整方案,支持相似度去重、去模糊、裁剪、旋转、镜像5种标准清洗方案,以及过滤无人脸、无人体的高级清洗方案;在数据标注方面,EasyData提供了图片、文本、音频、视频四种数据格式的9种数据标注模板,支持物体检测、图像分割、文本分类三类任务场景,其中内置的百度自研Hard Sample主动学习挖掘算法,还可以针对不同智能标注任务、不同数据集进行针对性适配。
需要强调的是,虽然是零门槛,但EasyDL在保证模型训练精度方面是丝毫不含糊的。基于飞桨,EasyDL预置了百度的超大规模预训练模型,比如,在视觉任务中,图像分类训练任务预置的模型使用的是百度超过10万分类、6500万的图片数据,可以使模型平均精度提升3.24%-7.73%;在物体检测训练任务中,内置了基于170万图片、超过1000万检测框训练的超大规模预训练模型,平均精度可提升1.78%-4.53%;在自然语言处理方向,百度自研了业内效果最好的预训练模型文心ERNIE 2.0,在中文模型中,已学习了1500万篇百科语料和词语、实体知识,3亿的文章的因果结构关系,10亿次的搜索查询与结果的对应关系,2000万的语言逻辑关系知识等。可支持文本分类单标签、多标签,情感倾向分析、序列化标注等多种场景。
“这仍然不够。EasyDL还提供了自动数据增强、自动超参搜索等先进的训练机制,并且这些功能都是以非常简单的交互式操作呈现。另外,为了减少训练时长,EasyDL还使用了飞桨DGC的加速机制,可以让线上多场景模型训练时长平均减少70%。”李景秋强调。换句话说,EasyDL之所以能做到“零门槛”,是基于百度AI能力筑起的“高台阶”,借此,降低了用户的AI应用门槛。
当然,模型再完美也要部署并集成到企业的业务中才有价值。在这方面,EasyDL提供了最广泛适配的模型部署服务,包括公有云API、设备端SDK、本地服务器部署、软硬一体部署四种方案。
“Everyone Can AI”
借由从数据准备、模型训练到模型部署等方方面面的技术优势,从2017年底推出至今,EasyDL已经成为应用和落地最广泛的AI开发平台,在工业、零售、制造、医疗等领域广泛落地。
李景秋表示:“未来,EasyDL还会持续专注在如何让企业能快速获取定制AI服务这件事上,一方面围绕数据服务、模型训练和服务部署上持续升级,让全流程AI开发体验更好。另一方面也会持续扩大应用场景,丰富预置模型库,让更多行业更多应用场景的企业能更便捷获取定制AI能力。”
如此种种,都将在极大程度上推动AI全民化,加速企业智能化转型。而这,也正是百度提出的“Everyone Can AI”这一愿景的最好注脚。
好文章,需要你的鼓励
代理AI是通用生成式AI一个更专注的替代方案,正在企业逐渐发展崛起,Forrester在今年6月将其评为2025年的顶级新兴技术。
一家每年创造480亿美元收入、却不生产或拥有任何产品的全球企业,是如何将增长提升到新的水平?答案就是,成为一家平台企业。
2024年,许多初创公司和个人开发者投身于其中、拿出自己的模型成果。2025也将成为AI生成内容在商业和消费领域全面爆发的一年。
本文介绍了 Okta 公司欧洲、中东和非洲地区首席安全官 Stephen McDermid 的工作理念。他强调了与客户和合作伙伴保持密切联系的重要性,以及为所有人提供流畅体验的必要性。McDermid 还讨论了 Okta 的安全策略,包括主动监控、共享责任模式和提高内部安全文化等方面。