至顶网软件频道消息: 3月21日,阿里云正式发布视频边缘智能服务产品Link Visual 2.0,在原有视频接入能力的基础上,创新性地融入了深度学习AI能力,提供云边端一体的视频接入和算法容器。支持算法模型从云端下发,在边缘和设备端做推理。这样,哪怕一个很普通的摄像头,也能够很轻松的拥有AI能力。
阿里云方面表示,该产品即将于今年4月启动邀测,7月正式上线。据介绍,Link Visual自去年10月发布1.0版本后,引发了强烈的市场反响,目前已有近百家摄像头厂家购买产品并开始服务对接工作,多家智能视频服务商也跟进推出了同类产品。可以说,Link Visual不仅为泛视频行业的数字化和智能化转型提供了更便捷的云服务,同时也为拓宽视频应用提供了更广阔的想象空间。
而此次发布的2.0版本,将首次开放深度学习云边协同能力,形成了视频数据接入、调度,算法模型下发、算法容器、边缘推理、结果上云的闭环,打通从数据、模型、到应用的全链路,对无论是算法厂家、AI创业团队还是解决方案商来说,都提供了更为高效的解决方案。
举例来说,常规的智能视频服务商,能为视频提供的智能识别目标有限,而客户如果需要添加新的目标,则需要一个漫长的过程才能实现应用落地。通过Link Visual服务,再加上AI能力,就能缩减这个过程,完成新目标的识别。
另外,对于已经有成熟算法的厂家来说,可以适配Link Visual 2.0提供的算法容器,按照统一的数据标准,接入规范和给定的硬件平台,将算法托管到云端,入驻算法市场。在实际项目需要相应的算法时,客户可以直接从云端购买算法,并支持把算法分发到边缘和设备端。除此之外,Link Visual 2.0基于阿里云基础产品架构,运用多重安全策略,也确保了用户的数据安全。
“人工智能的市场需求正在迅速变化,以应对企业在物联网布局时所面临的协同、高效和互联等方面的关键挑战。”英特尔物联网副总裁江百伦说道,“全新的视频边缘智能服务,结合了经英特尔 OpenVINO工具包优化的深度学习推理能力,能构建高性能应用程序,并加快从边缘到云的计算机视觉算法开发。这将帮助客户,在智慧制造和智慧城市等领域中,更迅捷地部署人工智能和物联网解决方案。
阿里巴巴集团副总裁、阿里云智能IoT事业部总经理库伟表示,物联网迈向智联网的重要路径是实施云边端一体协同计算,让数据、计算能力和AI能力通过云边端协同的方式流动起来,才能实现万物智能。今天发布的视频边缘智能服务就是以此理念而打造,使得阿里集团和合作伙伴及第三方开发者的算法能力,可以在云边端协同工作,让物联更有价值,进而向智联跨越。
好文章,需要你的鼓励
新加坡国立大学研究人员开发出名为AiSee的可穿戴辅助设备,利用Meta的Llama模型帮助视障人士"看见"周围世界。该设备采用耳机形态,配备摄像头作为AI伴侣处理视觉信息。通过集成大语言模型,设备从简单物体识别升级为对话助手,用户可进行追问。设备运行代理AI框架,使用量化技术将Llama模型压缩至10-30亿参数在安卓设备上高效运行,支持离线处理敏感文档,保护用户隐私。
阿里巴巴联合浙江大学开发的OmniThink框架让AI学会像人类一样慢思考写作。通过信息树和概念池的双重架构,系统能够动态检索信息、持续反思,突破了传统AI写作内容浅薄重复的局限。实验显示该方法在文章质量各维度均显著超越现有最强基线,知识密度提升明显,为长文本生成研究开辟了新方向。
OpenAI推出新AI模型GPT-5-Codex,能够在无用户协助下完成数小时的编程任务。该模型是GPT-5的改进版本,使用额外编码数据训练。测试显示,GPT-5-Codex可独立工作超过7小时,能自动发现并修复编码错误。在重构基准测试中得分51.3%,比GPT高出17%以上。模型可根据任务难度调整处理时间,简单请求处理速度显著提升。目前已在ChatGPT付费计划中提供。
腾讯混元3D 2.0是一个革命性的3D生成系统,能够从单张图片生成高质量的带纹理3D模型。该系统包含形状生成模块Hunyuan3D-DiT和纹理合成模块Hunyuan3D-Paint,采用创新的重要性采样和多视角一致性技术,在多项评估指标上超越现有技术,并提供用户友好的制作平台。作为开源项目,它将大大降低3D内容创作门槛,推动3D技术的普及应用。