据一份新报告显示,微软正加紧进行将人工智能(AI)技术应用于零售/销售点领域的工作。
据路透社6月14日报道,微软旗下的人工智能团队内部有一个小组主攻计算机视觉及其“智能边缘”技术在无结算零售领域的应用,可能是要与亚马逊在此领域一争高下。
亚马逊Go是一个实体概念店,这些实体店用计算机视觉和人工智能取代收银员和结账台。
微软有许多物联网(IoT)和AI服务,这些都存在用于零售空间的潜力。微软一直在增加对物联网终端(传感器、嵌入式设备、相机等)和认知服务的关注,诸如亚马逊图像处理、视像、语音和搜索等认知服务都可以连接到物联网终端上。
微软的零售Dynamics 365也销售旗下的零售/销售点解决方案的软件和服务产品。
微软在今年早些时候的Build 2018年会议上推出一个名为“Project Kinect”的新型传感器,开发者利用Project Kinect可将相机和相关传感器嵌入到机器人、无人机和工业设备里并自动获得手部跟踪和高保真度空间映射。 业界人士认为Project Kinect中的相机与下一版HoloLens用的相机相同。Project Kinect的口号是“将AI带到边缘”。该传感器将于2019年推出,与下一版HoloLens的推出时间一样。
微软现在的做法是与合作伙伴在零售行业开展协作,而不是像亚马逊那样与他们竞争。笔者曾问过微软对路透社的报道有何评论。微软发言人表示,微软不会评论谣言和猜测。
好文章,需要你的鼓励
浙江大学研究团队开发了ContextGen,这是首个能够同时精确控制多个对象位置和外观的AI图像生成系统。该系统通过情境布局锚定和身份一致性注意力两大创新机制,解决了传统AI在多对象场景中位置控制不准确和身份保持困难的问题,并创建了业界首个10万样本的专业训练数据集,在多项测试中超越现有技术。
谷歌推出升级版图像生成模型Nano Banana Pro,基于最新Gemini 3语言模型构建。新模型支持更高分辨率(2K/4K)、准确文本渲染、网络搜索功能,并提供专业级图像控制能力,包括摄像角度、场景光照、景深等。虽然质量更高但成本也相应增加,1080p图像费用为0.139美元。模型已集成到Gemini应用、NotebookLM等多个谷歌AI工具中,并通过API向开发者开放。
上海交通大学研究团队开发的SR-Scientist系统实现了人工智能在科学发现领域的重大突破。该系统能够像真正的科学家一样,从实验数据中自主发现数学公式,通过工具驱动的数据分析和长期优化机制,在四个科学领域的测试中比现有方法提高了6%-35%的精确度。这标志着AI从被动工具转变为主动科学发现者的重要里程碑。