至顶网软件频道消息:自从手机地图有了导航功能之后,人们的日常出行获得了极大的便利。但是,对于“骨灰级”路痴来说,就算有导航,方向感也仅限于“上北下南”的操作。有什么办法解决“骨灰级”路痴的困境吗?近日,全球领先的人工智能平台公司商汤科技SenseTime联合OPPO,以及高德地图共同打造的AR步行导航给出了答案。
基于商汤科技与OPPO合作打造的OPPOARunit平台,AR步行导航功能引入了虚拟吉祥物“小欧”带路。用户使用AR步行导航功能时,“小欧”就会出现在前面并开始带路,他通过理解当前的真实环境,以设定好的速度导航,如果用户快走几步,就会追上“小欧”,而慢走几步则会离“小欧”越来越远,如同在真实地跟随一名“导航员”行走。在遇到路痴们最头疼的岔路口、转弯处时,跟着“小欧”也不必纠结“左西右东”。就算跟岔了也没关系,“小欧”会贴心地发出语音提示,同时指出正确的道路。到了终点,“小欧”则会转身招手示意,整个导航过程都充满了人性化的互动与体验。
AR导航的概念并不新奇,然而此前的产品大都是基于GPS定位和陀螺仪的“伪AR”,仔细观察便可发现地图上的“指示物”永远处于屏幕中央,且和用户之间的距离永远一致,与用户的互动性、导航便利性等体验有所不足。
由商汤科技提供技术支持的AR步行导航,创新性地将SLAM技术(Simultaneous Localization and Mapping,同时定位与地图构建)与传统的GPS定位结合起来,解决了导航的一大关键问题:在 GPS地理坐标的基础上通过实时获取视觉图像、加速度和角速度等数据进行手机设备的6DoF定位,从而确定用户的精准方位,为AR步行导航提供了坚实的基础。
应用SLAM技术实现虚实结合打造AR应用体验,对商汤科技来说已经不是第一次了。今年年初,商汤科技宣布以原创AR开发者平台SenseAR为基础,联合OPPO共同打造OPPOARunit平台,众多超级App将陆续上线。例如,用户可以将游戏中的虚拟角色置身于现实世界、真实场景中,并能够与角色产生虚实互动,增强了游戏的可玩性与互动性。
此次合作,商汤科技创新性地将应用于游戏等基于“小场景”的AR方案,升级到了“室外大场景”中,解决了SLAM技术的长距离精准跟踪问题,不但实现了技术上的创新与突破,还极大拓展了AR技术的应用场景,从游戏、娱乐等延伸到日常生活与出行,为人们的生活带来更多便利。
目前,基于商汤科技SenseAR技术的AR步行导航,已可在OPPO R17等多款新机的高德地图中使用。未来,以中国原创SenseAR开发者平台为桥梁,商汤科技还将不断加深与各个硬件厂商、App开发者之间的合作,以领先的AI技术赋能支持构建AR生态,让更多人感受到AR的乐趣,体会技术为生活带来的改变。
关于商汤科技
作为全球领先的人工智能平台公司,商汤科技SenseTime为中国科技部指定的国家新一代人工智能“智能视觉”开放创新平台(其它四个国家AI平台分别为百度、阿里云、腾讯、科大讯飞公司)。同时,商汤科技也是“全球最具价值的AI创新企业”,公司总融资额超过16亿美元,估值超过45亿美元。
商汤科技以“坚持原创,让AI引领人类进步”为使命。公司建立了全球顶级、自主研发的深度学习平台和超算中心,并且研发了一系列AI技术,包括:人脸识别、图像识别、文本识别、医疗影像识别、视频分析、无人驾驶和遥感等。因此,商汤成为中国最大的AI算法提供商。
商汤科技的市场占有率居多个垂直领域首位,涵盖智慧城市、智能手机、互动娱乐及广告、汽车、金融、零售、教育、地产等多个行业。目前,商汤科技已与国内外700多家世界知名的公司和机构建立合作,包括美国麻省理工学院、高通、英伟达、本田、阿里巴巴、苏宁、中国移动、银联、万达、华为、小米、OPPO、vivo、微博、科大讯飞等。
商汤科技现已在香港、北京、深圳、上海、成都、杭州、京都、东京和新加坡成立分部。更多信息,请访问商汤科技网站、微信和微博。
好文章,需要你的鼓励
zip2zip是一项创新技术,通过引入动态自适应词汇表,让大语言模型在推理时能够自动组合常用词组,显著提高处理效率。由EPFL等机构研究团队开发的这一方法,基于LZW压缩算法,允许模型即时创建和使用"超级tokens",将输入和输出序列长度减少20-60%,大幅提升推理速度。实验表明,现有模型只需10个GPU小时的微调即可适配此框架,在保持基本性能的同时显著降低计算成本和响应时间,特别适用于专业领域和多语言场景。
这项研究创新性地利用大语言模型(LLM)代替人类标注者,创建了PARADEHATE数据集,用于仇恨言论的无毒化转换。研究团队首先验证LLM在无毒化任务中表现可与人类媲美,随后构建了包含8000多对仇恨/非仇恨文本的平行数据集。评估显示,在PARADEHATE上微调的模型如BART在风格准确性、内容保留和流畅性方面表现优异,证明LLM生成的数据可作为人工标注的高效替代方案,为创建更安全、更具包容性的在线环境提供了新途径。
这项研究由中国科学技术大学的研究团队提出了Pro3D-Editor,一种新型3D编辑框架,通过"渐进式视角"范式解决了现有3D编辑方法中的视角不一致问题。传统方法要么随机选择视角迭代编辑,要么同时编辑多个固定视角,都忽视了不同编辑任务对应不同的"编辑显著性视角"。Pro3D-Editor包含三个核心模块:主视角采样器自动选择最适合编辑的视角,关键视角渲染器通过创新的MoVE-LoRA技术将编辑信息传递到其他视角,全视角精修器修复并优化最终3D模型。实验证明该方法在编辑质量和准确性方面显著优于现有技术。
这项研究提出了ComposeAnything,一个无需重新训练的框架,可显著提升AI图像生成模型处理复杂空间关系的能力。该技术由INRIA、巴黎高师和CNRS的研究团队开发,通过三个创新步骤工作:首先利用大型语言模型创建包含深度信息的2.5D语义布局,然后生成粗略的场景合成图作为先验指导,最后通过物体先验强化和空间控制去噪引导扩散过程。在T2I-CompBench和NSR-1K基准测试中,该方法远超现有技术,特别是在处理复杂空间关系和多物体场景时表现卓越,为AI辅助创意设计开辟新可能。