年初至今,国家关于“新基建”的政策持续发布,引起社会各界广泛关注。目前来看,官方定义的新型基础设施主要包括信息基础设施、融合基础设施、创新基础设施三方面内容。疫情过后,新型基础设施建设将承担起经济复苏的使命,成为我国经济增长的新引擎,同时也是国家治理现代化的必要基础。作为数据智能科技服务专家,联通大数据有限公司充分发挥“5G+大数据+人工智能”优势,积极落实国家政策,秉承央企责任,力争在“新基建”推进过程中贡献新力量、展现新作为。
打造大数据能力底座,支撑行业数字化转型升级
随着数据应用场景的不断丰富,对数据治理、平台能力、基础算力、安全能力等提出了更高的要求:一方面,建设方受数据源范围和深度的限制,既要打通获取渠道,又要具备复杂而庞大的数据处理流程体系,还要保障数据的隐私和安全。另一方面,需要搭建昂贵的计算集群,才能获得足够的算力以满足海量数据的加工分析与模型计算。此外,在时间、精力、人力、财力等多方面的投入让众多政府部门及企业望而却步。
中国联通自2012起率先对全国31省的数据进行集中统一运营,并成立专业子公司—联通大数据有限公司。历经几年沉淀,联通大数据研发了“智慧数开发平台、数据资产管理平台、数据科学研发平台、算力平台、智能运维平台以及安全保障平台”六大平台,积累了“联接能力、管理能力、治理能力、分析能力、应用能力、服务能力”六项大数据能力。以此为基础,为政府、金融、文旅交航、商企等行业的客户提供数字化转型产品和服务。
联通大数据自主研发的“智慧数平台”,实现数据资源的统一接入、集中管控、统一服务,提供四库一平台的可视化能力,让数据会听、会看、会说,可以帮助有需求的政企客户实现不同数据来源、数据格式等资源的有效共享,打破数据孤岛,提升包括政务数据治理在内的数据管控与综合服务中台的建设水平。
同时,联通大数据面向合作伙伴打造了多租户、任务隔离、资源共享、支持多框架通用服务平台-联通数享平台,在安全合规的前提下,为合作伙伴提供算力、算法支撑,能够为政府、企事业单位、各大科研教育机构提供便捷、高效的大数据开发环境和一站式数据开发管理服务,大大降低了政府和企业对数据能力平台的建设门槛和数据科技的使用成本。比如,联通大数据利用该平台与上海城市交通设计院合作,对城市交通数据路网进行分析、建模、决策,为上海市城区规划、综合交通规划、道路专业规划、公交专项规划等方面提供多维度支撑。
赋能AI应用创新,构建行业数字化引擎
近年来,人工智能逐渐渗透进社会运行的方方面面,为构建数据驱动、人机协同、跨界融合、共创分享的智能经济提供发展动力。中国联通AI创新应用中心自主打造了人工智能应用创新平台,采用一个开放平台、7大领域原子能力、N项垂直功能、X个行业系统的“1+7+N+X”规划框架。为多个行业系统的智能化改造提供建议与支撑,如智慧工业、智慧社区、智慧校园、智慧商贸、智慧城管等行业。
据了解,目前该平台可提供人脸识别、人体识别、物体识别、环境识别、NLP等领域的30余项原子能力,部分性能在国际评测中领先,均能封装成API或者SDK供开发者调用,也可以根据客户需求定制开发。目前部分原子能力已应用于人脸通行、明厨亮灶、道路合规监测等,支撑城市精细化管理、智能楼宇等场景。
此外,该平台已具备10余项垂直功能,涉及人脸门禁、人证比对、人流监控、视觉定制化、智能问答、AR/VR、移动机器人、合成人、数字孪生等多个领域。目前已应用在社区安防、校园防控、智能培训等场景,在支撑皮革质检、零部件瑕疵检测、员工操作流程合规检测等领域也有应用。在此次新冠肺炎疫情精准防控和助力复工复产过程中,该平台相关应用在多个检测、防控场景中落地实施。
随着5G的深入,为AI赋能工业互联网领域带来无限想象空间。联通大数据基于5G工业互联网、IoT及前端智能传感设备,采用多项先进人工智能技术,可以实现智慧工厂的厂区智能化和车间智能化。比如,工业视觉检测、操作合规监测、在岗检测、AR维修辅助及培训、机器人远程巡检/参观、数字孪生等高级智能功能,为智能化工厂提高运营效率、实现完全智能运营提供强有力的技术支撑。
运营商作为新型基础设施建设的排头兵,将在未来发挥更加重要的作用。联通大数据表示,在用大数据、AI助力“新基建”领域,公司已具备从成熟的团队到核心技术、再到解决方案的全面能力,致力于为各级政府、企业提供领先的数据智能科技服务,助力新基建,助推数字经济发展。
好文章,需要你的鼓励
这项研究针对现代文档检索系统中的关键缺陷:独立处理文档片段导致丢失上下文信息。研究团队开发了ConTEB基准测试来评估模型利用文档级上下文的能力,并提出了InSeNT方法,结合后期分块和创新的对比学习策略。实验表明,上下文感知嵌入显著提升检索性能,尤其在处理非自包含文本片段时,同时保持计算效率,对分块策略更具鲁棒性,并且在语料库规模扩大时表现更佳。这一研究为更智能的文档检索系统铺平了道路。
这项由布朗大学和Cohere实验室研究者联合进行的研究全面分析了大型语言模型(LLM)安全研究中的语言不平等现象。通过系统回顾近300篇2020-2024年间的安全相关论文,研究发现LLM安全研究严重偏向英语,即使中文这样的高资源语言也仅获得英语十分之一的研究关注,且这一差距正在扩大。研究还揭示非英语语言很少作为独立研究对象,且英语安全研究常忽略语言覆盖文档化。为解决这一问题,研究者提出了三个未来方向:开发文化敏感的评估基准、创建多语言安全训练数据,以及深入理解跨语言安全泛化挑战。
这项研究提出了ChARM,一种创新的角色扮演AI奖励建模框架,通过行为自适应边界和自我进化策略大幅提升AI角色的真实性和一致性。研究团队创建了包含1,108个角色的RoleplayPref数据集,实验表明ChARM比传统模型提高了13%的偏好排名准确率,应用于DPO技术后在多项基准测试中达到了领先水平。这一突破将为娱乐、教育和心理健康支持等领域带来更加自然、个性化的AI互动体验。
这篇研究重新审视了循环神经网络中的双线性状态转换机制,挑战了传统观点。高通AI研究团队证明,隐藏单元不仅是被动记忆存储,更是网络计算的积极参与者。研究建立了一个从实数对角线到完全双线性的模型层级,对应不同复杂度的状态跟踪任务。实验表明,双线性RNN能有效学习各种状态跟踪任务,甚至只需极少量训练数据。研究还发现,纯乘法交互比加法交互更有利于状态跟踪,为循环网络设计提供了新视角。