今天上午,国家数据局正式揭牌。
今年3月,根据国务院关于提请审议国务院机构改革方案的议案,组建国家数据局,负责协调推进数据基础制度建设,统筹数据资源整合共享和开发利用,统筹推进数字中国、数字经济、数字社会规划和建设等,由国家发展和改革委员会管理。
历时7个月,如今终于尘埃落定,两名领导也正式亮相。7月,刘烈宏被任命为国家数据局局长,10月沈竹林被任命为国家数据局副局长。
另外据了解,国家数据局已经启动招聘,计划在国考中招录12人,岗位要求涉及数据治理和发展政策研究、数字经济国际合作、数据基础制度和政策研究、数据资源管理和开发利用、数字产业化和产业数字化等。
激活数据要素,推动数字经济驶入“快车道”
我国拥有庞大的数据量,数据显示,2022年中国数字经济规模超过50万亿元,总量稳居世界第二,占GDP比重41.5%。与此同时,数据交易类企业机构的数量也在快速增长,截至2022年底,我国现有数据交易类企业超9.2万家。
但据统计,2022年,我国数据交易额仅为700亿元,难以满足企业用数需求。具体原因还是数据合规成本高、数据权属、数据安全风险,以及数据合理定价难,导致企业“不敢交易”、“不愿交易”。
面对当前数据交易机制仍不成熟,供需匹配效率低,数据资产没有得到充分利用的挑战,国家数据局可以说是应时而生。国家数据局的组建可以更好地从顶层解决数据要素在生产流通中面临的确权、分配、安全等一系列数字经济发展中的关键问题,进而释放数据要素价值,推动数字经济发展驶入“快车道”。
此前至顶智库也针对国家数据局组建进行了解读。伴随新一代信息技术的快速发展,数字经济与生产生活的融合程度进一步加深。作为数字经济时代的关键生产要素,数据对劳动力、技术等生产要素具有放大、叠加、倍增作用,提升经济社会各领域的资源配置效能。
目前,北京、上海、重庆、贵州、福建、山东、浙江、广东等18个省市区已相继成立数据管理相关机构,承担地方大数据建设、管理和服务等职责。从全国层面组建国家数据局,设立数据领域的专业职能部门,一方面能进一步完善我国数据基础制度和协同监管机制;另一方面对于大数据基础产业和应用层面的人工智能等战略新兴产业,也会带来积极影响,推动我国数字经济实现高质量发展。
国家数据局的任务是啥,哪些产业受到利好?
浙江大学国际联合商学院数字经济与金融创新研究中心联席主任盘和林认为,国家数据局的主要任务有三个方面:
一是维护数据安全,这是我国数据产业发展的基础要求,当前国家数据局就是从制度层面通过立法和标准化推动数据安全。二是加速数据要素市场化,扫清数据要素市场上的一些障碍,比如平台之间的数据壁垒,数据交易制度不完善,数据确权问题等。三是加速数据应用发展,未来国家数据局将牵头数据应用关键技术的研发,比如智造、AI、元宇宙、自动驾驶等等。
他表示,组建国家数据局将对大数据基础产业,包括数据的收集、存储、处理、清洗、预标注等产业产生积极推动作用,对数据应用层面的大数据产业和人工智能产业发展产生积极影响,对数据支撑的算力和算法领域也有助推,算力包括终端算力的智能芯片和云端算力的智算中心,数据中心等等,未来ICT设备产业将因此受益。
上海社科院信息研究所副所长丁波涛认为,国家数据局未来可能会解决两个方面的问题,第一个是整合国家层面的数据资源,推动国家数据资源的利用共享。国家数据局作为国家政府部门,可能不会直接成为数据的供给者,未来国家数据局底下可能会成立类似上海大数据中心的机构,负责整理各委办局的数据。
好文章,需要你的鼓励
这项研究由浙江大学、复旦大学等机构联合完成,提出了ReVisual-R1模型,通过创新的三阶段训练方法显著提升了多模态大语言模型的推理能力。研究发现优化的纯文本冷启动训练、解决强化学习中的梯度停滞问题、以及分阶段训练策略是关键因素。ReVisual-R1在各类推理基准测试中超越了现有开源模型,甚至在某些任务上超过了商业模型,为多模态推理研究开辟了新途径。
这项研究提出了一种名为"批评式微调"的创新方法,证明仅使用一个问题的批评数据就能显著提升大语言模型的推理能力。研究团队对Qwen和Llama系列模型进行实验,发现这种方法在数学和逻辑推理任务上都取得了显著提升,平均提高15-16个百分点,而且只需要强化学习方法1/20的计算资源。这种简单高效的方法为释放预训练模型的潜在推理能力提供了新途径。
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。