今天上午,国家数据局正式揭牌。
今年3月,根据国务院关于提请审议国务院机构改革方案的议案,组建国家数据局,负责协调推进数据基础制度建设,统筹数据资源整合共享和开发利用,统筹推进数字中国、数字经济、数字社会规划和建设等,由国家发展和改革委员会管理。
历时7个月,如今终于尘埃落定,两名领导也正式亮相。7月,刘烈宏被任命为国家数据局局长,10月沈竹林被任命为国家数据局副局长。
另外据了解,国家数据局已经启动招聘,计划在国考中招录12人,岗位要求涉及数据治理和发展政策研究、数字经济国际合作、数据基础制度和政策研究、数据资源管理和开发利用、数字产业化和产业数字化等。
激活数据要素,推动数字经济驶入“快车道”
我国拥有庞大的数据量,数据显示,2022年中国数字经济规模超过50万亿元,总量稳居世界第二,占GDP比重41.5%。与此同时,数据交易类企业机构的数量也在快速增长,截至2022年底,我国现有数据交易类企业超9.2万家。
但据统计,2022年,我国数据交易额仅为700亿元,难以满足企业用数需求。具体原因还是数据合规成本高、数据权属、数据安全风险,以及数据合理定价难,导致企业“不敢交易”、“不愿交易”。
面对当前数据交易机制仍不成熟,供需匹配效率低,数据资产没有得到充分利用的挑战,国家数据局可以说是应时而生。国家数据局的组建可以更好地从顶层解决数据要素在生产流通中面临的确权、分配、安全等一系列数字经济发展中的关键问题,进而释放数据要素价值,推动数字经济发展驶入“快车道”。
此前至顶智库也针对国家数据局组建进行了解读。伴随新一代信息技术的快速发展,数字经济与生产生活的融合程度进一步加深。作为数字经济时代的关键生产要素,数据对劳动力、技术等生产要素具有放大、叠加、倍增作用,提升经济社会各领域的资源配置效能。
目前,北京、上海、重庆、贵州、福建、山东、浙江、广东等18个省市区已相继成立数据管理相关机构,承担地方大数据建设、管理和服务等职责。从全国层面组建国家数据局,设立数据领域的专业职能部门,一方面能进一步完善我国数据基础制度和协同监管机制;另一方面对于大数据基础产业和应用层面的人工智能等战略新兴产业,也会带来积极影响,推动我国数字经济实现高质量发展。
国家数据局的任务是啥,哪些产业受到利好?
浙江大学国际联合商学院数字经济与金融创新研究中心联席主任盘和林认为,国家数据局的主要任务有三个方面:
一是维护数据安全,这是我国数据产业发展的基础要求,当前国家数据局就是从制度层面通过立法和标准化推动数据安全。二是加速数据要素市场化,扫清数据要素市场上的一些障碍,比如平台之间的数据壁垒,数据交易制度不完善,数据确权问题等。三是加速数据应用发展,未来国家数据局将牵头数据应用关键技术的研发,比如智造、AI、元宇宙、自动驾驶等等。
他表示,组建国家数据局将对大数据基础产业,包括数据的收集、存储、处理、清洗、预标注等产业产生积极推动作用,对数据应用层面的大数据产业和人工智能产业发展产生积极影响,对数据支撑的算力和算法领域也有助推,算力包括终端算力的智能芯片和云端算力的智算中心,数据中心等等,未来ICT设备产业将因此受益。
上海社科院信息研究所副所长丁波涛认为,国家数据局未来可能会解决两个方面的问题,第一个是整合国家层面的数据资源,推动国家数据资源的利用共享。国家数据局作为国家政府部门,可能不会直接成为数据的供给者,未来国家数据局底下可能会成立类似上海大数据中心的机构,负责整理各委办局的数据。
好文章,需要你的鼓励
OpenAI CEO描绘了AI温和变革人类生活的愿景,但现实可能更复杂。AI发展将带来真正收益,但也会造成社会错位。随着AI系统日益影响知识获取和信念形成,共同认知基础面临分裂风险。个性化算法加剧信息茧房,民主对话变得困难。我们需要学会在认知群岛化的新地形中智慧生存,建立基于共同责任而非意识形态纯洁性的社区。
杜克大学等机构研究团队通过三种互补方法分析了大语言模型推理过程,发现存在"思维锚点"现象——某些关键句子对整个推理过程具有决定性影响。研究表明,计划生成和错误检查等高层次句子比具体计算步骤更重要,推理模型还进化出专门的注意力机制来跟踪这些关键节点。该发现为AI可解释性和安全性研究提供了新工具和视角。
传统数据中心基础设施虽然对企业至关重要,但也是预算和房地产的重大负担。模块化数据中心正成为强有力的替代方案,解决企业面临的运营、财务和环境复杂性问题。这种模块化方法在印度日益流行,有助于解决环境问题、满足人工智能的电力需求、降低成本并支持新一代分布式应用。相比传统建设需要数年时间,工厂预制的模块化数据中心基础设施可在数周内部署完成。
法国索邦大学团队开发出智能医学文献管理系统Biomed-Enriched,通过AI自动从PubMed数据库中识别和提取高质量临床案例及教育内容。该系统采用两步注释策略,先用大型AI模型评估40万段落质量,再训练小型模型处理全库1.33亿段落。实验显示该方法仅用三分之一训练数据即可达到传统方法效果,为医学AI发展提供了高效可持续的解决方案。