随着生成式人工智能的异军突起,数据要素潜能释放,算力赛道竞争加剧,模型训练百舸争流。于政府,于产业,于行业,站在数智创新与数字经济融合的交汇口,如何构建新引擎,制胜新赛道,规范健康发展?围绕人工智能和数据要素协同发展与创新,我们邀请新华三集团数字中国研究院副院长全鑫展开深度对话。
现将内容整理如下,以飨读者。
人工智能是数据要素 达到一定数量和质量后的必然产物
记者:今年年初,国务院发布了数字中国建设的整体的布局规划,提到了数据要素,也提出了对数据要素的明确目标,2025年要实现数据资源规模和质量的快速提升,数据要素的价值要有效地释放。请问数据要素化对于人工智能的落地,和在行业和场景的落地,会起到哪些积极的作用?
全鑫:我个人认为,人工智能实际上是数据要素达到一定数量和质量后的必然产物。
首先,数据是人工智能产生作用的“源”,只有通过对巨量数据的归集治理、挖掘分析,才能让人工智能走上新的台阶,走向通用智能。其次,数据是人工智能有效应用的“本”,人工智能要发挥作用,取决于数据的质量,包括数据内容的精准度,覆盖维度的广泛性、时效性等。比如,ChatGPT的训练数据更新到了2023年,其能力就得到了大大的提升。最后,数据是人工智能价值体现的“尺”,从数据交易的角度来看,数据是有价值的,人工智能实现的过程,也是对数据价值加工转换的过程。人工智能看不到物理世界,对它来说进和出的都是数据,尤其是通过人工智能所产生的数据,这些数据的价值是衡量人工智能价值的标尺。
另外,数据的社会效应,比如是否符合道德和法规的约束,也是它价值的一种体现。总的来说,数据在人工智能中起到源头、根本和度量的作用。
技术奠基、平台联接、应用牵引 人工智能发展需系统布局
记者:我们看到国家和地方为推动人工智能的发展也出台了相应的政策,比如一系列行动计划,上海、天津、北京的工作报告也都有所强调。这些政策呈现出了哪些特征和趋势?
全鑫:与此前关注数字经济或数字产业不同,近年来越来越多的推动政策更聚焦于人工智能。政策变化首先体现在技术创新、产业发展和场景应用等方面。技术创新包括从芯片到算法,再到数据治理的能力。产业发展方面,许多地方提出了人工智能产业发展目标和区域,因为人工智能需要参与产业的支撑。场景应用方面,对人工智能发展都提出了一些特定的方向,以解决实际问题。
此外,政策还关注数据要素供给、算力资源支持、包容审慎的监管态度等特征。包括像有的地方通过发放算力券来提供算力资源扶持,以及制定相关管理办法和标准规范来推动人工智能的健康发展。最后,双碳绿色发展也受到关注,如IDC机房的绿色化改造,以及促进绿色的云计算等降低能耗的技术发展,都被认为是政策发展方向。
记者:我们看到人工智能的产业分成了三层,底层是算力层,中间是人工智能平台层,上层是应用层。全力发展大模型,还是聚力做应用,业界有各种声音。那您认为政策的着力点应该在哪个层次?为什么?
全鑫:有统计数据显示我国目前有200多个人工智能大模型,其实国外也多,我认为这并不是问题。对于政策的着力点,重要的是要分析底层智能算力、人工智能平台和人工智能应用这三层之间的关系。底层起着基础支撑作用。平台则像桥梁一样,将底层的能力和上层的应用联接起来,并负责一些通用计算方法的协同。上层应用是牵引。
我认为这三层都是重要的,都需要政策给予有针对性的支持。对于底层,我们不仅要关注算力能力的提升,比如芯片制造、网络支撑、高速存储等,还要有一些政策方面的引导,如绿色低碳、税收优惠等,避免重复建设和浪费也是必要的。对于人工智能平台,更重要的是协同,现在的各种平台都是开放的,这一层的政策主要是确保生态的繁荣和标准化、互操作性。对于应用方面,最能体现人工智能价值的是应用成效,更多的是如何组织好应用的生态,如合作交流机制,产业孵化平台等。
总的来说,政策的着力点不仅仅是要着重对哪一层进行发展,而是需要系统地考虑问题,全面发展各层面,避免影响人工智能的总体发展。
记者:三层都要去发展,不能有短板。我们看到AIGC是今年最热门的话题,大家都希望用到AIGC这项技术,提高自己的效率,提高自己的价值。那么AIGC这个技术真正进入行业市场,成为真正意义上的标配,还需要做哪些事?
全鑫:尽管AIGC现在非常火爆,但是无论在国内还是国外,要真正让它进入行业并取代关键环节和核心流程,还有很大的差距。因此,我认为我们需要在创新能力、应用模式和实施路径上做相应的探索。
首先说创新能力。现有的技术,如深度学习和AIGC的生成能力,到了企业怎么与业务结合?如何让企业的原有模式和方法产生变化?这个是要探索的。
其次,我们需要关注应用模式的变化。比如从用键盘鼠标对着屏幕的交互模式,转变为用自然语言的交互模式,甚至取消屏幕,纯粹靠语言交流。在这种应用模式下,我们如何实现个性化和定制化的能力,如何让它准确地理解规范化的执行,都是我们需要关注的问题。
最后,实施路径也很重要。我们现在有强大的算力,强大的网络,多种技术,以及存储的大量数据,这些都是把人工智能技术广泛应用起来的基础。总的来说,要让AIGC在行业中普遍有效地应用起来,我们还需要走很长的路。
“专”于城市百行百业 深入场景数智革新
记者:具体到对城市的数字化的整体发展,人工智能会带来哪些影响?
全鑫:关于人工智能对城市发展的影响,我们在多个地方进行了实践。首先是城市治理,人工智能大大提升了治理效率,比如市民热线,传统的方式是接听、派单、处置和反馈过去都是通过人来完成,现在由人工智能服务这些环节,效率大幅提升。其次,在公共服务领域,比如教育、医疗、医保、社区、养老等领域,疾病的预防、诊断、治疗、护理以及应对公共卫生应急事件等,人工智能的处理能力有显著优势。第三是经济发展,人工智能在加速企业数字化转型方面发挥着重要作用,微观上如物流算法等,宏观上如产业布局和产业发展之间的关系,都可以通过人工智能技术进行精准调控和智能分析。此外,人工智能还在资源可持续发展、公共安全和应急领域都将发挥重要作用,促进城市数字化的发展。
记者:政府和企业在人工智能和数据要素的结合上,如何才能更好地协同推进,这方面您有什么看法?
全鑫:无论是政府还是企业,要将人工智能、数据及其他技术如区块链、元宇宙等协同应用起来,首先要经历一个技术融合的过程,并实现协同发展。在具体行业和区域应用时,需要考虑数据的敏感性和价值指向性。新华三提出了“行业专注、区域专属、数据专有、价值专享”的理念,以进行私域大模型的部署。
“行业专注”就是要和行业伙伴一起,打通垂直应用数据,形成精准、精确、精益的私域垂直智能,培养解决行业需求的特定能力,帮助百行百业建设最懂“行”的私域大模型。“区域专属”就是要和各地政府、企业一起,凸显地域特色,横向融合数据,贯通区域服务,建设最懂“你”的私域大模型。“数据专有”就是要确保To B、To G的数据不在公域分享,可用不可见,帮助客户以私有数据训练订制化的人工智能,安全拥抱AIGC时代。“价值专享”就是根据客户需求,量身定制AI能力,有针对性地解决行业发展的痛点、区域治理的难点问题,用AI创造专属于域内客户的独特价值。
总之,这四个“专”的私域大模型部署模式是适应市场的有效做法,有助于为行业和客户提供安全有效的应用模式。
记者:加速政务数据要素的价值释放,政府和企业应如何合作?
全鑫:政府在采集数据时,受到严格的法律法规约束,只有在完成特定任务时才能进行。因此,在数据开放问题上政府会更加谨慎。当前,我们对数据权属的认定和安全责任的划分还没有解决。因此,数据,尤其是政务数据的价值释放需要审慎推进。数据权属形式、存在形式、价值体现形式与土地等传统要素有很大区别,需要有适应数据要素专有特性的交易模式。
在释放政务数据价值时,可以考虑以下三种途径:首先是公共数据开放,只要使用数据的行为符合法律法规,不侵犯他人权益,就可以开放数据。其次是授权运营,对于一些相对敏感的数据,可以通过隐私计算,以提供服务、提供核验等方式,让一部分人或一些领域先行使用。最后是流通交易,涉及数据流通增值和数据交易两方面。在这一过程中,交易所的设置并不是最重要的,最重要的是数据产品和服务能力的形成,因为这样将意味着数据价值的产生、体现和提升,只有有价值的事物才会得到发展。
记者:政府在运用大模型和生成式AI的过程中,会面临到哪些主要的问题?
全鑫:对政府来说,利用和发展AI首先要考虑的是AIGC的发展与国家战略方向的融合,即AIGC的发展应该成为经济发展、社会发展、科技创新的推动力。其次,政府需要考虑政策规章和法律保障的问题,即在保证发展的同时,也要划定底线,确保数据隐私和算法公正,避免出现歧视等问题。第三个问题是资源供给,包括数据资源和算力基础设施的供给,这是AIGC发展的基础,需要政府的关注和投入。最后,政府需要推广应用场景,解决实际问题,产生实在价值,例如通过数字化、智能化提升交通、能源、水利等行业的运行效率和服务水平。此外,政府还需要考虑跨部门协同、资源整合、提升公民数字素养、安全保障等问题。
记者:在城市的AI应用的探索方面有哪些需要重点关注的领域?
全鑫:我们在西安、郑州、黄石、滨江等地开展了一些城市应用项目,如数字公务员、12345热线、市志助手、工业智库助手、科创培育、工业设计、机场管理等。这些实践的示范意义主要在于探索方式方法,因为AIGC作为通用人工智能,将从根本上重构和重塑产业、行业的发展。为此,我们需要关注以下几个方面:
首先是模型的训练。我们训练自己的私域大模型百业灵犀(LinSeer),使其具备泛化能力,提高理解、接受和执行能力。其次是针对垂直行业的数据进行微调,形成专用模型,提高使用专业度。
在实际使用过程中,还需关注知识库与AIGC能力的结合。知识库包括用户的知识库,如规章制度、使用手册等,和互联网实时数据,如实时的新闻、天气预报等,可通过API接入。这样可以消除AIGC的“幻觉”,实现专业性和时效性知识的有效利用。
此外,我们还需以业务实现为牵引,将人工智能的能力与业务流程用编程方式结合,即所谓的agent模式。通过指令编排和应用AI驱动,将复杂的业务归结为有效、快速的处理机制。
总之,AIGC的训练能力、微调能力,以及推理特别是结合知识库的推理,结合编程的流程控制等,都是对行业发挥示范作用的关键要素。
记者:我们看到新华三参与了全国近30个省市智慧城市相关标准的制定工作。在参与全国政策研究、规划,以及行业标准方面,新华三有哪些具体实践?
全鑫:地方政府在制定政策时日益呈现出开放的态度。作为企业,我们希望政策能大力支持算力基础设施的发展。当我们提到算力时,除了芯片制造和智能算力,还应关注网络运载力和数据存储力,这些都是产业发展需要考虑的方向。与以往的产业发展不同,AIGC代表的人工智能发展,具有系统性和协同性,涉及政策、数据要素等多个方面。
标准方面,我们全方位参与了信通院、标准化院等相关标准的制定工作。无论是数据中心建设、服务器制造、算法模型还是安全等方面的标准,我们都深度参与其中,全力推动行业的标准化进程。
记者:针对现在的AI技术,特别是围绕AIGC的理论和能力,我们如何再进行突破创新?
全鑫:AIGC的能力以及它的创新方向,需要进行分层次分析。AIGC不是单独的技术方向,而是基于多种技术、多方协同和多应用场景的产物,因此对AI的研究,包括理论和技术的创新,需要进行全面深入思考。
在技术层面,我们需要探索如何构建异构算力,如何有效利用海量存储,如何实现无损、高速的网络传输,以及如何实现主动的安全保护。在平台层面,我们需要研究算力调度、模型调度,以及如何将向量数据库和实际知识库与服务匹配等问题。在应用层面,我们需要实现全链条、跨领域、多场景的业务结合,这是AIGC与传统技术发展的重要区别。在安全方面,我们需要关注安全问题的发现、处理和监控。传统的杀毒、防御、态势感知模式在AIGC领域中,将更多地依赖新的技术和能力来保障安全,即所谓的“用魔法打败魔法”。
全鑫:在AIGC的发展过程中,我们需要保持冷静的思考。这并不是要降低热度,而是为了让这种热度能够持续下去,找到更好的切入点、结合点或者迸发点。我们需要以精耕务实的态度,沉下心来思考问题,深入研究技术和理论。AIGC时代刚刚开始,未来的发展空间广阔,因此我们要特别关注核心能力的进化,在技术、管理以及理念上持续创新。
好文章,需要你的鼓励
AMD CIO的职能角色早已超越典型的CIO职务,他积极支持内部产品开发,一切交付其他部门的方案都要先经过他的体验和评判。
医学生在选择专业时,应当考虑到AI将如何改变医生的岗位形态(以及获得的薪酬待遇)。再结合专业培训所对应的大量时间投入和跨专业的高门槛,这一点就更显得至关重要。
我们拥有大量数据,有很多事情要做,然后出现了一种有趣的技术——生成式AI,给他们所有人带来的影响。这种影响是巨大的,我们在这个领域正在做着惊人的工作。