电影《流浪地球2》里各种硬核科技让人眼花缭乱,我印象最深的,是影片关于数字生命这个半科学半哲思的设定。
刘德华饰演的工程师图恒宇在女儿丫丫濒死之际,将她的意识上传到了550A计算机中,以“数字生命”的形式为女儿续命。在流浪地球计划的最后一步,需要重启全球互联网,但北京的根服务器被淹没,科学家溺亡,绝境时是数字生命丫丫记住了密钥,与同样成为数字生命的图恒宇逆转了局势。
数字生命看似与“流浪地球”的主题相反,但电影最终把高光给了它。
数字生命的进化史
数字生命思想的诞生据说与一次偶然的事故有关。1975年夏天,美国圣菲研究所教授兰顿在一次滑翔事故中受了重伤,险些丧命,康复过程中,他博览生物学、哲学、遗传学和科幻小说等书籍,这让他越来越确信,没有什么生命有机体不能在计算机中重建。后来,他提出了在计算机中创造“硅化生命”的思想。
1990年,世界上第一例数字生命模型Tierra,诞生在托马斯·雷的计算机中。他将生命进化的概念引入计算机领域,利用计算机提供的资源为数字生命提供生存环境。托马斯·雷设计的数字生命以数字为载体,目的是探索生命进化过程中的各种现象和规律。
这些早期的数字生命研究多是从无到有的数字原生,研究对象主要是具备生物学特性的“有机体”,而非人类。到《流浪地球2》中呈现的数字生命,已经是直接将人类意识上传到计算机而来。
无论是这部《流浪地球2》,还是此前的《黑镜》《西部世界》《上载新生》等科幻作品,我们当下距离这些影视所呈现的数字生命还非常遥远。现实与科幻间的沟壑,只能依靠技术日积月累地填补,要想初步实现数字生命,得有完美的脑机接口实现与脑波交互,记录各种意识活动对应的大脑活动模式;得有准确的大脑结构快照记录大脑的神经元连接结构,复制记忆;最后还要通过全脑仿真完成思维拟合,重建意识。实现这些需要量子计算、脑机接口、基因测序、数字孪生等技术的持续突破。
相比脆弱的人体,数字生命存在于计算机系统中,不仅“聪明绝顶”,理论上,只要有电且软硬件不出问题,人就能以数字化的形式一直活下去,在数字世界实现“永生”。比起古时的炼丹修仙,数字生命也许真的拉近了一点人类和永生的距离。
但数字生命算真正活着吗?迭代了几百次的丫丫还是图恒宇的女儿吗?
数字生命到底是什么?
影片中的数字生命丫丫,目光会随着人的动作移动,能感知到现实世界,与图恒宇交流,这背后其实是计算机视觉和自然语言处理技术的作用。即便数字生命能完整复制你的记忆、人格、思维、情感,但终究不是原本有血有肉的你,数字的“你”只是一行行代码,是电脑程序模拟出来的虚拟生命,一个数字副本。
抛开亲情的羁绊,电影中另一位科学家马兆的观点似乎更令人深思,他认为“数字生命不过是电子宠物”,“没有人的文明,毫无意义”。
不过现在讨论数字的“你”是不是你还为时尚早,我们所处的现实世界,末世没有降临,我们也没有面临带球跑还是在数字世界永生的抉择。相比数字生命这个终极命题,数字人、元宇宙、脑机接口、数字孪生等跟数字生命相关的技术和应用离我们要近得多。通过拆解它们与数字生命的关系,也能进一步了解数字生命。
首先,数字人是数字生命吗?
回答这个问题,先要弄清楚什么是数字生命。《流浪地球2》科学顾问王元卓表示,数字生命简单来说就是一种拥有自我意识的智能体。这个智能体可能是程序从无到有不断学习、进化来的,也可能是通过对人脑或者生物的信息采集生成的。
这么看,电影中丫丫属于采集生物信息转化来的,MOSS则偏向程序自然而然产生了意识。
这里有一个关键信息,数字生命要有“自我意识”,目前的数字人显然都不具备自我意识,所以并不能算是数字生命。它们要么是智能驱动型,比如新华社播报新闻的“AI合成主播”,要么是真人驱动型,比如洛天依、柳夜熙、AYAYI、A-SOUL等,空有数字外壳,内核其实是“中之人”。
第二,近两年火热的元宇宙与数字生命是什么关系?
元宇宙,可以理解成是数字生命生存的空间。元宇宙是一个数字原生世界,数字化的人在这个世界里去做各种各样的事情,这里就是数字生命的天和地。
第三,自我意识到底是什么?
电影开始,数字生命派的科学家对着镜头说“人,就是一堆电信号”。从生物学上看,人类大脑中约有1000亿个神经元,互相通过突触联系,突触在传递信息时,神经递质介导的化学信号会转化为电信号。也就是说,人的意识本质是大脑神经电化学信号的产物。
那么对脑电信号进行观测是否就能还原人类意识?
脑机接口是数字生命的钥匙?
在电影《黑客帝国》里,“脑后插管”的场景让人印象深刻,只要一根线接入大脑就能接管大脑的神经系统,人们就能进入虚拟世界Matrix。《阿凡达》里,通过意念控制阿凡达以及阿凡达连接灵魂树,也是类似的设定。
事实上,“脑后插管”已经不只是一种想象了,将人类大脑与计算机相连的技术正在紧锣密鼓地探索推进中。
2022年底,马斯克在脑机接口公司Neuralink的发布会上,向公众展示了猴子用意念打字的场景,声称已经成功解码动物的神经信号,并向FDA(美国食品药品监督管理局)提交了文件,表示再过6个月就能开始人体实验,为人脑植入芯片。
Neuralink以外,很多科技公司都在进行脑机接口的研发和产业布局,但从体验层面看,脑机接口的感知仍处于一个很初级的水平,当前脑机接口研究更偏向在脑控方面,离数字生命还很远。
要实现数字生命,得把人类大脑完整神经网络拷贝到计算机上,所需的数据量不可想象,即便成功,也只是复制了大脑在某一时刻的静态。要想有“意识”,还需要计算机模拟出神经网络的运作,这是极其困难的。
电子科技大学信息医学中心主任尧德中在采访中表示,影响脑机接口解码准确性的一个重要原因是个体差异、状态差异非常大,建立脑机接口的理论模型是一个有效的方法,若能成功建立起一个人精确的数字孪生脑模型,人的思维、记忆等就能够在这个脑模型中存储、运行、迭代更新。如果未来这个数字孪生脑模型进化到能更真实地反映大脑活动,实现脑功能的“孪生”,那未来意识在数字世界永生也是可能的。
立足眼下,脑机接口在现实中也已经有了很多应用场景,在医疗健康领域,脑机接口可以用来监测和预防精神疾病,也可以帮助人们直接通过思维控制设备。根据近日消息,脑机接口创企Synchron,正在几名瘫痪病人身上进行临床试验,让他们利用思维操控电脑光标和智能家居等设备,改善日常生活。
电影中的数字生命离我们很远,但“初级的数字生命”已经向我们走来。
好文章,需要你的鼓励
这项研究介绍了VisCoder,一个经过专门微调的大语言模型,用于生成可执行的Python可视化代码。研究团队创建了包含20万样本的VisCode-200K数据集,结合了可执行代码示例和多轮修正对话。在PandasPlotBench基准测试中,VisCoder显著优于同等规模的开源模型,甚至在某些方面超越了GPT-4o-mini。研究还引入了自我调试评估模式,证明了反馈驱动学习对提高代码可执行性和视觉准确性的重要性。
这项研究提出了"适应再连续学习"(ACL)框架,一种创新的方法解决预训练模型在连续学习中的稳定性-可塑性困境。通过在学习新任务前先对模型进行适应性调整,ACL使模型既能更好地学习新知识(提高可塑性),又能保留已有知识(维持稳定性)。实验证明,该框架能显著提升各种连续学习方法的性能,为解决人工智能系统中的"灾难性遗忘"问题提供了有效途径。
这篇研究首次关注了CLIP模型文本编码器的对抗鲁棒性问题,提出了LEAF方法(Levenshtein高效对抗性微调)来增强文本编码器的稳健性。实验表明,LEAF显著提高了模型在面对文本扰动时的性能,在AG-News数据集上将对抗准确率从44.5%提升至63.3%。当集成到Stable Diffusion等文本到图像生成模型中时,LEAF显著提高了对抗噪声下的生成质量;在多模态检索任务中,它平均提高了10个百分点的召回率。此外,LEAF还增强了模型的可解释性,使文本嵌入的反演更加准确。
BenchHub是由韩国KAIST和Yonsei大学研究团队开发的统一评估平台,整合了38个基准中的30万个问题,按技能、学科和目标类型进行精细分类。研究显示现有评估基准存在领域分布偏差,而BenchHub通过自动分类系统和用户友好界面,让用户能根据特定需求筛选评估数据。实验证明模型在不同领域的排名差异巨大,强调了定制化评估的重要性。该平台支持多语言扩展和领域特化,为研究人员和开发者提供了灵活评估大语言模型的强大工具。