长城修缮不比其它可放在室内完成的文物修缮,其修缮过程从勘察到施工都存在着极大的挑战。传统的勘察手段十分原始,大部分工作需要工作人员亲历亲为,如进行田野调查、整合地理信息成果、整理图像数据等。修缮施工需遵循着“修旧如旧”的文物修缮原则,而传统勘察手段极难满足修缮施工所需要的数据。
2014年,国家文物局印发了《长城保护维修工作指导意见》。《意见》强调了长城保护的这一原则,称“长城保护维修必须保持长城的原形制、原结构,优先使用原材料、原工艺”。
在勘察阶段,传统的勘测数据来源以田野调查为参考,以整合处理的基础地理信息成果为基础,并结合了彩色数字正射影像。2006年,中央政府发布了《长城测量内容与方式》一文,文中介绍了更先进的测量工作主要由“飞机遥感实测长城”结合人工完成的遗址土壤鉴定、通过地理信息系统技术还原长城全貌、以及通过全球卫星定位技术定位地理坐标这三类途径完成。
传统的勘察手段完全不能保证还原精度,而由人工完成对大量图片的处理让勘察过程就耗时惊人,为后续的修缮施工带来了诸多不便,也并不能完全满足施工需求。而传统的勘察手段只能局限于人可以踏足的部分,那些人类难以涉足的处于险峻之地的长城,我们能做的曾非常少。
英特尔与文保基金会合作的首个项目就是利用英特尔人工智能技术修缮几百年来从未用技术手段系统修缮过的箭扣长城。英特尔的解决方案将是一个全新的探索,先进的无人机航拍和人工智能技术将被投入勘测、3D建模及数字化修复、及修缮工程人力物力成本估算等多个步骤,英特尔的计算技术将深度参与其中。
英特尔的方案是,基于Xeon至强可扩展处理器,英特尔固态盘,同时结合OpenMP/MPI并行优化技术,采用针对英特尔CPU优化的英特尔®深度神经网络数学核心函数库(MKL-DNN),以及面向英特尔架构优化的深度学习框架Tensorflow等工具,高效地实现长城3D建模和数字化修复,并达到厘米级精度的效果。
英特尔至强服务器,为人工智能的开发者提供了全套的开发工具链,允许开发者根据深度学习的数据复杂度对内存的需求按需配置。在此基础上,英特尔中国研究院和武汉大学将开发出长城缺损/裂缝识别与定位,数字化修复的深度学习算法,包括长城缺损/裂缝识别与定位,及长城数字化模型虚拟修复。
针对损毁及裂缝类型,研究人员在正常的和损毁的长城3D模型上进行样本采集和标定,获取足够多的样本数据,用于训练深度学习网络,并针对3D模型的不同视角的2D视图和剖面图,进行大量数据样本的训练分析,形成对典型损毁模式的识别能力。
当一段长城的损毁部位识别出来之后,AI就会进行数字化的虚拟修复,在损毁的模型上生成3D的修复效果和砖墙纹理,并获得物理修缮所需的工程量的数据,作为对物理修缮的参考建议。在数字化修复中,大运算量的2D/3D模型生成技术将得到应用。无论是2D还是3D模型的生成网络训练,其数据输入量和运算量都是惊人的,只有英特尔至强服务器能够提供完整的支持。
英特尔AI的数字化修复会遵循“修旧如旧”的文物修缮原则,为长城修缮工程提供详细的位置、效果和所需工程量的估计,作为实际工程有效的参考和对照。
有了英特尔人工智能技术的参与,勘测过程中不再需要工人飞檐走壁冒生命危险实地查看长城的损毁情况。依靠英特尔人工智能技术达到厘米级精度的3D建模和数字化修复手段将是长城保护的新出路。本次合作为未来人工智能技术在文物保护方面的应用的拓展提供了良好的技术思路启发。
好文章,需要你的鼓励
随着员工自发使用生成式AI工具,CIO面临影子AI的挑战。报告显示43%的员工在个人设备上使用AI应用处理工作,25%在工作中使用未经批准的AI工具。专家建议通过六项策略管理影子AI:建立明确规则框架、持续监控和清单跟踪、加强数据保护和访问控制、明确风险承受度、营造透明信任文化、实施持续的角色化AI培训。目标是支持负责任的创新而非完全禁止。
NVIDIA研究团队开发的OmniVinci是一个突破性的多模态AI模型,能够同时理解视觉、听觉和文本信息。该模型仅使用0.2万亿训练样本就超越了使用1.2万亿样本的现有模型,在多模态理解测试中领先19.05分。OmniVinci采用三项核心技术实现感官信息协同,并在机器人导航、医疗诊断、体育分析等多个实际应用场景中展现出专业级能力,代表着AI向真正智能化发展的重要进步。
英国正式推出DaRe2THINK数字平台,旨在简化NHS全科医生参与临床试验的流程。该平台由伯明翰大学和MHRA临床实践研究数据链开发,能够安全传输GP诊所与NHS试验研究人员之间的健康数据,减少医生的管理负担。平台利用NHS现有健康信息,安全筛查来自450多家诊所的1300万患者记录,并使用移动消息系统保持试验对象参与度,为传统上无法参与的人群开辟了研究机会。
Salesforce研究团队发布BLIP3o-NEXT,这是一个创新的图像生成模型,采用自回归+扩散的双重架构设计。该模型首次成功将强化学习应用于图像生成,在多物体组合和文字渲染方面表现优异。尽管只有30亿参数,但在GenEval测试中获得0.91高分,超越多个大型竞争对手。研究团队承诺完全开源所有技术细节。