作为一家美国老牌的金融公司,美国运通公司发展至今已经有170年的历史了,他们的运通卡正为全球过亿会员提供服务。这个生存长达一个多世纪的美国运通公司,如今和其他企业一样,也在全面加速云服务转型。
COVID-19疫情影响下,远程办公与远程学习大规模渗透普及,消费者与企业比以往任何时候都更依赖于云服务,特别是对“Always online”(始终在线)服务提出了更高的要求、更迫切的期待。美国运通公司同样正在思考如何制定云发展战略,从而更好地为用户提供服务。 美国运通公司全球基础设施负责人Evan Kotsovinos,在疫情期间负责制定公司在COVID-19疫情下的技术应对措施。Kotsovinos接受了记者的采访,探讨了他对于云技术的看法。
美国运通公司全球基础设施负责人Evan Kotsovinos
在此次采访中,Kotsovnos阐述了为何采用云技术培训有望实现业务成果最大化。此外,他还谈到一个常见于从业同行当中的云认识误解,并解释了为什么基础设施团队与领导者应该快速成长并转型为策划者。
记者: 云计算仍在持续增长,众多CIO也在着力制定其上云与迁移计划。在您看来,企业上云仍有很长的路要走吗?对于IT组织来说,云转型是否只是时间问题?
Kotsovinos: 在我看来,基于云服务所带来的规模经济效应和创新能力,云普及确实只是个时间问题。上不上云已经不是问题,关键问题在于,怎么用、如何用好云。具体问题包括:企业该如何实现云迁移?他们该采用哪种云模式(私有、公有、混合,或者专属于自己的模式)?项目的推进速度该如何设定?
记者:您能否简要介绍一下美国运通目前的云服务使用方式?
Kotsovinos:我们的方法是采用一套混合架构,保证我们能够在单一安全容器中,一次构建一款应用程序,并灵活地将这些应用程序部署在私有云、公有云或者二者兼有的混合云当中。我们的云之旅已经持续了数年,运通公司也见证了云平台以及云原生开发与实践所带来的强大效益。
记者:云计算的哪些特质,让您对其建立起坚定的信心?
Kotsovinos:与传统本地数据中心相比,云计算具有显著的优势,其中有三点最让我印象深刻。
首先是云能够将生产力与实现速度结合起来。如今,借助云的力量,您可以在人工智能、机器学习或者数据分析等领域获得极其强大的即用型功能。而在此之前,这类方案往往需要耗费内部工程团队几年时间才有可能构建完成。
第二是弹性。在运通公司,立足多种云环境运行同一款应用程序的能力,为我们的业务提供了极高的弹性保障,使我们能够满足运通卡会员的需求、为其提供始终在线的良好体验。
第三,云计算能够产生规模经济效应,我相信这种效应将随时间推移为我们带来巨大的优势。
记者:如今云计算已经得到全面推广,您能不能谈谈运通当前的应用程序开发方法?
Kotsovinos:我们致力于开发云原生应用程序,并致力于以云原生为标准规划未来发展。随着云技术的发展成熟,我们将继续强化这种云原生原则,并降低面向客户的服务交付门槛。
云原生应用程序在架构层面具有极高的可用性,并能够在多种极端情况的影响下,继续为我们的客户提供服务。其业务架构既支持横向扩展、又支持纵向扩展,能够很好地适应需求量的变化。它们还采用可复用组件构建而成——具体来讲,这类应用程序在日志记录、配置管理、端口绑定以及依赖项映射等方面都遵循行业最佳实践,由此实现良好的可移植性。
记者:运通公司在云计算之旅方面可以说是先行者,您认为其中哪些因素最为关键,或者说您认为其他CIO/IT高管在踏上自己的云探索之旅前,应该着重考虑哪些因素?
Kotsovinos:与其他新投资一样,大家首先需要建立起行之有效的结果衡量方法。当然,大家还应着眼于长远,建立起宏观视角。为了衡量我们在云计算方面取得的成效,我们将重点放在总体业务产出方面——而不仅仅关注云计算与本地基础设施之间的成本差异。
再有,要发挥云计算的全部潜能,大家还需要以正确的方式迁移至云端。将遗留应用程序直接上传至云端只能带来有限的收益;只有对应用程序进行部分或者全面的云原生转型,才能让云计算的优势真正变成我们自己的业务优势。
接下来,考虑如何处理非云原生应用程序。将技术债务(即投资组合当中,那些已经过时且需要更新的应用程序)与相对较新、但并非以云原生思路构建的现有应用程序区分开来。大家应该以此为基础考量应用程序的更新周期,并确定优先级以将其逐步迁移至云端。再次强调,一切努力都是为了推动业务产出最大化,而不是为了云迁移而云迁移。
最后,考虑泡沫成本。在将应用程序迁移至云端时,大家可能需要同时在云端与传统基础设施上运行部分应用程序——这会暂时增加运营成本,但只是暂时的,不用太过担心。
记者 :您是否从CIO或者是基础设施领域的同行那里听到过严重的误解性言论?能否为我们做做澄清?
Kotsovinos: 确实是有的,有些人总说云“更便宜”,有些人则认为云“更贵”。其实这两种结论都太过简单粗暴,云既不更便宜、也不更贵。云是另外一种服务交付方式,因此最需要考虑的应该是待交付技术栈的总体成本,而不应单纯纠结于云计算还是本地计算。
记者:企业在推动云迁移时,应该考虑到哪些主要人才挑战?
Kotsovinos:我认为云采用的关键,不仅在于着力加大培训与技能提升方面的投资,同时也应认真宣传并引导工程团队建立起正确的思维方式并与工具。如果没有这两点,云转型之路恐怕走不了多远。
另外,不要以为交付了服务,员工们就一定会买账。新的时代下,基础设施团队的职能不仅仅是建立并交付相关功能,同时还要保证用户以正确的方式理解并采用这些功能。基础设施团队应该成为软件工程团队最值得信赖的合作伙伴、顾问与帮手。基础设施团队与领导者,应该与开发人员分享各种经验与规划思路。
记者:面对未来,哪些关键的长期技术变化会对基础设施产生深远影响?
Kotsovinos:我目前最关注的是两项长期发展趋势,可能会在未来几年内彻底改变我们对于计算机架构以及技术基础设施的理解。
首先就是量子计算,有望在特定类型的问题中极大提高解决速度,但其稳定性与可用性仍然无法与目前的主流传统计算硬件相媲美。其次,超高容量非易失性存储器的兴起,可能将现有存储器结构(调整缓存、RAM、存储)融合为统一的大规模持久性存储器阵列。
好文章,需要你的鼓励
TPU与GPU之间的竞争正在重塑AI硬件市场格局。GPU基于并行处理,能处理多样化任务,而TPU专门针对张量矩阵运算进行优化。谷歌TPU采用类似RISC的设计理念,通过限制功能来提升特定运算效率。随着Meta计划在2027年采购数十亿美元的TPU芯片,Anthropic宣布使用百万TPU训练Claude模型,TPU生态系统正在获得发展动力,对英伟达的GPU霸主地位构成挑战。
Meta与华盛顿大学联合研究团队开发出无需人类标注的AI评判官自我训练框架。该方法通过生成合成对比数据、自我判断筛选和反复学习,使110亿参数的AI评判官在多项视觉语言任务中超越GPT-4o等大型模型,成本仅为传统方法的1%,为AI自主学习和评估开辟新路径。
本文提出2026年AI发展十大预测,包括AI估值修正、投资泡沫持续、AGI不仅依赖大语言模型、AI代理将加剧工作替代等。作者强调社会接受度对技术发展的重要性,认为成功企业将重构运营模式以AI为核心,同时指出政府仍将重视STEM教育而忽视社会科学的价值。
华中科技大学团队开发出4DLangVGGT技术,首次实现AI系统对4D动态场景的语言理解。该技术突破传统方法需要逐场景训练的限制,能跨场景通用部署。系统结合几何感知和语义理解,不仅能识别物体还能描述其时间变化过程。实验显示在多项指标上超越现有方法1-2%,为机器人、AR/VR、智能监控等领域提供重要技术支撑。