法国化妆品巨头欧莱雅(L'Oréal)近日透露,公司正在通过大量投资Google Cloud的无服务器和数据工具解决方案来支撑作为业务基石的Beauty Tech Data Platform平台。
在博客文章中,欧莱雅谈到了自己是如何发展成为一家“美容科技”公司,很大程度上依赖数据和分析来推出满足当地市场的新品牌和产品。
欧莱雅对数据的依赖,对于业务本身来说意义重大,但同时也带来了相当大的挑战,那就是数据仓库基础设施变得很复杂,还有很多法律和合规要求方面令人头疼的问题。欧莱雅公司解释说,他们本地计算基础设施的规模大到让他们别无选择,只能迁移到云端。
在考虑候选的云基础设施厂商时,欧莱雅列出了几个不可妥协的要求,包括“无操作”原则,也就是需要可按需扩展的弹性基础设施,这样开发人员就不会被迫浪费时间在管理服务器上。
其他要求还包括严格的安全要求、可持续性、端到端监督、用于监控和分类所有操作的单一仪表板、易于部署、接近于实时交付数据的事件驱动型架构等等,此外欧莱雅还要求数据产品能够以“即服务”的方式提供,具有提取、转换和加载功能,使其能够实施不同的数据模式以便在信息到达数据仓库时立即加载。
这看起来是一份要求相近而苛刻的清单,但欧莱雅表示,谷歌云满足了每一个条件,所以欧莱雅决定扩大采用Google Cloud的规模,以支持他们的Beauty Tech Platform美容技术平台。
欧莱雅解释说,该平台包含两个来源的数据——直接通过API来的数据,可轻松适配其架构并直接发送到Google BigQuery,在这里对数据进行分析,此外还有在分析之前经过事件驱动转换整合所生成的批量数据。
欧莱雅公司解释说:“如今这些转换是在Cloud Run中执行的,可支持处理这些数据所需的高并发性,或者直接在BigQuery中使用SQL。随着Cloud Functions(第2代)的推出,我们很高兴向更多开发人员开放该平台,让他们可以轻松构建新的自定义数据集成和转换,成为平台的粘合代码。”
欧莱雅表示,BigQuery是一个很重要的工具,可让企业采用标准的结构化查询语言作为数据仓库的通用语言,帮助简化查询和报告,此外还可以使用非破坏性转换将大部分原始数据加载到BigQuery中,这意味着可以稍后对信息进行重新处理以用于其他场景。
欧莱雅还采用了BigQuery Omni,该功能可以分析来自各种公有云和本地环境的多个应用的数据。
欧莱雅方面解释说:“如果没有BigQuery Omni,我们的团队就不可能在本地进行跨云分析,此外它让我们不需要迁移那些敏感数据,迁移这些数据不仅成本很高——因为涉及到地方税收和海底运输,而且有时候因为当地有相关法规所以风险极高甚至直接被禁止。”
欧莱雅表示,使用BigQuery和Google Cloud的无服务器计算服务进行API提取、批量数据加载、加载后转换的另一个好处是,它可以将整个数据平台保持在“单一信任边界”内,且显著降低了成本。
欧莱雅得出的结论是,Google Cloud满足了Beauty Tech Data Platform平台的所有要求,甚至通过提供工具来衡量和了解公司云运营的环保度,帮助实现可持续发展目标。
好文章,需要你的鼓励
微软近年来频繁出现技术故障和服务中断,从Windows更新删除用户文件到Azure云服务因配置错误而崩溃,质量控制问题愈发突出。2014年公司大幅裁减测试团队后,采用敏捷开发模式替代传统测试方法,但结果并不理想。虽然Windows生态系统庞大复杂,某些问题在所难免,但Azure作为微软核心云服务,反复因配置变更导致客户服务中断,已不仅仅是质量控制问题,更是对公司技术能力的质疑。
Meta研究团队发现仅仅改变AI示例间的分隔符号就能导致模型性能产生高达45%的巨大差异,甚至可以操纵AI排行榜排名。这个看似微不足道的格式选择问题普遍存在于所有主流AI模型中,包括最先进的GPT-4o,揭示了当前AI评测体系的根本性缺陷。研究提出通过明确说明分隔符类型等方法可以部分缓解这一问题。
当团队准备部署大语言模型时,面临开源与闭源的选择。专家讨论显示,美国在开源AI领域相对落后,而中国有更多开源模型。开源系统建立在信任基础上,需要开放数据、模型架构和参数。然而,即使是被称为"开源"的DeepSeek也并非完全开源。企业客户往往倾向于闭源系统,但开源权重模型仍能提供基础设施选择自由。AI主权成为国家安全考量,各国希望控制本地化AI发展命运。
香港中文大学研究团队开发出CALM训练框架和STORM模型,通过轻量化干预方式让40亿参数小模型在优化建模任务上达到6710亿参数大模型的性能。该方法保护模型原生推理能力,仅修改2.6%内容就实现显著提升,为AI优化建模应用大幅降低了技术门槛和成本。