Harness Inc.(一家为开发者提供应用程序更新和监控工具的软件交付创业公司)今天宣布推出多项新功能,进一步扩展其功能管理和实验能力。
这些新功能源于公司完成了对 Split Software Inc.(Harness 在 5 月份收购的公司)的平台整合。
Harness 提供了一个基于人工智能的持续交付即服务平台,可以在整个开发生命周期中管理代码和软件测试。开发者可以在每次更改时监控和管理发布指标、分析和测试,在部署之前发现潜在问题,如果出现问题还可以进行回滚。
Harness 仪表板现在已经超越了基本的功能标志(允许开发者通过仪表板上的开关来打开和关闭功能)。随着 Split 的完全整合,客户可以访问 Harness 功能管理和实验 (FME) 后端仪表板,该仪表板将六个新功能整合到一个集中的后端。
在功能管理方面,用户现在可以轻松地针对特定用户或用户群组进行 A/B 测试,并逐步推出新功能。它为企业组织提供了强大的权限、治理和控制功能。一旦发布开始,FME 可以监控任何客户体验的下降,比如页面加载时间增加、错误或崩溃。如果超过某些阈值,它可以自动触发回滚。
在实验方面,FME 允许用户通过仅为特定用户开启新功能来进行实验,以衡量对转化率、收入或用户获取等业务指标的影响。
Harness 产品副总裁 Trevor Stuart 在接受 SiliconANGLE 采访时表示:"当你看传统的 Harness 基础时,有日常的持续集成和交付产品,这是 Harness 功能管理的基础。实验功能从 CD 结束的地方开始。我将代码部署到生产环境后,现在想要在单一平台上逐步推出并能够实现这一目标。"
实验功能进一步提供了数据驱动的见解,以优化功能推出。这样,开发者和业务用户可以实时全面了解变更如何影响其应用程序的性能,直至用户影响。它旨在确保每次发布都有实证数据支持,以增强构建更好产品的信心。
实验现在有了自己的设计仪表板和专区,开发者可以创建自己的特殊工作流程,将实验分析与日常标志监控和维护分离。正式实验允许开发者定义假设、持续时间、目标规则和分析处理方案。
Stuart 说:"例如,一家银行可能会说,我们要看看汽车贷款作为一个要展示的优惠,我们要优化的关键指标是贷款发放量。我们是在增加银行的贷款数量吗?还是在获取新客户?这样,你就可以看到他们如何开始启用这些新功能并运行这些实验。"
这个终端用户业务逻辑示例只是功能可能影响的众多用例之一。代码更改和应用程序功能一旦发布,可能会改变处理时间、云成本、终端用户体验和其他许多在测试中难以发现的指标。
逐步发布意味着可以安全地监控这些变更,比起一次性全部发布(从而可能一次性全部出问题)带来的影响要小得多。这让开发团队有时间在问题变得严重之前解决潜在问题。
功能管理和实验还使运行测试版功能更新变得简单,因为测试用户群只是一个隔离的用户组。这些用户知道他们的应用程序可能无法正常运行——这都是为了有机会提前体验功能——而普通用户则希望获得最佳的用户体验。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。