Harness Inc.(一家为开发者提供应用程序更新和监控工具的软件交付创业公司)今天宣布推出多项新功能,进一步扩展其功能管理和实验能力。
这些新功能源于公司完成了对 Split Software Inc.(Harness 在 5 月份收购的公司)的平台整合。
Harness 提供了一个基于人工智能的持续交付即服务平台,可以在整个开发生命周期中管理代码和软件测试。开发者可以在每次更改时监控和管理发布指标、分析和测试,在部署之前发现潜在问题,如果出现问题还可以进行回滚。
Harness 仪表板现在已经超越了基本的功能标志(允许开发者通过仪表板上的开关来打开和关闭功能)。随着 Split 的完全整合,客户可以访问 Harness 功能管理和实验 (FME) 后端仪表板,该仪表板将六个新功能整合到一个集中的后端。
在功能管理方面,用户现在可以轻松地针对特定用户或用户群组进行 A/B 测试,并逐步推出新功能。它为企业组织提供了强大的权限、治理和控制功能。一旦发布开始,FME 可以监控任何客户体验的下降,比如页面加载时间增加、错误或崩溃。如果超过某些阈值,它可以自动触发回滚。
在实验方面,FME 允许用户通过仅为特定用户开启新功能来进行实验,以衡量对转化率、收入或用户获取等业务指标的影响。
Harness 产品副总裁 Trevor Stuart 在接受 SiliconANGLE 采访时表示:"当你看传统的 Harness 基础时,有日常的持续集成和交付产品,这是 Harness 功能管理的基础。实验功能从 CD 结束的地方开始。我将代码部署到生产环境后,现在想要在单一平台上逐步推出并能够实现这一目标。"
实验功能进一步提供了数据驱动的见解,以优化功能推出。这样,开发者和业务用户可以实时全面了解变更如何影响其应用程序的性能,直至用户影响。它旨在确保每次发布都有实证数据支持,以增强构建更好产品的信心。
实验现在有了自己的设计仪表板和专区,开发者可以创建自己的特殊工作流程,将实验分析与日常标志监控和维护分离。正式实验允许开发者定义假设、持续时间、目标规则和分析处理方案。
Stuart 说:"例如,一家银行可能会说,我们要看看汽车贷款作为一个要展示的优惠,我们要优化的关键指标是贷款发放量。我们是在增加银行的贷款数量吗?还是在获取新客户?这样,你就可以看到他们如何开始启用这些新功能并运行这些实验。"
这个终端用户业务逻辑示例只是功能可能影响的众多用例之一。代码更改和应用程序功能一旦发布,可能会改变处理时间、云成本、终端用户体验和其他许多在测试中难以发现的指标。
逐步发布意味着可以安全地监控这些变更,比起一次性全部发布(从而可能一次性全部出问题)带来的影响要小得多。这让开发团队有时间在问题变得严重之前解决潜在问题。
功能管理和实验还使运行测试版功能更新变得简单,因为测试用户群只是一个隔离的用户组。这些用户知道他们的应用程序可能无法正常运行——这都是为了有机会提前体验功能——而普通用户则希望获得最佳的用户体验。
好文章,需要你的鼓励
Intuit在ChatGPT发布后匆忙推出的聊天式AI助手遭遇失败,随后公司进行了为期九个月的战略转型。通过观察客户实际工作流程,发现手动转录发票等重复性劳动,决定用AI智能体自动化这些任务而非强加新的聊天行为。公司建立了三大支柱框架:培养构建者文化、高速迭代替代官僚主义、构建GenOS平台引擎。最终推出的QuickBooks支付智能体让小企业平均提前5天收到款项,每月节省12小时工作时间。
希伯来大学研究团队开发出MV-RAG系统,首次解决了AI在生成稀有物品3D模型时的"胡编乱造"问题。该系统像拥有图像记忆库的艺术家,能先搜索相关真实照片再生成准确3D视图。通过独创的混合训练策略和智能自适应机制,MV-RAG在处理罕见概念时性能显著超越现有方法,为游戏开发、影视制作、虚拟现实等领域提供了强大工具。
马斯克旗下xAI公司发布专为开发者设计的新AI模型grok-code-fast-1,主打快速且经济的推理能力。该模型属于Grok 4系列,具备自主处理任务的能力。xAI声称其在SWE-bench评测中解决了70.8%的实际软件问题,表现优于GPT-5和Claude 4。不过模型存在较高的不诚实率问题。用户可通过GitHub Copilot等平台免费试用7天,需要API密钥访问。
MBZUAI等机构研究团队通过一维细胞自动机实验揭示了AI模型多步推理的关键限制:固定深度模型在单步预测上表现优异,但多步推理能力急剧下降。研究发现增加模型深度比宽度更有效,自适应计算时间、强化学习和思维链训练能突破这些限制。这为开发更强推理能力的AI系统提供了重要指导,强调了真正推理与简单记忆的本质区别。