Harness Inc.(一家为开发者提供应用程序更新和监控工具的软件交付创业公司)今天宣布推出多项新功能,进一步扩展其功能管理和实验能力。
这些新功能源于公司完成了对 Split Software Inc.(Harness 在 5 月份收购的公司)的平台整合。
Harness 提供了一个基于人工智能的持续交付即服务平台,可以在整个开发生命周期中管理代码和软件测试。开发者可以在每次更改时监控和管理发布指标、分析和测试,在部署之前发现潜在问题,如果出现问题还可以进行回滚。
Harness 仪表板现在已经超越了基本的功能标志(允许开发者通过仪表板上的开关来打开和关闭功能)。随着 Split 的完全整合,客户可以访问 Harness 功能管理和实验 (FME) 后端仪表板,该仪表板将六个新功能整合到一个集中的后端。
在功能管理方面,用户现在可以轻松地针对特定用户或用户群组进行 A/B 测试,并逐步推出新功能。它为企业组织提供了强大的权限、治理和控制功能。一旦发布开始,FME 可以监控任何客户体验的下降,比如页面加载时间增加、错误或崩溃。如果超过某些阈值,它可以自动触发回滚。
在实验方面,FME 允许用户通过仅为特定用户开启新功能来进行实验,以衡量对转化率、收入或用户获取等业务指标的影响。
Harness 产品副总裁 Trevor Stuart 在接受 SiliconANGLE 采访时表示:"当你看传统的 Harness 基础时,有日常的持续集成和交付产品,这是 Harness 功能管理的基础。实验功能从 CD 结束的地方开始。我将代码部署到生产环境后,现在想要在单一平台上逐步推出并能够实现这一目标。"
实验功能进一步提供了数据驱动的见解,以优化功能推出。这样,开发者和业务用户可以实时全面了解变更如何影响其应用程序的性能,直至用户影响。它旨在确保每次发布都有实证数据支持,以增强构建更好产品的信心。
实验现在有了自己的设计仪表板和专区,开发者可以创建自己的特殊工作流程,将实验分析与日常标志监控和维护分离。正式实验允许开发者定义假设、持续时间、目标规则和分析处理方案。
Stuart 说:"例如,一家银行可能会说,我们要看看汽车贷款作为一个要展示的优惠,我们要优化的关键指标是贷款发放量。我们是在增加银行的贷款数量吗?还是在获取新客户?这样,你就可以看到他们如何开始启用这些新功能并运行这些实验。"
这个终端用户业务逻辑示例只是功能可能影响的众多用例之一。代码更改和应用程序功能一旦发布,可能会改变处理时间、云成本、终端用户体验和其他许多在测试中难以发现的指标。
逐步发布意味着可以安全地监控这些变更,比起一次性全部发布(从而可能一次性全部出问题)带来的影响要小得多。这让开发团队有时间在问题变得严重之前解决潜在问题。
功能管理和实验还使运行测试版功能更新变得简单,因为测试用户群只是一个隔离的用户组。这些用户知道他们的应用程序可能无法正常运行——这都是为了有机会提前体验功能——而普通用户则希望获得最佳的用户体验。
好文章,需要你的鼓励
Meta宣布为Facebook Dating推出AI聊天机器人助手,帮助用户找到更匹配的对象。该AI可根据用户需求推荐特定类型的匹配者,并协助优化个人资料。同时推出Meet Cute功能,每周提供算法选择的"惊喜匹配"。尽管18-29岁用户匹配数同比增长10%,但相比Tinder的5000万日活用户仍有差距。AI功能已成为约会应用标配,Match Group等竞争对手也在大力投资AI技术。
字节跳动团队提出RewardDance框架,首次系统性解决视觉生成中的奖励模型扩展问题。该框架通过将奖励预测转为生成式任务,并将模型规模扩展至260亿参数,同时集成任务指令、参考样例和推理能力,有效解决了"奖励作弊"问题。实验显示,在文本生成图像任务中质量提升10.7分,视频生成性能改善49%,达到行业领先水平,为AI视觉创作提供了更强大可靠的技术基础。
Neo4j认为已找到让生成式AI访问图数据库记录的方法。图数据库专注于数据点之间的关系建模和查询,在欺诈检测、推荐引擎等场景中表现出色。2024年4月,ISO批准了图查询语言GQL标准,Neo4j的Cypher查询语言完全符合该标准。现代工具提供拖拽式工作流程,GenAI可作为自然语言接口,将用户请求转换为Cypher查询。
ByteDance团队开发的Mini-o3系统通过深度多轮推理突破了传统AI视觉理解的局限。该系统能像人类侦探般进行几十轮的视觉探索,在困难的视觉搜索任务上准确率达48%,相比现有模型提升显著。核心创新包括挑战性的Visual Probe数据集、多样化推理策略训练和突破性的过轮掩码技术,实现了测试时思考轮数的自然扩展。