Instabug Inc.(一家基于人工智能的移动应用可观测性和性能平台)今天推出了新功能,帮助开发者分析用户体验并识别用户挫折感,以此提高用户留存率。
成立于 2014 年的 Instabug 因其独特的"摇一摇报告 Bug"功能而闻名。作为一个全功能的移动应用质量平台,它为开发团队提供应用性能洞察、问题追踪、用户会话回放、崩溃报告等多项服务。
此次推出的新功能集中在追踪用户挫折感方面,主要围绕公司所称的"无挫折会话"展开。
用户在遇到移动应用的 bug 和问题时,往往不会直接投诉。相反,他们可能会漫无目的地导航、在菜单中挣扎,或者直接放弃使用应用。这种挫折感要么表现为进度放缓的瓶颈,要么直接导致用户离开应用——比如将商品加入购物车后,由于应用崩溃或加载圈一直转个不停而放弃购买。
Instabug 首席产品官 Kenny Johnston 在接受 SiliconANGLE 采访时表示:"产品和业务经理们经常说我们需要在所有最新功能上与竞争对手竞争,这是最重要的。但实际上,当你查看数据时会发现,如果想提高应用留存率和活跃用户数,最重要的是修复应用崩溃或屏幕加载缓慢的问题。"
可观测性的一部分在于理解应用在后台运行不佳,导致用户因运行缓慢或 bug 而感到沮丧。另一部分则在于揭示应用的哪些部分给用户带来最多问题,从而让开发者和业务人员知道应该将精力集中在哪里。
Instabug 利用 AI 通过整合"挫折信号"为技术经理提供应用性能的整体视图,并将其与实际业务影响相关联,使这些洞察变得易于理解。这使技术团队和业务团队能够协同工作,优先处理能够让用户保持满意的技术改进。
业务影响仪表板使业务用户能够基于数据驱动的洞察来理解、证明和分配技术资源,了解应用性能如何影响关键业务指标。该仪表板包含 AI 生成的描述,解释修复技术问题将如何有益于实际业务指标。
Johnston 解释说:"我们在移动设备上花费大量时间,移动应用的质量标准非常高。没有多任务处理,你会 100% 感受到应用中的每一个感知问题。而且切换应用非常容易。因此,最佳航空公司应用的标准不是由同行设定的,而是由 Instagram 和 Facebook 设定的。这不是关于我不使用竞争对手的应用,而是我会将其与手机上最好的应用进行比较。"
当然,并非所有 bug 和崩溃都同等重要。有些崩溃可能十亿用户中只发生一次,很少见到,但有些每天影响数千用户,确实造成业务影响。这就是为什么 Instabug 创建了一个优先级列表,显示哪些问题对用户造成最大困扰并应该优先处理,同时将它们直接关联到相应的指标和可观测性遥测数据,以便分配给开发人员。
Johnston 说:"我们发现每个移动开发者都为自己构建的应用感到自豪,他们知道存在问题,也意识到这些痛点,他们很乐意解决这些问题。他们只需要这种业务上的理由来说明为什么要优先处理这些问题。"
通过 AI 驱动的数据洞察仪表板,业务用户可以理解为什么应该为维护预算时间,开发团队也能够展示这将如何帮助留住原本可能放弃应用的用户。
Johnston 补充道:"向开发者展示他们所构建内容的真实影响,我认为是至关重要的。我一直主张更好的软件体验,这不仅仅是最创新的 UI 或新功能。很大程度上是关于我们如何交付高质量的应用。"
好文章,需要你的鼓励
在迪拜Gitex 2025大会上,阿联酋成为全球AI领导者的雄心备受关注。微软正帮助该地区组织从AI实验阶段转向实际应用,通过三重方法提供AI助手、协同AI代理和AI战略顾问。微软已在阿联酋大举投资数据中心,去年培训了10万名政府员工,计划到2027年培训100万学习者。阿联酋任命了全球首位AI部长,各部门都配备了首席AI官。微软与政府机构和企业合作,在公民服务和金融流程等领域实现AI的实际应用,构建全面的AI生态系统。
查尔斯大学和意大利布鲁诺·凯斯勒基金会的研究团队首次系统性解决了同声传译AI系统延迟评估的准确性问题。他们发现现有评估方法存在严重偏差,常给出相互矛盾的结果,并提出了YAAL新指标和SOFTSEGMENTER对齐工具。YAAL准确性达96%,比传统方法提升20多个百分点。研究还开发了专门的长音频评估工具LongYAAL,为AI翻译技术发展提供了可靠的测量标准。
苹果与俄亥俄州立大学研究人员发布名为FS-DFM的新模型,采用少步离散流匹配技术,仅需8轮快速优化即可生成完整长文本,效果媲美需要上千步骤的扩散模型。该模型通过三步训练法:处理不同优化预算、使用教师模型指导、调整迭代机制来实现突破。测试显示,参数量仅1.7亿至17亿的FS-DFM变体在困惑度和熵值指标上均优于70-80亿参数的大型扩散模型。
印度理工学院团队构建了史上最大规模印度文化AI测试基准DRISHTIKON,包含64288道多语言多模态题目,覆盖15种语言和36个地区。研究评估了13个主流AI模型的文化理解能力,发现即使最先进的AI也存在显著文化盲区,特别是在低资源语言和复杂推理任务上表现不佳,为构建文化感知AI提供了重要指导。