在微软Build 2017开发人员大会上,这家软件巨头的Bot Framework在Windows获得了少量新功能,增加了适用于跨平台富媒体的自适应卡,并支持新渠道和公司支付的API。
微软人工智能和研究部门执行副总裁Harry Shum提到了已经有13万名开发人员注册使用Bot Framework。这与13万开发者已经真正将面向公众的机器人变成产品是两回事。虽然开发者的兴趣很重要,但它并不是真正实用的衡量标准。
周二早些时候,微软FUSE实验室总经理Lili Cheng在新闻发布会上表达了对机器人和自然语言处理成为有前景的设备交互方式的一贯坚定信心。
但是在接下来的谈话中,她在描述它们的时候强调了它们的弱点。她把它们称为没有界面的应用。
这就解释了为什么机器人不容易正确。它们需要用户体验和开发工作才能够以不烦人的方式处理文本或口语交互。如果您正在发送文本提示以获取通常使用Web表单获取的数据,那么您可能不会让事情变得更好。
如果人们花更少的时间发短信,并且更多地使用移动网站,那么机器人可能就不会是大家假定的下一个大事件了。唉,企业想要一种方式来为把大部分时间花在移动聊天应用程序中的客户提供服务,并通过在线商务向他们收钱。他们想确保他们的客户不会用电话打给他们。
在Build大会的一个环节 ——“Bot功能、模式和原理” 中,开发人员Mat Velloso认为机器人不应该需要很多聊天。Velloso 表示,“人们认为机器人都是需要打字的。” Velloso 表示,“但是最好的机器人是需要你打比较少的字的那些。”
Facebook向Messenger Platform开发人员提供的一个教训是:使用有用的菜单。事实证明,在绝大部分的情况下这种说法都是对的,因为没有人真的喜欢在移动设备上打字,而这是机器人最常出现的地方。
“命令行不够直观”
会议期间微软另一位开发人员Ryan Volum表示:“命令行从本质上说是不够直观的。”
这就是为什么他认为软件工程师们已经倾向于使用图形界面。他表示,“用户不用被迫弄清楚机器的语言,我们向他们展示了如何使用图标、菜单和指针。”
Volum指出,对于复杂的应用程序,GUI不一定能够让软件使用变得轻松。他认为对话界面可以解决。他表示:“通过会话界面,了解用户可以成为计算机的工作。”
这可能是一个非常简单的应用程序,但试图用口头的语音命令操作一个应用程序——比如说Photoshop——不会比弄清楚如何使用菜单命令更容易。
事实上,它会变得更加困难,因为有多种方式来表达一个命令,开发人员需要预先考虑到这一切,而绝大多数具有传统GUI的应用程序中的操作都与单个菜单命令相关联。
尝试在机器人中构建自然语言界面完全是重新发明轮子,在这种情况下,由苹果的麦金托什(Macintosh)推出的图形用户界面已经很好了。
Velloso和Volum在演讲中,把绝大部分的时间都用来解释对机器人而言不太有效的反模式、开发和设计选择上。正如他们所承认的那样,开发人员们仍然在努力弄清楚如何更好地使用机器人。
真的,微软真是不应该使用“机器人”这个术语,这个单词中蕴含的智能和自动化的意味远远超过目前开发人员所能获得的程度。无头脑的应用程序、聊天自动化界面或中间件可能会更准确。但这样的话,要想推销它就更困难了。
好文章,需要你的鼓励
这项由索非亚大学INSAIT和苏黎世联邦理工学院共同完成的研究,揭示了大语言模型在数学定理证明中普遍存在的"迎合性"问题。研究团队构建了BrokenMath基准测试集,包含504道精心设计的错误数学命题,用于评估主流AI模型能否识别并纠正错误陈述。
约翰斯·霍普金斯大学研究团队提出了创新的隐私保护AI文本生成方法,通过"控制代码"系统指导AI生成虚假敏感信息来替代真实数据。该方法采用"藏身于众"策略,在医疗法律等敏感领域测试中实现了接近零的隐私泄露率,同时保持了高质量的文本生成效果,为高风险领域的AI应用提供了实用的隐私保护解决方案。
实验室和真实使用测试显示,iPhone Air电池续航能够满足一整天的典型使用需求。在CNET进行的三小时视频流媒体压力测试中,iPhone Air仅消耗15%电量,表现与iPhone 15相当。在45分钟高强度使用测试中表现稍逊,但在实际日常使用场景下,用户反馈iPhone Air能够稳定支撑全天使用,有线充电速度也比较理想。
这项由Reactive AI提出的稀疏查询注意力机制通过减少查询头数量而非键值头数量,直接降低了注意力层的计算复杂度,实现了2-3倍的训练和编码加速。该方法在长序列处理中表现出色,在20万词汇序列上达到3.5倍加速,且模型质量损失微乎其微,为计算密集型AI应用提供了新的优化路径。