在微软Build 2017开发人员大会上,这家软件巨头的Bot Framework在Windows获得了少量新功能,增加了适用于跨平台富媒体的自适应卡,并支持新渠道和公司支付的API。
微软人工智能和研究部门执行副总裁Harry Shum提到了已经有13万名开发人员注册使用Bot Framework。这与13万开发者已经真正将面向公众的机器人变成产品是两回事。虽然开发者的兴趣很重要,但它并不是真正实用的衡量标准。
周二早些时候,微软FUSE实验室总经理Lili Cheng在新闻发布会上表达了对机器人和自然语言处理成为有前景的设备交互方式的一贯坚定信心。
但是在接下来的谈话中,她在描述它们的时候强调了它们的弱点。她把它们称为没有界面的应用。
这就解释了为什么机器人不容易正确。它们需要用户体验和开发工作才能够以不烦人的方式处理文本或口语交互。如果您正在发送文本提示以获取通常使用Web表单获取的数据,那么您可能不会让事情变得更好。
如果人们花更少的时间发短信,并且更多地使用移动网站,那么机器人可能就不会是大家假定的下一个大事件了。唉,企业想要一种方式来为把大部分时间花在移动聊天应用程序中的客户提供服务,并通过在线商务向他们收钱。他们想确保他们的客户不会用电话打给他们。
在Build大会的一个环节 ——“Bot功能、模式和原理” 中,开发人员Mat Velloso认为机器人不应该需要很多聊天。Velloso 表示,“人们认为机器人都是需要打字的。” Velloso 表示,“但是最好的机器人是需要你打比较少的字的那些。”
Facebook向Messenger Platform开发人员提供的一个教训是:使用有用的菜单。事实证明,在绝大部分的情况下这种说法都是对的,因为没有人真的喜欢在移动设备上打字,而这是机器人最常出现的地方。
“命令行不够直观”
会议期间微软另一位开发人员Ryan Volum表示:“命令行从本质上说是不够直观的。”
这就是为什么他认为软件工程师们已经倾向于使用图形界面。他表示,“用户不用被迫弄清楚机器的语言,我们向他们展示了如何使用图标、菜单和指针。”
Volum指出,对于复杂的应用程序,GUI不一定能够让软件使用变得轻松。他认为对话界面可以解决。他表示:“通过会话界面,了解用户可以成为计算机的工作。”
这可能是一个非常简单的应用程序,但试图用口头的语音命令操作一个应用程序——比如说Photoshop——不会比弄清楚如何使用菜单命令更容易。
事实上,它会变得更加困难,因为有多种方式来表达一个命令,开发人员需要预先考虑到这一切,而绝大多数具有传统GUI的应用程序中的操作都与单个菜单命令相关联。
尝试在机器人中构建自然语言界面完全是重新发明轮子,在这种情况下,由苹果的麦金托什(Macintosh)推出的图形用户界面已经很好了。
Velloso和Volum在演讲中,把绝大部分的时间都用来解释对机器人而言不太有效的反模式、开发和设计选择上。正如他们所承认的那样,开发人员们仍然在努力弄清楚如何更好地使用机器人。
真的,微软真是不应该使用“机器人”这个术语,这个单词中蕴含的智能和自动化的意味远远超过目前开发人员所能获得的程度。无头脑的应用程序、聊天自动化界面或中间件可能会更准确。但这样的话,要想推销它就更困难了。
好文章,需要你的鼓励
在“PEC 2025 AI创新者大会暨第二届提示工程峰会”上,一场以“AIGC创作新范式——双脑智能时代:心智驱动的生产力变革”为主题的分论坛,成为现场最具张力的对话空间。
人民大学团队开发了Search-o1框架,让AI在推理时能像侦探一样边查资料边思考。系统通过检测不确定性词汇自动触发搜索,并用知识精炼模块从海量资料中提取关键信息无缝融入推理过程。在博士级科学问题测试中,该系统整体准确率达63.6%,在物理和生物领域甚至超越人类专家水平,为AI推理能力带来突破性提升。
Linux Mint团队计划加快发布周期,在未来几个月推出两个新版本。LMDE 7代号"Gigi"基于Debian 13开发,将包含libAdapta库以支持Gtk4应用的主题功能。新版本将停止提供32位版本支持。同时Cinnamon桌面的Wayland支持持续改进,在菜单、状态小程序和键盘输入处理方面表现更佳,有望成为完整支持Wayland的重要桌面环境之一。
Anthropic研究团队开发的REINFORCE++算法通过采用全局优势标准化解决了AI训练中的"过度拟合"问题。该算法摒弃了传统PPO方法中昂贵的价值网络组件,用统一评价标准替代针对单个问题的局部基准,有效避免了"奖励破解"现象。实验显示,REINFORCE++在处理新问题时表现更稳定,特别是在长文本推理和工具集成场景中展现出优异的泛化能力,为开发更实用可靠的AI系统提供了新思路。