在微软Build 2017开发人员大会上,这家软件巨头的Bot Framework在Windows获得了少量新功能,增加了适用于跨平台富媒体的自适应卡,并支持新渠道和公司支付的API。
微软人工智能和研究部门执行副总裁Harry Shum提到了已经有13万名开发人员注册使用Bot Framework。这与13万开发者已经真正将面向公众的机器人变成产品是两回事。虽然开发者的兴趣很重要,但它并不是真正实用的衡量标准。
周二早些时候,微软FUSE实验室总经理Lili Cheng在新闻发布会上表达了对机器人和自然语言处理成为有前景的设备交互方式的一贯坚定信心。
但是在接下来的谈话中,她在描述它们的时候强调了它们的弱点。她把它们称为没有界面的应用。
这就解释了为什么机器人不容易正确。它们需要用户体验和开发工作才能够以不烦人的方式处理文本或口语交互。如果您正在发送文本提示以获取通常使用Web表单获取的数据,那么您可能不会让事情变得更好。
如果人们花更少的时间发短信,并且更多地使用移动网站,那么机器人可能就不会是大家假定的下一个大事件了。唉,企业想要一种方式来为把大部分时间花在移动聊天应用程序中的客户提供服务,并通过在线商务向他们收钱。他们想确保他们的客户不会用电话打给他们。
在Build大会的一个环节 ——“Bot功能、模式和原理” 中,开发人员Mat Velloso认为机器人不应该需要很多聊天。Velloso 表示,“人们认为机器人都是需要打字的。” Velloso 表示,“但是最好的机器人是需要你打比较少的字的那些。”
Facebook向Messenger Platform开发人员提供的一个教训是:使用有用的菜单。事实证明,在绝大部分的情况下这种说法都是对的,因为没有人真的喜欢在移动设备上打字,而这是机器人最常出现的地方。
“命令行不够直观”
会议期间微软另一位开发人员Ryan Volum表示:“命令行从本质上说是不够直观的。”
这就是为什么他认为软件工程师们已经倾向于使用图形界面。他表示,“用户不用被迫弄清楚机器的语言,我们向他们展示了如何使用图标、菜单和指针。”
Volum指出,对于复杂的应用程序,GUI不一定能够让软件使用变得轻松。他认为对话界面可以解决。他表示:“通过会话界面,了解用户可以成为计算机的工作。”
这可能是一个非常简单的应用程序,但试图用口头的语音命令操作一个应用程序——比如说Photoshop——不会比弄清楚如何使用菜单命令更容易。
事实上,它会变得更加困难,因为有多种方式来表达一个命令,开发人员需要预先考虑到这一切,而绝大多数具有传统GUI的应用程序中的操作都与单个菜单命令相关联。
尝试在机器人中构建自然语言界面完全是重新发明轮子,在这种情况下,由苹果的麦金托什(Macintosh)推出的图形用户界面已经很好了。
Velloso和Volum在演讲中,把绝大部分的时间都用来解释对机器人而言不太有效的反模式、开发和设计选择上。正如他们所承认的那样,开发人员们仍然在努力弄清楚如何更好地使用机器人。
真的,微软真是不应该使用“机器人”这个术语,这个单词中蕴含的智能和自动化的意味远远超过目前开发人员所能获得的程度。无头脑的应用程序、聊天自动化界面或中间件可能会更准确。但这样的话,要想推销它就更困难了。
好文章,需要你的鼓励
法国AI初创公司Mistral AI发布了首个大语言模型全面生命周期评估,量化了AI的环境代价。其Mistral Large 2模型训练产生20,400吨二氧化碳当量,消耗281,000立方米水。运营阶段占环境影响85%,远超硬件制造成本。研究表明地理位置和模型大小显著影响碳足迹,企业可通过选择适当规模模型、批处理技术和清洁能源部署来减少环境影响。这一透明度为企业AI采购决策提供了新的评估标准。
上海AI实验库推出YUME系统,用户只需输入一张图片就能创建可键盘控制的虚拟世界。该系统采用创新的运动量化技术,将复杂的三维控制简化为WASD键操作,并通过智能记忆机制实现无限长度的世界探索。系统具备强大的跨风格适应能力,不仅能处理真实场景,还能重现动漫、游戏等各种艺术风格的虚拟世界,为虚拟现实和交互娱乐领域提供了全新的技术路径。
许多人认为一旦实现通用人工智能(AGI)和人工智能超级智能(ASI),这些高度先进的AI将能够告诉我们人生的真正意义。然而,巅峰AI可能无法明确回答这个史诗般的问题。即使AI拥有人类所有知识,也不意味着能从中找到生命意义的答案。AI可能会选择提供多种可能性而非绝对答案,以避免分裂人类社会。
上海AI实验室研究团队开发了革命性的AI编程验证方法,让大语言模型能够在最小人工干预下自动生成和验证程序规范。该方法摒弃传统的人工标注训练,采用强化学习让模型在形式化语言空间中自主探索,在Dafny编程验证任务上显著超越现有方法,为AI自主学习开辟新道路。