在微软Build 2017开发人员大会上,这家软件巨头的Bot Framework在Windows获得了少量新功能,增加了适用于跨平台富媒体的自适应卡,并支持新渠道和公司支付的API。
微软人工智能和研究部门执行副总裁Harry Shum提到了已经有13万名开发人员注册使用Bot Framework。这与13万开发者已经真正将面向公众的机器人变成产品是两回事。虽然开发者的兴趣很重要,但它并不是真正实用的衡量标准。
周二早些时候,微软FUSE实验室总经理Lili Cheng在新闻发布会上表达了对机器人和自然语言处理成为有前景的设备交互方式的一贯坚定信心。
但是在接下来的谈话中,她在描述它们的时候强调了它们的弱点。她把它们称为没有界面的应用。
这就解释了为什么机器人不容易正确。它们需要用户体验和开发工作才能够以不烦人的方式处理文本或口语交互。如果您正在发送文本提示以获取通常使用Web表单获取的数据,那么您可能不会让事情变得更好。
如果人们花更少的时间发短信,并且更多地使用移动网站,那么机器人可能就不会是大家假定的下一个大事件了。唉,企业想要一种方式来为把大部分时间花在移动聊天应用程序中的客户提供服务,并通过在线商务向他们收钱。他们想确保他们的客户不会用电话打给他们。
在Build大会的一个环节 ——“Bot功能、模式和原理” 中,开发人员Mat Velloso认为机器人不应该需要很多聊天。Velloso 表示,“人们认为机器人都是需要打字的。” Velloso 表示,“但是最好的机器人是需要你打比较少的字的那些。”
Facebook向Messenger Platform开发人员提供的一个教训是:使用有用的菜单。事实证明,在绝大部分的情况下这种说法都是对的,因为没有人真的喜欢在移动设备上打字,而这是机器人最常出现的地方。
“命令行不够直观”
会议期间微软另一位开发人员Ryan Volum表示:“命令行从本质上说是不够直观的。”
这就是为什么他认为软件工程师们已经倾向于使用图形界面。他表示,“用户不用被迫弄清楚机器的语言,我们向他们展示了如何使用图标、菜单和指针。”
Volum指出,对于复杂的应用程序,GUI不一定能够让软件使用变得轻松。他认为对话界面可以解决。他表示:“通过会话界面,了解用户可以成为计算机的工作。”
这可能是一个非常简单的应用程序,但试图用口头的语音命令操作一个应用程序——比如说Photoshop——不会比弄清楚如何使用菜单命令更容易。
事实上,它会变得更加困难,因为有多种方式来表达一个命令,开发人员需要预先考虑到这一切,而绝大多数具有传统GUI的应用程序中的操作都与单个菜单命令相关联。
尝试在机器人中构建自然语言界面完全是重新发明轮子,在这种情况下,由苹果的麦金托什(Macintosh)推出的图形用户界面已经很好了。
Velloso和Volum在演讲中,把绝大部分的时间都用来解释对机器人而言不太有效的反模式、开发和设计选择上。正如他们所承认的那样,开发人员们仍然在努力弄清楚如何更好地使用机器人。
真的,微软真是不应该使用“机器人”这个术语,这个单词中蕴含的智能和自动化的意味远远超过目前开发人员所能获得的程度。无头脑的应用程序、聊天自动化界面或中间件可能会更准确。但这样的话,要想推销它就更困难了。
好文章,需要你的鼓励
OpenAI CEO描绘了AI温和变革人类生活的愿景,但现实可能更复杂。AI发展将带来真正收益,但也会造成社会错位。随着AI系统日益影响知识获取和信念形成,共同认知基础面临分裂风险。个性化算法加剧信息茧房,民主对话变得困难。我们需要学会在认知群岛化的新地形中智慧生存,建立基于共同责任而非意识形态纯洁性的社区。
杜克大学等机构研究团队通过三种互补方法分析了大语言模型推理过程,发现存在"思维锚点"现象——某些关键句子对整个推理过程具有决定性影响。研究表明,计划生成和错误检查等高层次句子比具体计算步骤更重要,推理模型还进化出专门的注意力机制来跟踪这些关键节点。该发现为AI可解释性和安全性研究提供了新工具和视角。
传统数据中心基础设施虽然对企业至关重要,但也是预算和房地产的重大负担。模块化数据中心正成为强有力的替代方案,解决企业面临的运营、财务和环境复杂性问题。这种模块化方法在印度日益流行,有助于解决环境问题、满足人工智能的电力需求、降低成本并支持新一代分布式应用。相比传统建设需要数年时间,工厂预制的模块化数据中心基础设施可在数周内部署完成。
法国索邦大学团队开发出智能医学文献管理系统Biomed-Enriched,通过AI自动从PubMed数据库中识别和提取高质量临床案例及教育内容。该系统采用两步注释策略,先用大型AI模型评估40万段落质量,再训练小型模型处理全库1.33亿段落。实验显示该方法仅用三分之一训练数据即可达到传统方法效果,为医学AI发展提供了高效可持续的解决方案。