ZD至顶网软件频道消息:英特尔和Amazon在智能家庭的用户接口方面发生,本周在拉斯维加斯举行的re:Invent大会上,两家公司宣布致力于一个面向基于Alexa产品的参考设计。
首款基于这个参考架构的产品将会在2017年第一季度面市,英特尔企业副总裁、总经理Gregory Bryant这样表示。
英特尔的任务是帮助交付在智慧家庭中能高度响应的、接近自主对话式的人工智能。他说:“我们正在接近于把它变成现实。”
他说,英特尔下了两大赌注,这将有助于实现:未来五年重构家庭网络,可以支持迅速增加的连接设备,以及开发在这个网络之上的SOC、平台和参考架构。
对于Amazon来说,英特尔的帮助将加速Alexa生态系统的增长。最初2014年11月Alexa发布的时候,它只有13个Amazon内嵌的技能,现在已经有超过5000个了,Alexa科学家Rohit Prasad说。智能家庭功能的普及,是Alexa团队早期的最大惊喜之一。
但是现在,随着技术的进步,与消费者交互的服务数量与日俱增,通过像台式机甚至智能手机这样的传统接口来实现这一点几乎是“难以想象的”,Prasad说。
Amazon宣布了其他培育Alexa生态系统的计划,包括扩大Alexa Skill Set内置库。在未来几周,Amazon将提供数百个新的内置工具,帮助开发者将常见请求内置到Alexa的技能集中,“内置”的包括意图类(例如“停止”或者“帮助”),还有时间段位置类型的(例如日期或者城市)。
Prasad还宣布了Alexa加速器计划,新公司可以与来自Amazon和初创加速器Techstars的导师们进行交流。
好文章,需要你的鼓励
OpenAI发布了音视频生成模型Sora 2,同时推出配套社交应用Sora,用户可生成包含自己的视频并在类似TikTok的信息流中分享。Sora 2在物理定律遵循方面有显著改进,视频更加真实。应用提供"客串"功能,允许用户将自己植入生成场景中,并可与朋友分享形象使用权限。该iOS应用目前在美加地区采用邀请制,ChatGPT Pro用户可直接体验。
Scale AI团队推出SWE-Bench Pro测试平台,专门评估AI编程助手在真实企业级软件开发中的表现。研究发现,即使是最先进的GPT-5和Claude模型,成功率也仅有23%左右,远低于在传统测试中70%的表现。该测试平台包含1865个来自真实企业的复杂编程任务,要求修改多个文件和大量代码,为AI编程能力提供了更严格的现实检验。
大语言模型和生成式AI自诞生以来问题频发,从推理模型表现不佳到AI幻觉现象,再到版权诉讼,这些都表明当前技术路径可能并非通往真正智能的正确道路。专家认为,仅靠增加数据和算力的扩展模式已显现边际效应递减,无法实现通用人工智能。研究者提出智能应包含统计、结构、推理和目标四个层次的协调,并强调时间因果性的重要性。面对LLM技术局限,业界开始探索神经符号AI等替代方案。
微软团队开发的EdiVal-Agent是首个针对AI图像编辑的自动化评估系统,能像专业评委一样从指令遵循、内容一致性和视觉质量三维度评分。该系统与人类评审一致性达81.3%,测试发现Nano Banana表现最均衡,GPT-Image-1指令遵循最佳但一致性不足,大多数模型在数量变化任务中成功率低于25%。