上周AWS公司首席执行官Adam Selipsky在re:Invent大会上发表主题演讲,其中一个重要亮点是宣布推出了Amazon Q。
Selipsky(如图)提到了研究生成式AI的用途以及迄今为止几乎每个人都进行过的实验。他表示:“这个领域的早期提供商所做的事情确实令人兴奋,并且对消费者来说确实非常有用,但从很多方面来说,这些应用并不能真正在工作中发挥作用。他们的常识和能力都很好,但他们不了解你的公司;他们不了解你的数据、你的客户或者你的运营。”
这些系统也不知道你在组织中的角色、你的偏好、你是如何使用信息、可以访问(以及不能)访问哪些内容。Selipsky指出,很多CIO已经在他们的组织内禁止使用最流行的新一代AI文本系统。此外一些CISO不想在事后强调安全性,他们宁愿从一开始就把安全性融入到这项技术中。
他说:“因此,当我们开始构建生成式AI应用的时候,我们知道我们必须解决这些差距,必须从一开始就是内置的。Q可以让你通过自然语言交互快速地回答问题,你可以轻松地聊天、生成内容并采取行动,这一切都取决于对你的系统、数据存储库和操作的了解。”
Selipsky补充说,Q通过了解现有身份、角色和权限来提供“坚如磐石的安全性”。“如果你的用户没有权限在没有Q的情况下访问某些内容,那么他们也无法使用Q访问这些内容。”Selipsky还概述了Amazon Q有四个用例。请注意,“专家”一词在该服务的营销中占据显着位置。据他介绍,Amazon Q是:
AWS专家
Selipsky表示:“我们用17年的AWS知识对Amazon Q进行了训练,因此它可以改变你在AWS上思考、优化和操作应用工作负载的方式,我们将Amazon Q放在了你工作的地方。”
Q可以使用Code Whisperer在IDE中协助处理AWS Management Console文档,还可以在Slack等团队聊天工具中使用。你可以与Q聊天来探索AWS的功能、学习不熟悉的技术和架构解决方案。Q还可以帮助你选择在AWS中构建Web应用。问它:“如何使用AWS构建Web应用?我有哪些选择?”Q将提供完整的答案。
“它在回答中给你提供了你可以使用的潜在服务列表,例如Amplify、Lambda或EC2,然后会提供给你可能考虑每项服务的理由,让你可以通过自然语言进一步缩小选择的范围,比如‘如果我的应用只需要运行几秒钟并且只有很少的流量,那么哪一个是首选?’”Selipsky指出,在这种情况下Q会回答说,Lambda将是最佳的选择。
这些功能看起来很深奥,Q能够提供入门的分步说明、文档链接以及端到端网络配置分析。
业务专家
Selipsky问到:“那么你组织中的其他人员或营销、财务、人力资源、产品管理等部门的人员呢?组织文档、所有数据、所有应用以及所有这些不同角色的人员拥有如此多的信息。”
Selipsky指出,Q可以立即连接到40个主要的企业系统,员工可以提出复杂的问题并获得与其在组织中角色相关的详细答案。而且他强调,这一切都是以安全的方式完成的。
AWS人工智能副总裁Matt Wood在re:Invent大会上首次展示了Q是如何与企业合作:使用S3、Salesforce、Microsoft、Google和Slack等数据源。
“一旦连接,Amazon Q就会开始对你的所有数据和内容建立索引,了解有关你业务的所有信息,包括了解核心概念、产品名称、组织结构——所有使你业务独一无二的细节。”
Q还使用生成式AI来理解和捕获那些让你业务独一无二的语义信息。Wood指出,数据始终处于企业的控制之下:AWS从不将其存储在外部或使用这些数据来训练底层模型。
Q还可以使用插件代表你采取行动。Wood表示:“举个例子,如果你更新你的跟踪优先级,Q可以自动在JIRA中创建票证,通知Slack中的负责人,并更新ServiceNow中的仪表板,Q允许你在操作运行之前检查操作,以便可以查看这些信息并查找其他信息,在操作运行后,Q将链接到结果并进行验证。”
Q为商界领袖们带来了很多可能性。那些使用主流的消费级工具的企业会发现Q可以支持这些工具,因为它了解你的业务,而且是实时动态的,不会局限于一年前的世界观。
商业智能专家
Selipsky表示:“我们致力于让那些没有商业智能专业知识的人更容易获得商业智能,我们认为,如果他们的数据使用了自然语言,任何人都应该能够提出问题。”
基于机器学习的商业智能服务QuickSight现在内置了Amazon Q。用户可以通过要求Q可视化他们想要查看的内容,在几分钟内(而不是通常的几个小时)创建仪表板和报告。
“Q会立即返回一张图表,你可以轻松地将其添加到仪表板上,你可以告诉Q进一步完善视觉效果,你是想把图表改为按月份、按区域进行颜色编码的堆积条形图吗?Q可以帮你实现。”
Selipsky说,我们都是使用数据来讲故事的。看起来Q将在这方面提供帮助——支持创建报告,然后提供决策建议——所有这些都带有可视化的选项。
这些功能的展示方式很有趣。对于那些花费无数时间在PowerPoint、Excel、电子邮件、SharePoint或者Google Drive中查找所需数据块的员工来说,指向公司资产的生成式AI将是一大福音。
联络中心专家
“如今,联络中心座席要花费大量时间收集客户信息以了解他们的问题,然后他们花费更多时间寻找正确的答案,”Selipsky说。
他表示,Amazon Connect已经通过机器学习成绩单和分析为客服人员改进了这一流程。
他说:“但我们知道,我们可以为你的代理商以及在电话另一端等待帮助的客户提供更好的服务,你可以使用Amazon Q和Connect,现已上市,这将为联络中心座席提供巨大的帮助。”
客服人员可以在Connect中与Q聊天,更快速地回答问题。每次通话的时候,它都可以实时提供响应、操作和相关文章链接方面的帮助,而无需打字。此外,Connect现在可以为主管和管理员提供通话后的摘要,让他们可以用来跟踪后续行动和推进商机。
总结
总体而言,Amazon Q似乎是企业最有前途的新一代AI成果之一。出于显而易见的原因,它在AWS方面的能力——作为所谓的“AWS专家”——在Selipsky的主题演讲被重点介绍,但如果Q还可以掌握业务、商业智能和联络中心,那么它将很难被击败。
Amazon Q的发布也将有助于击破AWS在生成式AI领域落后一步的说法。也许可以公平地说AWS在生成式AI营销方面是落后的,但Amazon Q为Amazon几乎所有产品打造了一个单一的、具有一致性的助手。
好文章,需要你的鼓励
邻里社交应用Nextdoor推出重新设计版本,新增本地新闻、实时警报和名为"Faves"的AI功能,用于发现本地商户和地点。该应用与3500家本地出版商合作提供新闻内容,通过Samdesk和Weather.com提供天气、交通、停电等实时警报。Faves功能利用15年邻里对话数据训练的大语言模型,为用户提供本地化AI推荐服务,帮助用户找到最佳餐厅、徒步地点等本地信息。
Skywork AI推出的第二代多模态推理模型R1V2,通过创新的混合强化学习方法,成功解决了AI"慢思考"策略在视觉推理中的挑战。该模型在保持强大推理能力的同时有效控制视觉幻觉,在多项权威测试中超越同类开源模型,某些指标甚至媲美商业产品,为开源AI发展树立了新标杆。
英国生物银行完成了世界上最大规模的全身成像项目,收集了10万名志愿者的超过10亿次扫描数据,用于研究人体衰老和疾病过程。该项目历时11年,每次扫描耗时5小时,投资6200万英镑。目前已有8万人的成像数据供全球研究人员使用,剩余数据将于年底前发布。项目已开发出能预测38种常见疾病的AI工具,并在心脏病、痴呆症和癌症诊断方面取得突破。
这项由北京大学等多所高校联合完成的研究,首次对OpenAI GPT-4o的图像生成能力进行了全面评估。研究团队设计了名为GPT-ImgEval的综合测试体系,从文本转图像、图像编辑和知识驱动创作三个维度评估GPT-4o,发现其在所有测试中都显著超越现有方法。研究还通过技术分析推断GPT-4o采用了自回归与扩散相结合的混合架构,并发现其生成图像仍可被现有检测工具有效识别,为AI图像生成领域提供了重要的评估基准和技术洞察。