联想与巴西创新中心CESAR利用人工智能让听力正常人看懂手语

联想和巴西累西腓高级研究与系统中心（CESAR）开发了一款基于人工智能（AI）的应用程序，能够为听力正常的人“翻译”手语。

根据巴西地理与统计研究所 (IBGE) 数据显示，巴西有超过 230 万人因严重耳聋而面临沟通困难，他们使用巴西手语 (Libra) 和葡萄牙手语 (LGP) 以及几种地区手语为方言。这一挑战的规模和复杂性促使联想启动了为期五年的研发项目，投资额超过 400 万美元。

联想和CESAR利用包含数千个巴西手语视频的数据库，开发了一项获得专利的人工智能技术，能够以视觉方式识别个人手势并将其置于上下文中。CESAR 和联想将该举措描述为世界首创，具有普遍应用的潜力。

联想巴西研发总监 Hildebrando Lima 在接受《福布斯》采访时表示：“我们相信，对这些人的影响将比在线翻译对书面语言的影响更大。”

Lima指出：“在在线翻译之前，已经有了在线词典，但它们并没有解决许多人在理解符号时面临的困难——有时是由于缺乏练习或缺乏学习材料和讲师”，并补充说这项技术将会崩溃当这些障碍充分发展时。

实时聊天翻译工具允许听力障碍者对设备的摄像头进行签名，然后算法将其立即翻译成葡萄牙语文本，供另一方的接收者使用。人工智能及其附带的数据库不是单独翻译每个手势，而是通过分析手部轮廓以及最重要的是手语者骨骼的数字枢轴点来识别手部形状。通过准确处理这些动作，该算法可以识别句子结构并将其转换为葡萄牙语的文本。

该系统基于深度学习神经网络，架构类似于GPT-3等模型，用于葡萄牙语到巴西手语的翻译和识别，便于实时手语翻译。为了生成手语视频，这些组织使用生成对抗网络 (GAN) 模型创建了一个合成口译员（类人虚拟化身）。

然而，CESAR 高级技术数据科学家经理 Vitor Casadei 表示，应用程序的复杂性要求开发人工智能系统来自动执行众多任务。“例如，团队精心设计的计算机视觉系统促进了训练数据库（用于训练标志识别模型的记录）的创建”，该高管指出。

一个由 80 人组成的团队（其中包括 5 名听力障碍专业人员）参与了该项目以及该系统所服务的社区。Casadei说：“除了团队中的聋人专业人士之外，听力障碍社区的参与对于该项目也至关重要。”他补充说，有数十名聋人参与了该工具的设计、验证和测试过程。

全球意义

联想的计划是将系统的使用扩展到全球其他手语，利用正在申请专利的程序，利用不同手语之间的共性来加快学习过程。

“多项研究表明，手语与口语有一些共同点。我们开发了一种技术，考虑到这一事实，因此可以利用[巴西手语]培训中学到的知识，加速学习其他手语，取得了非常有希望的成果”，CESAR 的Casadei说。

联想的 Lima 表示，计划到 2024/25 年将该项目扩展到国际市场，首先是拉丁美洲和美国。“我们认为（美国）的用例需求非常相似”，该高管表示。

虽然最初的重点在于银行和零售等领域，但最终目标是在任何公共服务环境中部署应用程序，无论是虚拟的、物理的还是混合的。此外，联想还计划向开发者社区提供软件开发套件（SDK），进一步推动听力障碍解决方案的开发。

隐私也是整个项目开发过程中的一个关键问题。所有参与者，从参与记录的参与者到参与验证和测试的参与者，都签署了一份文件，授权将其贡献用于研究，符合巴西的通用数据保护条例 (LGPD)。

CESAR 的 Casadei表示，为了保护用户隐私，这些模型被设计为仅从摄像头捕获用于识别标志的基本数据，例如手形或身体动作。该高管指出：“从该数据集中无法识别特定人员，这确保了通用数据保护条例合规性，同时尊重用户隐私。”

随着越来越多的人使用该工具，该工具将不断得到改进。这些练习将涉及不断添加标志记录、收集用户反馈以及改进应用程序的校准过程。CESAR 首席执行官表示：“该团队还开始了一些主动学习（一种让学生通过讨论、解决问题和角色扮演进行互动学习的教学方法）的实验，尽管仍有许多工作要做，但取得了可喜的成果”。

CESAR 和联想还探索了该工具在教育领域的潜力，特别是在手语教学方面。这些公司已提交了该领域的多项专利，目前正在接受审查。虽然手语“翻译器”目前不包括针对能说话但听不见的用户的语音识别功能，但这是未来发展持续讨论的话题。

最终，该系统旨在促进聋哑人作为沟通者而不只是接受者积极参与，打破现有障碍并促进更具包容性的社会。Lima总结道：“我们完全相信这项技术将彻底改变听力和听力障碍者之间的互动。”

来源：至顶网软件与服务频道

0赞

好文章，需要你的鼓励

联想与巴西创新中心CESAR利用人工智能让听力正常人看懂手语

来源：至顶网软件与服务频道

2023

08/10

17:23

分享

点赞

Google力推手机AI功能引发关注

Meta发布AI翻译功能，支持脸书和Instagram内容实时转换

HPE发布Nvidia Blackwell驱动的AI服务器，抢占AI市场需求

ISACA推出AI安全管理高级认证项目

谷歌推出智能体SOC系统提升安全事件响应速度

Lumen升级400GB数据中心连接基础设施助力AI发展

AI和流媒体推动，2030年面临"网络危机"

Pine64停产Pro手机转向RISC-V业务

日立Vantara将VSP One块存储扩展至Azure云平台

Finchetto光学数据包交换机：光无法存储的技术挑战与突破

Python开发者调查显示增长强劲，但基金会资金面临困境

多站点IT基础设施升级指南：告别VMware的替代方案

最热门的 AI 模型：它们的功能和使用方法

这款古怪的 AI 智能手机可以创建你的数字分身

Faireez 获 750 万美元融资，为租赁市场提供 AI 驱动的酒店式管家服务

Broadcom 大获全胜：70% 大型 VMware 客户购买其最全面解决方案

Peer 获得1050万美元元宇宙引擎投资，推出3D个人星球功能

获 3000 万美元融资，Crogl 发布面向安全分析师的全新 AI "钢铁侠战衣"

Turing 获得 1.11 亿美元融资，估值达到 22 亿美元，为 OpenAI 等大语言模型公司提供关键代码支持

Tavus 推出系列 AI 模型，实现实时人脸交互技术突破

Welevel 获得 570 万美元融资，革新程序化游戏开发

AI 驱动的卓越运营：企业如何通过人人可及的流程智能提升成功

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

IEEE专家委员胡凝：消解AI幻觉“阴影”，洞见“超级个体”价值锚点

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: