微软公司利用AI技术为残障人士群体提供帮助 原创

尽管与AI相关的事务需要值得认真考量,但这并不妨碍我们利用AI成果为残障人士谋求福利。

尽管与AI相关的事务需要值得认真考量,但这并不妨碍我们利用AI成果为残障人士谋求福利。

微软公司利用AI技术助力残障人士群体 

上图为微软公司Azure工程技术负责人James Kavanagh、战略政策顾问Dave Heiner、首席讲述者Steve Clayton以及首席无障碍官Jenny Lay-Flurrie展开小组讨论。

对于微软公司而言,“无障碍设计”是一项很重要的概念,这一概念也是其各类,包括Seeing AI在内的人工智型产品的基本构建思路。

本周三微软宣布在其系列AI工具之外推出了一款名为Seeing AI的免费移动应用,这款应用通过描述周围的世界来帮助存在视觉障碍的患者群体。这个将深度学习和Microsoft认知服务结合在一起的应用项目仍处于研究当中,目前可以阅读文档,理解标题、段落和目录等结构化数据,并能够利用条形码进行产品识别。

此外,其还能够识别并描述其它应用程序当中的图像,甚至能够精确定位人物面部位置,并提供其外观描述,不过相机的质量与照明情况可能对描述结果产生影响。

在本届于悉尼召开的微软人工智能未来大会上,微软公司驻墨尔本云解决方案架构师Kenny Johar Singh展示了Seeing AI,并希望利用其为现实世界场景带来助益。

尽管Singh由于退化性视网膜疾病而丧失了75%视力,但科技已经成为一种“力量源泉”,帮助他在技术行业当中建立起自己的职业生涯。

在使用Seeing AI之前,Singh需要在妻子的帮助下才能弥合他与现实世界之间的信息鸿沟。但凭借着新应用的支持,如今他已经可以更加独立地生活。

在与会者面前,Singh利用这款应用进行产品扫描,而该应用则正确地将其识别为“Gounce牌椰子柠檬味天然能量球”。

他在本届微软峰会上解释称,“它为我带来了极大的帮助。它负责告诉我检测到的对象的属性,而我则考虑营养方面的因素——包括蛋白质、碳水化合物、脂肪等等。我已经能够意识到自己正在挑选什么,这基本上意味着我可以完全独立地完成食物采购。我的妻子很喜欢它,因为她不再需要事无巨细地为我提供帮助。”

Singh还将自己的手机摄像头指向了微软首席无障碍官Jenny Lay-Flurrie,而Seeing AI应用则将Lay-Flurrie描述为“一位拥有棕色头发、佩戴眼镜,而且看起来神色愉悦的54岁的女性。”其中三项描述非常准确,只在年龄猜测方面出现了误差。

Lay-Flurrie在本次微软峰会上指出,“盲人在拍照时往往面临困难,而我们经常看到不少极端的图像案例。对于质量不高的图像,我们可以使用适应性算法并引入机器学习机制。有时候图像内容也比较杂乱,但认知服务的整体质量将逐步成倍增加,这是因为我们将更多此类数据样本加入其中。”

微软公司在Office 365与Windows 10等平台上提供的最新辅助功能亦在被澳大利亚国立大学法律讲师Cameron Roles所使用,他在一份声明中表示:“在我看来,这绝对是有史以来对盲人而言最激动人心的时刻。”

作为家中的三胞胎之一,担任澳大利亚视力协会董事的Roles早产了三个月,最终虽然得救但却遭遇失明。对他来说,Office 365与Windows 10等平台中的最新辅助功能无疑起到了重要的作用。

举例来说,微软公司最近将文本替换引擎整合至Windows 10内核当中,Lay-Flurrie称这是一项“重大的举措”,意味着使用第三方屏幕阅读器的视觉障碍用户或者微软自己的Narrator(负责大声朗读并描述事件)将能够获得图像内容描述信息,而非单纯意识到屏幕上存在图像。

微软公司最近还推出了Eye Cnotrol,这是一项适用于Windows 10的内置眼动追踪功能,可帮助患有运动神经元症(简称MND)与其它行动障碍类疾病的用户驾驭其计算机。此项功能目前仅可搭配瑞典眼动追踪方案供应商Tobii公司的Eye Tracker 4C装置使用,但微软正在努力增加更多对类似设备的支持能力。

Eye Control内部具备一项被称为“形状写入”的功能,允许用户通过查看单词的首字母、尾字母以及“二者之间的其它字母”加快打字速度。软件公司于今年8月表示,“预测出的单词提示将按照单词最后一个关键字母显示”,如果预测 不正确,用户亦可选择其它预测选项。

微软方面还在Windows 10中引入了色盲滤波器,Lay-Flurrie提到这部分适用群体更为广泛——每九个人中即有一人遭受色盲困扰。

存在听力障碍的Lay-Flurrie指出,虽然我们需要考虑AI在隐私与安全性方面产生的潜在影响,但亦应同时看到其积极的一面。她解释称,全球有十亿残疾人,而AI将能够在日常生活与工作环境当中为这部分群体赋予力量。

她解释称,“我还关注自己的女儿,她今年10岁,患有孤独症。所谓孤独症,是指病患有时候无法理解社交线索及社交语言,无法准确识别面部表情,因此常常误解我们说的话……所以我热爱AI技术的潜能与力量,并开始意识到其将在认知与心理健康领域掀起的创新浪潮。在这一领域,AI能够理解这些社交线索,并利用视觉刺激进行解读。目前存在某些治疗性应用(要求病患观看YouTube视频),如果能够将其真正引入现实生活,病患就能够在真实场景中进行学习——而不必傻坐在那里。”

“我认为实时应用程序可以改变人们的生活,包括在工作场所中使用PowrePoint Designer的方式,帮助人们充分发挥其天赋……而且残障人士需要能够以同样的方式完成这些工作。认知服务与一些强大的引擎完全能够为我们提供这样的能力。”

Lay-Flurrie同时提到,残疾人同样能够在创新领域作出重大贡献。

她在本届微软峰会上表示,“残疾人士拥有独特的观察视角,并能够以此为基础为创新提供重要的贡献,同时加快我们发展人工智能的速度。”

微软首席讲述者Steve Clayton在会议上表达了类似的观点,指出由且为残疾人士设计的创新成果将能够发挥更为广泛的作用。

他指出,“在刚刚开始学习设计中的包容性时,我第一次意识到街边的过渡缓坡其实是为坐在轮椅上的人们发明的。事实证明,如果正常人带有大量物品或者穿着轮滑鞋,这些缓坡同样非常有用。因此我想到,如果我们专门为视力受损或其他残疾人士设计一项功能,那其很可能同样亦会为普通用户带来显著助益。”

随着计算机视觉、主意识别以及自然语言理解能力的进步,微软公司已经能够将AI集成至其它产品当中,同时提供新的AI驱动型解决方案。

微软方面已经开发出能够将错误率保持在5.1%的语音识别技术,而图像识别方案的错误率更是仅为3.5%。

微软公司目前亦在主导斯坦福大学的竞赛项目,利用维基百科中的信息来测试AI系统如何回答与文本段落相关的问题。预计该竞赛产生的结果,将可用于必应搜索以及聊天机器人反应等领域。

微软公司在本周四的声明中表示,“这意味着利用AI的深度学习能力,计算机将可识别对话中的人物语言、提供相关答案并进行实时翻译。”

“这还意味着工厂车间里的计算机能够区分所制造部件与人类员工的手臂,而自动驾驶车辆亦区分街道中滚动的球体与蹒跚学步的孩子。”

在澳大利亚,堪培拉大学开发出Lucy与Bruce聊天机器人,其利用微软Bot框架与微软认知服务,负责提供语言理解智能服务以简化面向学生与教职员工的支持。

在启动之后,Lucy将接入该大学的Dynamics 365平台,并在Lucy无法回答问题时提交求助申请。该大学还在探索利用Bruce将IT服务申请交付至工作人员加以记录的可能性。

澳大利亚证券交易所上市包装制造商Pact集团也在与微软公司合作,利用其认证服务计算机视觉方案进行面部与差异识别,从而提高工作场所的安全性水平。

Pact公司的Workroom Kiosk Demo能够识别车间环境中的每一名员工,并根据对各员工所执行工作任务的背景信息判断其是否穿着有合适的安全装备,同时对其行为加以监控。如果存在潜在问题,团队负责人会立即收到警报。目前该系统的现场试用版本即将发布。

微软公司还公布了翻译工作的进展,其进一步扩大神经网络的使用范围,旨在提升各类译者支持型产品的文本与语音翻译效果。

对于希望学习中文的用户,微软公司亚洲研究院将“很快”发布一款新的移动应用,其将成为一位始终在线且基于AI技术的语言学习助手。

另外,微软方面还为AI开发人员及数据科学家公布了AVisual Studio Tools for AI,据称其中整合了Visual Studio的调试与富文本编辑等功能,且可支持微软Cognitive Toolkit、谷歌Tensorflow以及Caffe等深度学习框架。Visual Studio Tools for AI利用现有代码以支持Python、C/C++/C#,同时可为Cognitive Toolkit BrainScript额外提供支持。

面向Azure IoT Edge的AI功能则允许开发人员利用C、Java、.NET、Node.js以及Python等语言实现基于容器的模块的构建与测试工作,同时简化边缘位置工作负载与机器学习模型的部署与管理流程——目前这些功能已经正式发布。

Clayton在一份声明中指出,“AI的宗旨在于利用智能技术增强人类的聪明才智,这种智能技术能够归因、理解并与人类交互,从而帮助我们解决社会当中所存在的一系列根本性挑战。”

来源:ZDNet

0赞

好文章,需要你的鼓励

2017

11/17

14:20

分享

点赞

邮件订阅
白皮书