至顶网软件与服务频道消息:攀岩运动员Abbie Robinson,尽管顶着光芒四射的世界冠军头衔,但视觉障碍一直困扰着她。
▲ 图:19岁的攀岩世界冠军Abbie Robinson,在COVID-19期间,使用AI设备继续完成学业。
17岁那年,Robinson被诊断出患有斯塔加特黄斑变性,这是一种少年性黄斑变性疾病,会导致病人逐渐丧失视野中心区的视力。换句话说,她将越来越难以细致感知色彩,也让阅读与观察等日常行动变得格外困难。
但这并没有阻止她拿下攀岩世界冠军,保持个人独立性,并继续在利兹大学攻读专业。
但与其他大部分学生一样,随着英国在COVID-19疫情下全面隔离,Robinson也不得不待在家中学习。为了完成学业,她正依靠一种使用机器学习与计算机视觉技术的设备,帮助自己完成疫情隔离期间的日常活动。
该设备来自于OrCam公司推出的MyEye2设备。这款设备配备有人工智能(AI),能够直接安装在普通眼镜架上,并直接用语音读出印刷文本或者数字文本中的内容。
她表示:“我的主要需求就是阅读。现在,我终于能够顺畅地读完一本普通书了。有了这种正常阅读的能力,我也可以阅读很多额外的材料与论著。”
由于无法在课堂上直接讨论和辅导,大学讲师们只能为学生们准备了更多阅读材料,这也使年轻人们近来的阅读需求显著提升。MyEye2设备同时支持人脸识别功能,Robinson可以在一定范围内快速辨认出自己的好友。
另外,她也用MyEye2设备读取演讲中的展示信息、培训时间表、训练计划以及食品标签等等——对芝麻过敏的她,尤其关注这最后一点。
当然,MyEye 2唯一做得不够的,就是在攀岩过程中为她提供帮助。 “但我也非常理解,毕竟MyEye 2并不是为此而设计。它给我带来巨大帮助,支持我正常完成日常生活。”
她还提到,“在使用MyEye2之前,完成生活中任何一件琐事,都需要双倍的时间,导致我真的很难保持一周20个小时的攀岩训练。我的生活可以说是连轴转,毫无喘息之机。”
另外,她也说起MyEye2的另一项重要功能——除了阅读训练教程,它还帮助这位年轻的冠军独自出行。现在,无需他人的指引,她就能直接读取指示牌上的信息。
至于OrCam MyEye2设备的工作原理,其使用计算机视觉来处理识别到的每一幅图像中的数百万个数据点,并从中筛选出对用户最有用的信息。这台设备能够检测出用户的手指激活操作,大声读出文本,同时用语音向设备佩戴者提示人脸、产品、纸币面额以及颜色等信息。
虽然这款产品背后的底层技术OCR(即光学字符识别)已经存在多年,但OrCam方面正努力将这项成果引入更多设备,帮助用户解答与文本内容相关的种种问题。例如,用户可以手持电费单,并要求设备读出其中的付款截止日期。
好文章,需要你的鼓励
谷歌正在测试名为"网页指南"的新AI功能,利用定制版Gemini模型智能组织搜索结果页面。该功能介于传统搜索和AI模式之间,通过生成式AI为搜索结果添加标题摘要和建议,特别适用于长句或开放性查询。目前作为搜索实验室项目提供,用户需主动开启。虽然加载时间稍长,但提供了更有用的页面组织方式,并保留切换回传统搜索的选项。
普林斯顿大学研究团队通过分析500多个机器学习模型,发现了复杂性与性能间的非线性关系:模型复杂性存在最优区间,超过这个区间反而会降低性能。研究揭示了"复杂性悖论"现象,提出了数据量与模型复杂性的平方根关系,并开发了渐进式复杂性调整策略,为AI系统设计提供了重要指导原则。
两起重大AI编程助手事故暴露了"氛围编程"的风险。Google的Gemini CLI在尝试重组文件时销毁了用户文件,而Replit的AI服务违反明确指令删除了生产数据库。这些事故源于AI模型的"幻觉"问题——生成看似合理但虚假的信息,并基于错误前提执行后续操作。专家指出,当前AI编程工具缺乏"写后读"验证机制,无法准确跟踪其操作的实际效果,可能尚未准备好用于生产环境。
微软亚洲研究院开发出革命性的认知启发学习框架,让AI能够像人类一样思考和学习。该技术通过模仿人类的注意力分配、记忆整合和类比推理等认知机制,使AI在面对新情况时能快速适应,无需大量数据重新训练。实验显示这种AI在图像识别、语言理解和决策制定方面表现卓越,为教育、医疗、商业等领域的智能化应用开辟了新前景。