至顶网软件与服务频道消息:攀岩运动员Abbie Robinson,尽管顶着光芒四射的世界冠军头衔,但视觉障碍一直困扰着她。
▲ 图:19岁的攀岩世界冠军Abbie Robinson,在COVID-19期间,使用AI设备继续完成学业。
17岁那年,Robinson被诊断出患有斯塔加特黄斑变性,这是一种少年性黄斑变性疾病,会导致病人逐渐丧失视野中心区的视力。换句话说,她将越来越难以细致感知色彩,也让阅读与观察等日常行动变得格外困难。
但这并没有阻止她拿下攀岩世界冠军,保持个人独立性,并继续在利兹大学攻读专业。
但与其他大部分学生一样,随着英国在COVID-19疫情下全面隔离,Robinson也不得不待在家中学习。为了完成学业,她正依靠一种使用机器学习与计算机视觉技术的设备,帮助自己完成疫情隔离期间的日常活动。
该设备来自于OrCam公司推出的MyEye2设备。这款设备配备有人工智能(AI),能够直接安装在普通眼镜架上,并直接用语音读出印刷文本或者数字文本中的内容。
她表示:“我的主要需求就是阅读。现在,我终于能够顺畅地读完一本普通书了。有了这种正常阅读的能力,我也可以阅读很多额外的材料与论著。”
由于无法在课堂上直接讨论和辅导,大学讲师们只能为学生们准备了更多阅读材料,这也使年轻人们近来的阅读需求显著提升。MyEye2设备同时支持人脸识别功能,Robinson可以在一定范围内快速辨认出自己的好友。
另外,她也用MyEye2设备读取演讲中的展示信息、培训时间表、训练计划以及食品标签等等——对芝麻过敏的她,尤其关注这最后一点。
当然,MyEye 2唯一做得不够的,就是在攀岩过程中为她提供帮助。 “但我也非常理解,毕竟MyEye 2并不是为此而设计。它给我带来巨大帮助,支持我正常完成日常生活。”
她还提到,“在使用MyEye2之前,完成生活中任何一件琐事,都需要双倍的时间,导致我真的很难保持一周20个小时的攀岩训练。我的生活可以说是连轴转,毫无喘息之机。”
另外,她也说起MyEye2的另一项重要功能——除了阅读训练教程,它还帮助这位年轻的冠军独自出行。现在,无需他人的指引,她就能直接读取指示牌上的信息。
至于OrCam MyEye2设备的工作原理,其使用计算机视觉来处理识别到的每一幅图像中的数百万个数据点,并从中筛选出对用户最有用的信息。这台设备能够检测出用户的手指激活操作,大声读出文本,同时用语音向设备佩戴者提示人脸、产品、纸币面额以及颜色等信息。
虽然这款产品背后的底层技术OCR(即光学字符识别)已经存在多年,但OrCam方面正努力将这项成果引入更多设备,帮助用户解答与文本内容相关的种种问题。例如,用户可以手持电费单,并要求设备读出其中的付款截止日期。
好文章,需要你的鼓励
四川大学研究团队发现,当前先进的AI模型在面对信息不完整的数学问题时,缺乏主动询问澄清信息的能力,更倾向于基于假设给出答案。
中南大学等机构联合发布TextAtlas5M数据集,包含500万图像-文本对,专门解决AI长文本图像生成难题。该数据集平均文本长度148.82词,远超现有数据集,涵盖广告、学术、教育等真实场景。配套的TextAtlasEval基准测试显示,即使最先进的商业模型也面临显著挑战,为AI图像生成技术指明了新的发展方向。
从11岁就梦想造人形机器人的Bernt Bornich,用'huggable'形容他的Neo Gamma机器人——这个能举起150磅的66磅'运动员',正以家庭为试验场突破AI学习瓶颈:'工厂20小时就触及学习天花板,而家庭环境的多样性才是通往AGI的钥匙'。
剑桥大学研究团队创建了史上最难的AI视觉测试ZeroBench,包含100道精心设计的视觉推理题目。在这项测试中,包括GPT-4o、Claude、Gemini在内的20个全球最先进AI模型全部得了0分,暴露了当前AI在基础视觉理解上的严重缺陷。研究发现AI主要在计数、空间推理等基础任务上失败,而非逻辑推理能力不足。