至顶网软件与服务频道消息:攀岩运动员Abbie Robinson,尽管顶着光芒四射的世界冠军头衔,但视觉障碍一直困扰着她。
▲ 图:19岁的攀岩世界冠军Abbie Robinson,在COVID-19期间,使用AI设备继续完成学业。
17岁那年,Robinson被诊断出患有斯塔加特黄斑变性,这是一种少年性黄斑变性疾病,会导致病人逐渐丧失视野中心区的视力。换句话说,她将越来越难以细致感知色彩,也让阅读与观察等日常行动变得格外困难。
但这并没有阻止她拿下攀岩世界冠军,保持个人独立性,并继续在利兹大学攻读专业。
但与其他大部分学生一样,随着英国在COVID-19疫情下全面隔离,Robinson也不得不待在家中学习。为了完成学业,她正依靠一种使用机器学习与计算机视觉技术的设备,帮助自己完成疫情隔离期间的日常活动。
该设备来自于OrCam公司推出的MyEye2设备。这款设备配备有人工智能(AI),能够直接安装在普通眼镜架上,并直接用语音读出印刷文本或者数字文本中的内容。
她表示:“我的主要需求就是阅读。现在,我终于能够顺畅地读完一本普通书了。有了这种正常阅读的能力,我也可以阅读很多额外的材料与论著。”
由于无法在课堂上直接讨论和辅导,大学讲师们只能为学生们准备了更多阅读材料,这也使年轻人们近来的阅读需求显著提升。MyEye2设备同时支持人脸识别功能,Robinson可以在一定范围内快速辨认出自己的好友。
另外,她也用MyEye2设备读取演讲中的展示信息、培训时间表、训练计划以及食品标签等等——对芝麻过敏的她,尤其关注这最后一点。
当然,MyEye 2唯一做得不够的,就是在攀岩过程中为她提供帮助。 “但我也非常理解,毕竟MyEye 2并不是为此而设计。它给我带来巨大帮助,支持我正常完成日常生活。”
她还提到,“在使用MyEye2之前,完成生活中任何一件琐事,都需要双倍的时间,导致我真的很难保持一周20个小时的攀岩训练。我的生活可以说是连轴转,毫无喘息之机。”
另外,她也说起MyEye2的另一项重要功能——除了阅读训练教程,它还帮助这位年轻的冠军独自出行。现在,无需他人的指引,她就能直接读取指示牌上的信息。
至于OrCam MyEye2设备的工作原理,其使用计算机视觉来处理识别到的每一幅图像中的数百万个数据点,并从中筛选出对用户最有用的信息。这台设备能够检测出用户的手指激活操作,大声读出文本,同时用语音向设备佩戴者提示人脸、产品、纸币面额以及颜色等信息。
虽然这款产品背后的底层技术OCR(即光学字符识别)已经存在多年,但OrCam方面正努力将这项成果引入更多设备,帮助用户解答与文本内容相关的种种问题。例如,用户可以手持电费单,并要求设备读出其中的付款截止日期。
好文章,需要你的鼓励
腾讯今日开源混元MT系列语言模型,专门针对翻译任务进行优化。该系列包含四个模型,其中两个旗舰模型均拥有70亿参数。腾讯使用四个不同数据集进行初始训练,并采用强化学习进行优化。在WMT25基准测试中,混元MT在31个语言对中的30个表现优于谷歌翻译,某些情况下得分高出65%,同时也超越了GPT-4.1和Claude 4 Sonnet等模型。
腾讯ARC实验室推出AudioStory系统,首次实现AI根据复杂指令创作完整长篇音频故事。该系统结合大语言模型的叙事推理能力与音频生成技术,通过交错式推理生成、解耦桥接机制和渐进式训练,能够将复杂指令分解为连续音频场景并保持整体连贯性。在AudioStory-10K基准测试中表现优异,为AI音频创作开辟新方向。
今年是Frontiers Health十周年。在pharmaphorum播客的Frontiers Health限定系列中,网络编辑Nicole Raleigh采访了Startup Health总裁兼联合创始人Unity Stoakes。Stoakes在科技、科学和设计交汇领域深耕30多年,致力于变革全球健康。他认为,Frontiers Health通过精心选择的空间促进有意义的网络建设,利用网络效应推进创新力量,让企业家共同构建并带来改变,从而有益地影响全球人类福祉。
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。