至顶网软件频道消息:谷歌和同属Alphabet集团专注于健康的Verily Life Sciences共同进行的一项研究表明,深度学习算法可以通过分析个体的视网膜照片准确预测心脏病。
这些公司的科学家在《自然-生物医学工程》(《Nature Biomedical Engineering》)上发表的一篇新论文中详细介绍了他们的发现:“通过深度学习视网膜眼底照片预测引起心血管疾病的危险因素”。
视网膜眼底照片包括眼睛的血管,这篇论文显示可以利用血管准确预测心血管疾病的危险因素,包括其人是否吸烟、血压、年龄、性别以及某人是否曾经有过心脏病发作。该算法也能够推断出一个人的种族,这也是心血管相关疾病的一个因素。
谷歌的大脑团队(Brain Team)产品经理Lily Peng写道:“用来自284,335名患者的数据对深度学习算法进行训练,我们能够通过视网膜照片对两个来自12,026名和999名患者的独立数据集进行心血管疾病危险因素的预测,而且预测的准确度高得惊人。”
这个数据集包括来自英国Biobank数据库的48101名患者和来自EyePACS数据库的236244名患者。
正如文章指出的那样,还有一些其他的方法可以通过患者的病史和血液样本评估心血管疾病的风险,但有时关键信息是缺失的,如胆固醇水平。
视网膜图像扫描可以为发现心脏疾病信号提供一种快速、廉价且无创的方式。
鉴于该算法可以准确预测风险因素,科学家们还训练该算法来预测主要心血管疾病的发作,如五年内心脏病发作。
Peng写道:“我们的算法能够在70%的时间内挑选出曾经发作过心血管疾病的患者。这种准确程度已经接近了其他的心血管疾病风险计算方式,而这些方式需要抽血测量胆固醇。”
研究人员还使用注意力图来研究算法如何进行预测,比如是否关注通过血管来预测年龄、吸烟状况和血压。
正如Peng所说,打开黑匣子并且解释清楚预测是如何进行的,应该会让医生对该算法更有信心。
Verily的心血管健康创新负责人Michael McConnell表示,这项研究很有前途的,但现在还处于早期阶段。
他指出:“在进入临床之前,必须还要完成更多的工作,在更大范围的患者群体中开发和验证这些发现。”
然而,如果进一步的研究证实了这些发现,视网膜图像的使用可以减少医生讨论患者预防措施的障碍。
好文章,需要你的鼓励
这篇研究重新审视了循环神经网络中的双线性状态转换机制,挑战了传统观点。高通AI研究团队证明,隐藏单元不仅是被动记忆存储,更是网络计算的积极参与者。研究建立了一个从实数对角线到完全双线性的模型层级,对应不同复杂度的状态跟踪任务。实验表明,双线性RNN能有效学习各种状态跟踪任务,甚至只需极少量训练数据。研究还发现,纯乘法交互比加法交互更有利于状态跟踪,为循环网络设计提供了新视角。
这项研究探讨了多模态大语言模型在增强推理能力时出现的视觉幻觉问题。研究发现,模型生成更长推理链时,对视觉信息的关注减少,导致幻觉增加。研究者提出RH-AUC指标和RH-Bench基准来评估模型在推理与幻觉间的平衡,发现较大模型表现更好,纯强化学习训练优于监督微调加强化学习,且训练数据的类型比数量更重要。这些发现对开发既具推理能力又保持视觉准确性的AI系统具有重要意义。
这篇研究探讨了大语言模型在自动推理任务中的不确定性问题。研究者提出,模型生成形式规范时的概率不确定性不是缺陷,而是宝贵的信号源。通过引入概率上下文无关文法框架分析SMT-LIB程序分布,他们发现不确定性信号具有任务相关性(如逻辑任务中的语法熵AUROC>0.93)。他们的轻量级信号融合方法能减少14-100%的错误,仅需最小弃权,将大语言模型驱动的形式化转变为可靠工程学科。研究揭示当模型正确理解逻辑关系时会产生稳定的语法模式,为判断何时信任模型提供了可靠指标。
来自沙特阿拉伯王子苏丹大学和阿尔法萨尔大学的研究团队开发了GATE(General Arabic Text Embedding)模型,这是一套专为阿拉伯语设计的文本嵌入系统。该研究结合了套娃表示学习和混合损失训练方法,解决了阿拉伯语特有的语义处理挑战。GATE模型在MTEB基准测试的语义文本相似度任务中表现卓越,比包括OpenAI在内的更大模型高出20-25%,同时保持了多维度(768至64)的高效表现。研究通过详细的错误分析揭示了模型在不同相似度水平上的表现特点,为阿拉伯语NLP领域提供了新的研究方向。