ZD至顶网软件频道消息:微软又购入一千万条DNA,此举为微软研究数字数据新存储方法的一步。
微软和华盛顿大学的研究人员将利用购入的长链寡核苷酸DNA对数字数据进行高密度编码研究工作。
DNA的主要用途自然是存储控制所有已知生物的生长和发育的基因指令,DNA几十亿年来一直都在做这件事。现在科学家们试图将该功能用于数字数据的存储。
微软一年前曾从Twist Bioscience首次购入DNA,买了1000万条合成DNA。其间,两家机构提高了存储密度,因此降低了DNA数字数据存储的成本,每条DNA可编入更多数字数据;去年7月,微软和华盛顿大学的研究人员宣布,他们创纪录地将200 MB的数据存储在铅笔尖大小的DNA里。
华盛顿大学Torode家庭职业发展中心的计算机科学和工程教授及该项目的主要研究者之一的Luis Ceze表示 ,“重要的是, DNA不仅可以提供高密度长期数字数据存储解决方案,而且,与现有的存储技术相比,该技术所需的静态能源很少。“
他还表示,“此外,DNA作为信息存储介质永远不会过时,因为我们总是会要读取DNA的。再也无需将数据从磁盘迁移到磁带再迁移到密集磁带了。”
Karin Strauss是微软高级研究员,也是该项目的主要研究人员之一。Strauss指,要将DNA存储用于主流存储仍存在许多挑战,但Strauss表示研究团队对目前取得的进展感到鼓舞。
Strauss 表示,“对数据存储的需求一直都在以惊人的速度增长。各种机构和消费者均需要存储大量的数据,例如,医疗数据或个人视频,用户肯定可以受益于新型长期存储解决方案。我们相信DNA大有可能提供新型长期存储的答案。”
DNA用于数据存档可以避免传统数字存储媒体的两个关键局限:有限的寿命和低密度数据。DNA数据存储可以持续2000年,不会变质。研究人员的实验已经表明,几克DNA就可以存储一个 EB的数字数据,而且,存储密度还可以改善,几克的DNA有潜力存储一个ZB的数字数据。
不过,DNA存储目前的写入速度还非常慢,华盛顿大学的科学家们花了一个星期才存储了一百万个字节的数据,而且也非常昂贵。DNA存储技术还要克服许多困难,但DNA大有可能最终将取代诸如磁带一类的长期存储媒体。
好文章,需要你的鼓励
邻里社交应用Nextdoor推出重新设计版本,新增本地新闻、实时警报和名为"Faves"的AI功能,用于发现本地商户和地点。该应用与3500家本地出版商合作提供新闻内容,通过Samdesk和Weather.com提供天气、交通、停电等实时警报。Faves功能利用15年邻里对话数据训练的大语言模型,为用户提供本地化AI推荐服务,帮助用户找到最佳餐厅、徒步地点等本地信息。
Skywork AI推出的第二代多模态推理模型R1V2,通过创新的混合强化学习方法,成功解决了AI"慢思考"策略在视觉推理中的挑战。该模型在保持强大推理能力的同时有效控制视觉幻觉,在多项权威测试中超越同类开源模型,某些指标甚至媲美商业产品,为开源AI发展树立了新标杆。
英国生物银行完成了世界上最大规模的全身成像项目,收集了10万名志愿者的超过10亿次扫描数据,用于研究人体衰老和疾病过程。该项目历时11年,每次扫描耗时5小时,投资6200万英镑。目前已有8万人的成像数据供全球研究人员使用,剩余数据将于年底前发布。项目已开发出能预测38种常见疾病的AI工具,并在心脏病、痴呆症和癌症诊断方面取得突破。
这项由北京大学等多所高校联合完成的研究,首次对OpenAI GPT-4o的图像生成能力进行了全面评估。研究团队设计了名为GPT-ImgEval的综合测试体系,从文本转图像、图像编辑和知识驱动创作三个维度评估GPT-4o,发现其在所有测试中都显著超越现有方法。研究还通过技术分析推断GPT-4o采用了自回归与扩散相结合的混合架构,并发现其生成图像仍可被现有检测工具有效识别,为AI图像生成领域提供了重要的评估基准和技术洞察。