微软今天宣布开源Trill——一个每秒分析数十亿事件的数据处理引擎。
该项目用于微软Azure云平台中,是微软开源的众多内部技术之一。微软开源的技术组合包括多个人工智能工具,包括一个同样用于Azure中的Infer.NET系统,以及流行的.NET开发工具包。
Trill是一个特别重要的补充,该引擎具有足够的通用性,可以处理实时数据和历史数据,目前只有少数开源工具可以做到。Trill将支持多模态分析与微软称无法完全与其他系统匹配的功能结合到一起。
Trill最突出的是它的性能。Trill可以接收事件(例如来自土壤传感器的温度变化日志),速度达到每秒数十亿个。在执行高级操作(例如从一批传感器日志中提取最高温度读数)时,它的速度略慢一些但仍然令人印象深刻,每秒达到1000万到1亿个事件。
微软Azure首席研究工程师James Terwilliger在一篇博客文章中这样写道:“Trill在实时数据和离线数据集方面的表现同样出色,在整个范围内实现了最佳性能,这让它成为那些只需要一款工具就能进行所有分析的用户的首选引擎。”
Trill与其他工具与众不同之处在于它的可定制性。Trill引擎可以更改传入数据处理的间隔,让用户能够粒度地管理延迟。此外企业还可以通过定制的分析功能扩展原生查询语言。
微软将Trill用于各种应用,例如支持Azure Stream Analytics服务和Bing Ads业务,并帮助视频游戏开发部门分析玩家数据。
Trill在微软内部的广泛使用,对于潜在企业采用者来说可能是一个重要卖点,这说明Trill引擎具有足够的动力,可以在生产环境中使用。
Azure数据工程经理Zhong Chen在公布该项目的博客文章中表示,企业不一定要自己部署Trill才能利用该功能。
Chen说:“通过使用Trill作为节点上的处理引擎,微软在10月个内就从Azure Stream Analytics的第一行代码走向了公开预览。在不久的将来,我们考虑通过用户定义的运营商模型展示Trill的编程模型,以便让所有客户都能利用Trill出色的功能。”
好文章,需要你的鼓励
邻里社交应用Nextdoor推出重新设计版本,新增本地新闻、实时警报和名为"Faves"的AI功能,用于发现本地商户和地点。该应用与3500家本地出版商合作提供新闻内容,通过Samdesk和Weather.com提供天气、交通、停电等实时警报。Faves功能利用15年邻里对话数据训练的大语言模型,为用户提供本地化AI推荐服务,帮助用户找到最佳餐厅、徒步地点等本地信息。
Skywork AI推出的第二代多模态推理模型R1V2,通过创新的混合强化学习方法,成功解决了AI"慢思考"策略在视觉推理中的挑战。该模型在保持强大推理能力的同时有效控制视觉幻觉,在多项权威测试中超越同类开源模型,某些指标甚至媲美商业产品,为开源AI发展树立了新标杆。
英国生物银行完成了世界上最大规模的全身成像项目,收集了10万名志愿者的超过10亿次扫描数据,用于研究人体衰老和疾病过程。该项目历时11年,每次扫描耗时5小时,投资6200万英镑。目前已有8万人的成像数据供全球研究人员使用,剩余数据将于年底前发布。项目已开发出能预测38种常见疾病的AI工具,并在心脏病、痴呆症和癌症诊断方面取得突破。
这项由北京大学等多所高校联合完成的研究,首次对OpenAI GPT-4o的图像生成能力进行了全面评估。研究团队设计了名为GPT-ImgEval的综合测试体系,从文本转图像、图像编辑和知识驱动创作三个维度评估GPT-4o,发现其在所有测试中都显著超越现有方法。研究还通过技术分析推断GPT-4o采用了自回归与扩散相结合的混合架构,并发现其生成图像仍可被现有检测工具有效识别,为AI图像生成领域提供了重要的评估基准和技术洞察。