微软今天宣布Azure Managed Grafana云服务全面上市,该服务让企业能够检测技术基础设施中存在的技术问题。
Azure Managed Grafana是基于开源Grafana可观察性平台的,该平台可以收集有关云环境的技术数据,对这些数据进行梳理,并将其转换为图表。管理员可以查看图表从中发现潜在的技术问题,例如应用性能突然下降或者数据库故障等。
Grafana是同类中最受欢迎的开源项目之一,将该平台商业化的初创公司Grafana Labs去年与微软签署了技术合作伙伴关系,并在这次合作中开发了Azure Managed Grafana服务。
微软在今年4月首次发布了该服务的预览版。企业可以使用Azure Managed Grafana来检测云环境中的技术问题,对本地基础设施进行故障排除,该服务承诺把运行Grafana时涉及到的很多手动维护任务进行自动化。
在全面上市之际,微软更新了该服务增加了多项新功能,其中微软将Azure Managed Grafana升级到Grafana 9.0,也就是Grafana开源平台最新版本,这个版本增加了一个增强型的警报工具,可以自动通知管理员存在潜在的技术问题。
Azure Managed Grafana并不是基于Grafana的开源版本,而是商用版本,是与微软合作的初创公司Grafana Labs开发的。商业版提供了开源版本中未包含的很多附加功能,其中,提供了一组用于监控基础设施和应用的预打包分析仪表板。
在此次更新中,微软也将自己的一组预打包仪表板添加到Azure Managed Grafana,这些新增功能将使跟踪运行在微软Azure容器应用上的软件容器工作负载的性能变得更加容易。新的仪表板还支持其他用途,例如监控企业用来优化网络中数据流量的负载平衡器。
微软高级产品营销经理Arti Gulwadi详细介绍说:“Azure Container Apps新增的Aggregate View仪表板显示了按资源组、环境和区域过滤的容器应用情况,可通过查看CPU、内存、重启和网络流量的关键指标或修订、副本和状态代码来监控Azure Container Apps的性能。”
微软还增加了一项与Azure Monitor的集成,Azure Monitor是微软云平台中现有的基础设施监控服务。该服务中有一项用于收集日志的功能,这些记录中包含了有关重要事件(例如服务器故障)的数据,微软让Azure Monitor日志合并到由Azure Managed Grafana 分析仪表板中变得更简单。
Azure Managed Grafana包含了一组可靠性功能,旨在防止技术问题使服务宕机,此外还增加了另一项可靠性功能,即区域冗余,可以跨多个云数据中心对该服务进行分布式部署,如果其中一个数据中心遇到技术问题,Azure Managed Grafana可以继续在其他设施中运行。
好文章,需要你的鼓励
企业谈AI基础设施时,注意力往往首先集中在模型、GPU和算力集群上。但当大模型应用走向规模化推理,一个瓶颈开始浮现:算力采购完成,并不意味着Token能够被稳定、低成本、可控地交付出去。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。