微软今天宣布Azure Managed Grafana云服务全面上市,该服务让企业能够检测技术基础设施中存在的技术问题。
Azure Managed Grafana是基于开源Grafana可观察性平台的,该平台可以收集有关云环境的技术数据,对这些数据进行梳理,并将其转换为图表。管理员可以查看图表从中发现潜在的技术问题,例如应用性能突然下降或者数据库故障等。
Grafana是同类中最受欢迎的开源项目之一,将该平台商业化的初创公司Grafana Labs去年与微软签署了技术合作伙伴关系,并在这次合作中开发了Azure Managed Grafana服务。
微软在今年4月首次发布了该服务的预览版。企业可以使用Azure Managed Grafana来检测云环境中的技术问题,对本地基础设施进行故障排除,该服务承诺把运行Grafana时涉及到的很多手动维护任务进行自动化。
在全面上市之际,微软更新了该服务增加了多项新功能,其中微软将Azure Managed Grafana升级到Grafana 9.0,也就是Grafana开源平台最新版本,这个版本增加了一个增强型的警报工具,可以自动通知管理员存在潜在的技术问题。
Azure Managed Grafana并不是基于Grafana的开源版本,而是商用版本,是与微软合作的初创公司Grafana Labs开发的。商业版提供了开源版本中未包含的很多附加功能,其中,提供了一组用于监控基础设施和应用的预打包分析仪表板。
在此次更新中,微软也将自己的一组预打包仪表板添加到Azure Managed Grafana,这些新增功能将使跟踪运行在微软Azure容器应用上的软件容器工作负载的性能变得更加容易。新的仪表板还支持其他用途,例如监控企业用来优化网络中数据流量的负载平衡器。
微软高级产品营销经理Arti Gulwadi详细介绍说:“Azure Container Apps新增的Aggregate View仪表板显示了按资源组、环境和区域过滤的容器应用情况,可通过查看CPU、内存、重启和网络流量的关键指标或修订、副本和状态代码来监控Azure Container Apps的性能。”
微软还增加了一项与Azure Monitor的集成,Azure Monitor是微软云平台中现有的基础设施监控服务。该服务中有一项用于收集日志的功能,这些记录中包含了有关重要事件(例如服务器故障)的数据,微软让Azure Monitor日志合并到由Azure Managed Grafana 分析仪表板中变得更简单。
Azure Managed Grafana包含了一组可靠性功能,旨在防止技术问题使服务宕机,此外还增加了另一项可靠性功能,即区域冗余,可以跨多个云数据中心对该服务进行分布式部署,如果其中一个数据中心遇到技术问题,Azure Managed Grafana可以继续在其他设施中运行。
好文章,需要你的鼓励
在Cloudera的“价值观”中,企业智能化的根基可以被概括为两个字:“源”与“治”——让数据有源,智能可治。
苏州大学研究团队提出"语境降噪训练"新方法,通过"综合梯度分数"识别长文本中的关键信息,在训练时强化重要内容、抑制干扰噪音。该技术让80亿参数的开源模型在长文本任务上达到GPT-4o水平,训练效率比传统方法高出40多倍。研究解决了AI处理长文档时容易被无关信息干扰的核心问题,为文档分析、法律研究等应用提供重要突破。
微软正式确认配置管理器将转为年度发布模式,并将Intune作为主要创新重点。该变化将于2026年秋季生效,在此之前还有几个版本发布。微软表示此举是为了与Windows客户端安全和稳定性节奏保持一致,优先确保安全可靠的用户体验。配置管理器将专注于安全性、稳定性和长期支持,而所有新功能创新都将在云端的Intune中进行。
清华大学团队首次揭示了困扰AI训练领域超过两年的"幽灵故障"根本原因:Flash Attention在BF16精度下训练时会因数字舍入偏差与低秩矩阵结构的交互作用导致训练崩溃。研究团队通过深入分析发现问题源于注意力权重为1时的系统性舍入误差累积,并提出了动态最大值调整的解决方案,成功稳定了训练过程。这项研究不仅解决了实际工程问题,更为分析类似数值稳定性挑战提供了重要方法论。