ZD至顶网软件频道消息:AWS在2016年收购的NICE Systems已经取得成果,AWS公布了新一代EnginFrame高性能计算服务。
EnginFrame 2017运行在AWS云之上,使其能够在“不到一小时”的时间内更轻松地部署基于Linux的高性能计算集群,AWS这样表示。
AWS首席布道师Jeff Barr写到,EnginFrame 2017部署的基础是一个CloudFormation模板,为用户提供了一个创建新集群的接口。
这次发布的EngineFrame创建了两个CloudFormation堆栈:
“Main Stack”是一个“共享的、基于EFS、用于你集群的存储,Application Load Balancer把传入的请求路由到Default Cluster Stack”。它还托管了AWS Lambda功能用于设置和管理IAM角色(让用户可以访问资源)以及SSL证书。
Default Cluster Stack中,工作负载运行在Main Stack的管理之下。“集群有CfnCluster的支撑,可根据需要纵向扩展和向下扩展,当不再需要节点的时候终止节点。此外,它还运行EngineFrame门户。”
已经开始供货的EngineFrame 2017是根据用户消耗的AWS资源——EC2实例、EFS存储等——来收费的,AWS还提供了EngineFrame的90天免费试用,在这之后,许可费用是按照并发用户数量计算的。
Barr指出,用户可以继续维持他们本地的EngineFrame配置,也可以迁移到云中。
好文章,需要你的鼓励
在Cloudera的“价值观”中,企业智能化的根基可以被概括为两个字:“源”与“治”——让数据有源,智能可治。
苏州大学研究团队提出"语境降噪训练"新方法,通过"综合梯度分数"识别长文本中的关键信息,在训练时强化重要内容、抑制干扰噪音。该技术让80亿参数的开源模型在长文本任务上达到GPT-4o水平,训练效率比传统方法高出40多倍。研究解决了AI处理长文档时容易被无关信息干扰的核心问题,为文档分析、法律研究等应用提供重要突破。
微软正式确认配置管理器将转为年度发布模式,并将Intune作为主要创新重点。该变化将于2026年秋季生效,在此之前还有几个版本发布。微软表示此举是为了与Windows客户端安全和稳定性节奏保持一致,优先确保安全可靠的用户体验。配置管理器将专注于安全性、稳定性和长期支持,而所有新功能创新都将在云端的Intune中进行。
清华大学团队首次揭示了困扰AI训练领域超过两年的"幽灵故障"根本原因:Flash Attention在BF16精度下训练时会因数字舍入偏差与低秩矩阵结构的交互作用导致训练崩溃。研究团队通过深入分析发现问题源于注意力权重为1时的系统性舍入误差累积,并提出了动态最大值调整的解决方案,成功稳定了训练过程。这项研究不仅解决了实际工程问题,更为分析类似数值稳定性挑战提供了重要方法论。