微软在9月25日于奥兰多举行的Ignite IT Pro大会上,将推出它所谓的“下一代Azure机器学习”。
其中包括Azure Machine Learning Workbench工具,微软称这是一个跨平台客户端,用于数据清洗和实验管理;以及Azure Machine Learning Experimentation服务和Azure Machine Learning Model Management服务。
Azure Machine Learning Workbench将对现有的微软Azure Machine Learning Studio工具进行补充,微软方面这样表示。Workbench支持在Python、PySpark和Scala中的建模,集成了Visual Studio Code和PyCharm。
在数据清洗方面,微软正在将微软Research PROSE(Program Synthesis Using Examples)研究团队做的一些工作进行商业化。微软方面证实说,Workbench中提供的数据清洗功能中,包含了一款代号为“Pendleton”的数据清洗工具。
微软私下测试Pendleton已经有一年多的时间了,这款工具面向那些为数据准备和数据清洗做设计的数据科学家。该工具可以做删除错误列,更改列中格式,处理丢失数据等。此外,还包含了一些分析工具,可以帮助数据科学家找出数据集中都包含什么。Pendleton可以读取来自SQL Server、Azure Blobs以及Data Lakes的数据,还可以读取来自本地PC文件的内容。
除了帮助清洗数据之外,微软还将提供一个将Visual Studio Cade与微软AI服务集成的扩展。有了这个Visual Studio Code for AI扩展,微软希望能够让开发者构建使用微软Cognitive Toolkit、Google TensorFlow、Theano、Keras、Chainer以及Caffe2的模型。
相信微软将继续致力于面向机器学习开发出一个完整的、类似Visual Studio的套件,也就是内部被称为的“Open Mind”。我相信未来这个新的ML Workbench将成为该套件的一部分,但目前,微软方面还没有正式的公布。
好文章,需要你的鼓励
Panzura在其Symphony数据管理平台中新增了访问控制列表分析和自动修复功能。该平台专门处理EB级非结构化数据集,具备扫描、分层、迁移和合规分析等功能。Panzura声称58%的企业受到权限扩散问题影响,74%的数据泄露涉及特权凭证滥用。新版本重点解决权限继承中断、过度授权访问和合规盲点等问题,提供完整的文件系统权限可视性和快速问题解决能力。
沙特TachyHealth团队开发的32亿参数医疗AI模型Gazal-R1,通过创新的双阶段训练方法在医疗推理任务上超越了12倍大的模型,在MedQA等测试中取得87.1%的优异成绩,展现了精巧训练策略胜过规模扩张的重要启示,为资源有限的医疗AI研究提供了新路径。
Arista Networks宣布收购博通旗下VeloCloud SD-WAN业务,交易金额约10亿美元。VeloCloud是SD-WAN领域先驱企业,拥有集成安全功能的云管理SD-WAN解决方案。此次收购填补了Arista在分支机构连接方面的空白,使其能够提供端到端网络解决方案。同时,前思科高管Todd Nightingale加入担任总裁兼首席运营官,将助力公司拓展更广泛的客户群体。
奥地利维也纳医科大学研究团队开发了RetFiner技术,通过让眼科AI模型同时学习OCT图像和医疗文字描述,显著提升了诊断准确率。该方法采用四种训练任务让AI模型建立图像与文字的深层联系,在三个主流眼科AI模型上实现了2-6个百分点的性能提升,为医学AI发展开辟了新方向。