11月28日,阿里云正式开源机器学习平台Alink,这也是全球首个批流一体的算法平台,旨在降低算法开发门槛,帮助开发者掌握机器学习的生命全周期。
Flink Forward 2019在京举办,吸引众多开发者参与
Alink基于实时计算引擎Flink,提供丰富的算法组件库和便捷的操作框架,开发者可以一键搭建覆盖数据处理、特征工程、模型训练、模型预测的算法模型开发全流程。作为业界首个同时支持批式算法、流式算法的机器学习平台,Alink提供了Python 接口,开发者无需Flink技术背景也可以轻松构建算法模型。
据悉,Alink已被广泛运用在阿里巴巴搜索、推荐、广告等多个核心实时在线业务中。在刚刚落幕的天猫双11中,单日数据处理量达到970PB,每秒处理峰值数据多达25亿条。Alink成功经受住了超大规模实时数据训练的检验,并帮助提升4% CTR(商品点击转化率)。
在Flink Forward 2019大会上,阿里云智能总裁张建锋表示:“大量业务从批处理转变为流处理,实时化是数据处理的真正未来。”自2019年1月起,阿里巴巴将内部维护的Blink全部回馈给Flink开源社区,目前贡献代码数量已超过100万行。此次自主开源的Alink与Flink 相辅相成,将成为开发者的左膀右臂,发挥数据智能在数字经济中的巨大能量。
从拥抱开源、贡献开源、自主开源升级为持续赋能开源,开源已经升级为阿里技术战略之一。目前阿里自主开源项目数已有一千余个,GitHub star数量超过66w,覆盖AI、大数据、中间件、移动、数据库等多个领域。阿里已成为开源贡献最大的科技公司之一。
好文章,需要你的鼓励
构建云边端协同的多元化算力体系已成为企业实现大模型规模化落地的关键路径,Arm正助力从云到端的大模型部署与高效运行,满足企业对更高性能、更高能效以及更强本地处理能力的迫切需求。
尽管市场上频繁出现所谓的自主代理 AI,但目前尚无统一定义,多数产品不过是 LLM 的简单包装,这让 CIO 在采购时面临风险与困惑。
最新研究发现,AI生成的代码常错误引用虚构依赖库,为供应链攻击提供契机,可能导致数据泄露、植入后门等恶意行为,严重威胁系统安全。
本文讨论了 IT 自动化过程中容易忽视的流程问题、数据质量、整合难题、成本误区以及 AI 融入后带来的监管与创新挑战。