11月28日,阿里云正式开源机器学习平台Alink,这也是全球首个批流一体的算法平台,旨在降低算法开发门槛,帮助开发者掌握机器学习的生命全周期。
Flink Forward 2019在京举办,吸引众多开发者参与
Alink基于实时计算引擎Flink,提供丰富的算法组件库和便捷的操作框架,开发者可以一键搭建覆盖数据处理、特征工程、模型训练、模型预测的算法模型开发全流程。作为业界首个同时支持批式算法、流式算法的机器学习平台,Alink提供了Python 接口,开发者无需Flink技术背景也可以轻松构建算法模型。
据悉,Alink已被广泛运用在阿里巴巴搜索、推荐、广告等多个核心实时在线业务中。在刚刚落幕的天猫双11中,单日数据处理量达到970PB,每秒处理峰值数据多达25亿条。Alink成功经受住了超大规模实时数据训练的检验,并帮助提升4% CTR(商品点击转化率)。
在Flink Forward 2019大会上,阿里云智能总裁张建锋表示:“大量业务从批处理转变为流处理,实时化是数据处理的真正未来。”自2019年1月起,阿里巴巴将内部维护的Blink全部回馈给Flink开源社区,目前贡献代码数量已超过100万行。此次自主开源的Alink与Flink 相辅相成,将成为开发者的左膀右臂,发挥数据智能在数字经济中的巨大能量。
从拥抱开源、贡献开源、自主开源升级为持续赋能开源,开源已经升级为阿里技术战略之一。目前阿里自主开源项目数已有一千余个,GitHub star数量超过66w,覆盖AI、大数据、中间件、移动、数据库等多个领域。阿里已成为开源贡献最大的科技公司之一。
好文章,需要你的鼓励
多伦多大学研究团队提出Squeeze3D压缩框架,巧妙利用3D生成模型的隐含压缩能力,通过训练映射网络桥接编码器与生成器的潜在空间,实现了极致的3D数据压缩。该技术对纹理网格、点云和辐射场分别达到2187倍、55倍和619倍的压缩比,同时保持高视觉质量,且无需针对特定对象训练网络,为3D内容传输和存储提供了革命性解决方案。
浙江大学与腾讯联合研究团队提出MoA异构适配器混合方法,通过整合不同类型的参数高效微调技术,解决了传统同质化专家混合方法中的表征坍塌和负载不均衡问题。该方法在数学和常识推理任务上显著优于现有方法,同时大幅降低训练参数和计算成本,为大模型高效微调提供了新的技术路径。
耶鲁、哥大等四校联合研发的RKEFino1模型,通过在Fino1基础上注入XBRL、CDM、MOF三大监管框架知识,显著提升了AI在数字监管报告任务中的表现。该模型在知识问答准确率提升超过一倍,数学推理能力从56.87%提升至70.69%,并在新颖的数值实体识别任务中展现良好潜力,为金融AI合规应用开辟新路径。
加州大学圣巴巴拉分校研究团队开发出能够自我进化的AI智能体,通过《卡坦岛拓荒者》桌游测试,这些AI能在游戏过程中自主修改策略和代码。实验显示,具备自我进化能力的AI显著超越静态版本,其中Claude 3.7模型性能提升达95%。研究验证了AI从被动工具向主动伙伴转变的可能性,为复杂决策场景中的AI应用开辟新路径。