至顶网软件与服务频道消息: 谷歌今天宣布将把用于训练机器学习算法的Cloud AutoML服务引入数据科学家在线社区Kaggle。
Cloud AutoML是基于云的工具包,提供用于训练人工智能模型的拖拽界面。用户使用该软件可以创建自定义的机器学习模型,而无需对该主题有任何特定的技术知识。
Kaggle在线社区为数据科学家和其他机器学习爱好者提供了一个探索、分析和共享他们工作成果的空间。谷歌于2017年收购了Kaggle平台,该社区最近成员规模突破了350万这一里程碑。
谷歌表示,它正在通过将Cloud AutoML与Kaggle集成实现自己的使命,即“通过为他们提供引领该领域所需的技能和工具,使我们的数据科学家社区变得更加强大”。
Cloud AutoML允许用户从软件开发工具包或者基于Web的用户界面中提取数据,设置参数,然后基于这些数据训练模型,并将其部署在谷歌的云基础设施中。这项集成将使Kaggle用户能够利用Jupyter Notebook中的Cloud AutoML SDK,Jupyter Notebook是一个开源应用,数据科学家可以用来创建和共享包含实时代码、等式、可视化和叙述性文档。
Kaggle产品经理Devvret Rishi在博客中表示:“今天的发布重点是让我们的社区能够在Kaggle Notebooks中直接使用这个SDK。”
Cloud AutoML是一项付费服务,不过为初学者提供了免费套餐。谷歌全年向用户提供Google Cloud Platform积分,以补贴搭配Kaggle一起使用AutoML的成本。
宣布此消息之前,Kaggle与谷歌的BigQuery数据仓库服务进行了类似的集成。
好文章,需要你的鼓励
苏州大学研究团队提出"语境降噪训练"新方法,通过"综合梯度分数"识别长文本中的关键信息,在训练时强化重要内容、抑制干扰噪音。该技术让80亿参数的开源模型在长文本任务上达到GPT-4o水平,训练效率比传统方法高出40多倍。研究解决了AI处理长文档时容易被无关信息干扰的核心问题,为文档分析、法律研究等应用提供重要突破。
在Cloudera的“价值观”中,企业智能化的根基可以被概括为两个字:“源”与“治”——让数据有源,智能可治。
清华大学团队首次揭示了困扰AI训练领域超过两年的"幽灵故障"根本原因:Flash Attention在BF16精度下训练时会因数字舍入偏差与低秩矩阵结构的交互作用导致训练崩溃。研究团队通过深入分析发现问题源于注意力权重为1时的系统性舍入误差累积,并提出了动态最大值调整的解决方案,成功稳定了训练过程。这项研究不仅解决了实际工程问题,更为分析类似数值稳定性挑战提供了重要方法论。