至顶网软件与服务频道消息: Oracle今天发布了一款基于云的数据科学平台,新平台为企业提供了一个用于分析和人工智能项目的工具包。
Oracle首席执行官Safra Catz在伦敦举行的一个大会上公布了这个云数据科学平台,其中包含七个不同的服务和功能集,该套件的核心是Cloud Infrastructure Data Science虚拟工作台,它让工程师可以借助自动执行部分工作流程自动化的人工智能来构建机器学习模型。
自动化的工作环境
Cloud Infrastructure Data Science平台的首要任务是为不同项目选择合适的机器学习模型,它采用了多种算法,并且每种算法有多种配置,然后运行测试以找到最合适的算法。此外该平台还可以实现“特征工程”自动化,以确定AI在做决策时最应该考虑哪些数据点。
随附的模型评估工具让工程师能够检查神经网络是否符合预期。据Oracle称,该工具可以生成可视化效果,显示模型处理数据的效果。工程师还可以跟踪生产中的各项性能的变化,以发现预期外的波动。
Oracle数据和AI服务部门产品开发负责人Greg Pavlik表示,开发工作流的自动化是Oracle为该解决方案设定的两个主要优先之一,另一个是“提供强大的团队支持以实现协作,确保数据科学项目为企业带来真正的价值”。
为此,Oracle为该解决方案配备了很多协作功能,其中有一个仪表板可以显示模型在评估决策是每个数据点的权重是多少,这有助于工程师为利益相关者说明软件的透明度。此外还包括:一个目录,让团队成员可以通过该目录交换模型;共享的项目文件夹和安全控件,管理内容访问权限。
更丰富的AI功能
Cloud Data Science Platform还配置了其他几个组件,其中包括针对Oracle旗舰产品Autonomous Database的一组AI功能。
这个名为OML4Py的功能让企业可以在系统上直接运行机器学习模型,因此企业就可以在本地处理数据,而不必将数据迁移到单独的、专用的AI环境中。这可以节省带宽和管理员的时间。另一个名为OML4Py AutoML的功能可以针对企业正在处理的特定信息推荐最佳AI模型。
AI在Oracle产品路线图中扮演着越来越重要的战略角色。Oracle已经为Autonomous Database配备了AI功能来实现日常管理的自动化,这增加该系统对客户的吸引力,特别是当Oracle正面临着来自其他云计算厂商日益激烈的竞争。
今天Oracle还宣布推出了几项新的分析服务,其中包括:Data Flow,Spark的托管版本;Big Data Service,以云的方式实施Cloudera Hadoop;Cloud SQL服务,让分析师可以一次跨多个记录系统进行查询。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。