ZDNet至顶网软件频道消息: IBM公司7月8日宣布,基于2014年第一季度与教育部签订的备忘录,IBM与中国教育系统携手开展重要合作,以实际行动应对国内蓬勃涌现的大数据与分析人才需求。 在这项名为“IBM U-100”的合作计划中,IBM将向100所中国高校捐赠一系列价值1亿美元的大数据及分析软件,并提供专业知识,支持这100所中国高校培养下一代数据科学家。合作包括以下三个方面:在这100所高校设立大数据与分析技术中心;在其中30所高校开设本科和硕士课程;以及在5所大学设立“卓越中心”。针对当前中国市场急剧攀升的大数据与分析技能需求和人才缺口,U-100项目每年将会涵盖4万名学生,帮助他们获得大数据与分析的专业知识。
据悉,IBM还与慧科教育旗下的开课吧(kaikeba.com)签署协议,双方共同成立“IBM大数据与分析专区”,提供大型开放式网络课程(MOOCs),培养具备大数据技能和专业知识的新一代人才,因为大数据在未来数十年内将是一项始终稳踞创新前沿的强大技术。IBM大中华区董事长及首席执行总裁钱大群表示:“IBM很荣幸能够和中国的高校达成这项合作。通过这样的合作,我们可以加速大数据与分析技能的人才培养,培养出能利用大数据与分析技术解决复杂社会问题的未来企业领导者,让他们有能力应对医疗卫生、交通运输和公共服务等各方面的挑战。”
赛迪顾问数据表明,中国的大数据技术与服务市场将继续增长,从2014年的143.1亿元增长到2016年的540.3亿元,年复合增长率将为99.7%。虽然许多中国的大企业已经认识到大数据在推动创新和提升竞争力方面的价值,但是市场仍然缺少技术熟练的专业人员来运用这些新技术来开展工作、维护基础设施。不仅如此,掌握必要技术能力的“数据科学家”更是少之又少。
把大数据与分析带进课堂
根据“IBM U-100”计划,IBM将设立大数据与分析技术中心,为大学教授和教职员工提供信息管理、数据挖掘、社交媒体分析和风险管理等课程培训。为加快项目发展,IBM还将提供基于IBM广泛分析软件的实操培训、案例研究,并且聘请IBM专家担任客座讲师,设立学者奖。
目前,IBM已与7所大学达成合作,包括北京理工大学、复旦大学、贵州大学、华中科技大学、北京大学、华南理工大学及西安交通大学,作为试点高校,这7所高校将于新学年在其教育体系中推出大数据与分析的新课程。到今年年底,IBM计划再与40所大学达成合作。本月末,IBM将向所有符合条件要求的学术机构发出“申请指南”。到2015年年中,“IBM U-100”计划将涵盖100所院校,届时每年将有4万名学生学习大数据与分析技能。同时,IBM将选出30所院校来共同开设新的本科和硕士学位课程,其教学内容将针对业内人才需求较大的数据科学家与首席数据官岗位来进行设计。由于分析技术现在已经超出计算机科学的范畴,成为了许多企业和职能部门必不可少的一种能力,IBM在协助高校设计课程时将重点围绕如何运用分析技能来解决五个业务领域中的问题和挑战,如财务、风险管理以及营销领域等。这些课程将由大学教授、IBM研究人员、工程师与IBM全球企业咨询服务顾问来讲授, 预计每年将培养出1500名掌握高级大数据与分析技术的学生。
将在5所大学设立分析卓越中心
在本次合作中,IBM还将帮助五所大学在它们各自的校内设立大数据与分析卓越中心,此类中心将作为“开放合作实验室”,让这些大学与IBM的商业伙伴及客户开展合作。通过这样一个实体地点,各方可以集中在高校进行交流,客户将能够运用先进的研发能力解决具体的业务问题。除了向这些卓越中心提供软件外,IBM还为参加该项目的高校提供针对研究协作的咨询支持。
2013年8月香港中文大学加入这项计划,并基于教育目的启动了营销工程实验室(MEL)。一百多名学生参与了这个实验室的零售业数据挖掘研究。目前,已经有数家公司从这个合作项目中获益。例如,有大约70名学生正在为香港四家主要的零售商和销售商进行数据挖掘。
随时随地开课:网络教育加快大数据与分析生态系统发展
作为IBM持续推进大数据与分析生态系统发展计划的一部分,IBM宣布与开课吧合作推出全新的网络教育产品,重点面向IT专业人员和学生,培养大数据与分析技术和技能。这些大型开放式网络课程将不断更新,使学员能够接触到最前沿的科技,获得最佳的用户体验,从而在就业或进入某个具体领域时增加竞争力。目前,所有课程均不收费。
开课吧创始人兼CEO方业昌表示:“我们很高兴能够与IBM合作,在中国大数据与分析行业的改革中走在前列。我们一起推动行业发展,解决当前面临的大数据与分析专业人才紧缺的问题。我们所开展大数据与分析教育质量过硬、收费合理、不受限制,让之前由于学费高昂、不符报名资格、时间不充足或者交通不便等因素而无法学习此技能学生和从业人员都能学习。”
IBM将利用其大数据与分析软件技术、商业洞察及IBM全球企业咨询服务部提供的实际项目管理技能为课程内容设计提供帮助。开课吧除了利用IBM的专家资源以外,还会向业内和高等教育方面的专家寻求意见,而不是仅仅依靠数量有限的教师资源来完成课程设计。
IBM全球副总裁兼IBM中国开发中心总经理王阳博士表示:“大型开放式网络课程能够大规模地促进行业共同发展大数据与分析新技能,这些课程正在快速地从小众形式发展成更主流的大众化教育,使全日制学生和从业人员都能够学习新技能,提升专业知识,并立即将所学到的运用到工作当中。”
好文章,需要你的鼓励
这项研究提出了ORV(占用中心机器人视频生成)框架,利用4D语义占用作为中间表示来生成高质量的机器人操作视频。与传统方法相比,ORV能提供更精确的语义和几何指导,实现更高的时间一致性和控制精度。该框架还支持多视角视频生成(ORV-MV)和模拟到真实的转换(ORV-S2R),有效弥合了虚拟与现实之间的差距。实验结果表明,ORV在多个数据集上的表现始终优于现有方法,为机器人学习和模拟提供了强大工具。
这项研究由Writer公司团队开发的"反思、重试、奖励"机制,通过强化学习教导大型语言模型生成更有效的自我反思内容。当模型回答错误时,它会生成反思并二次尝试,若成功则奖励反思过程。实验表明,该方法在函数调用和数学方程解题上带来显著提升,最高分别改善18.1%和34.7%。令人惊讶的是,经训练的小模型甚至超越了同家族10倍大的模型,且几乎不存在灾难性遗忘问题。这种自我改进技术为资源受限环境下的AI应用开辟了新方向。
FuseLIP是一项突破性研究,提出了通过早期融合离散标记实现多模态嵌入的新方法。与传统CLIP模型使用独立编码器不同,FuseLIP采用单一编码器同时处理图像和文本标记,实现了更自然的模态交互。研究证明,这种早期融合方法在多种多模态任务上表现优异,特别是在需要理解图像结构而非仅语义内容的任务上。研究还开发了创新的数据集和评估任务,为多模态嵌入研究提供了宝贵资源。
ByteDance与浙江大学合作开发的MERIT是首个专为多语言多条件语义检索设计的基准数据集,包含320,000条跨5种语言的查询和135,000个产品。研究发现现有模型在处理多条件查询时过度关注全局语义而忽略特定条件元素,为此提出CORAL框架,通过嵌入重建和对比学习相结合的方式,使检索性能提升45.9%。这项研究不仅识别了现有方法的关键局限性,还为多条件交错语义检索领域的未来研究奠定了基础。