ZD至顶网软件频道消息 (文/张晓楠):从“电子商务”到“智慧地球”再到如今的认知商业,IBM从来不会只是枯燥的去讲一个概念。在电子商务概念推出的那段时间内,还记得IBM策划的一系列精彩、令人捧腹又意义深远的广告吗?比如《天山雪莲篇》里要把生意做到广州去的“买买提”?在如今认知商业时代,IBM也不会让概念悬在空中不去落地,相反,越有“泥土气”越好。于是乎在认知商业战略发布会上,IBM会请财经大咖吴晓波为IBM站台,会请讲段子特别精彩的辉瑞中国医学部副总裁谷成明博士谈药企转型。
而对于IBM大数据与分析业务来说,其也是凸显IBM认知商业策略的关键和核心,只不过这些能力与认知商业的关联,可能会通过每个人手机上的天气APP体现,可能会通过业务员在Watson Analytics中键入的一句查询语句体现。IBM大数据与分析业务的目标,是把大数据和分析能力带给每个最终用户,并通过每一个人,把认知商业的精髓发扬光大。
如果不是IBM大中华区大数据与分析事业部平台商务与业务合作业务总监钟泽敏提醒,我们不会发现自己的苹果手机上天天在用的天气预报APP,是IBM不久前收购的一家天气应用公司:The Weather Company的产品。藉由这样一个2C应用,IBM让千千万万苹果手机用户在切身了解IBM的大数据和分析业务在做什么。
IBM大中华区大数据与分析事业部平台商务与业务合作业务总监钟泽敏
如果你认为The Weather Company只提供2C服务,未免太狭隘了,这也就失去了IBM收购这家公司的意义。相反,The Weather Company有着一堆听起来有趣儿而用起来实在2B服务。对此钟泽敏认为The Weather Company会影响世界上每一家公司。比如保险公司如果能够准确知道什么时候下冰雹,一年可以省下十亿赔偿;比如零售店如果知道气温降到某个温度人们就不出门消费,也可以节约营销推广成本。
IBM在去年10月份收购The Weather Company后,不仅仅“接手”其全球12.7万个气象站数据和遍布全世界的几千万个通过手机获取的天气数据(当然是在用户同意前提下),更重要的在于,借助于IBM已有的大数据和分析能力,开发出更多2B业务。比如一个叫做Pilotbrief的APP供飞行员了解航线天气,如果结合天气数据和飞行历史数据的分析,还可以躲避气流,为航空公司节省高昂成本。
这类应用会借助于传感器收集数据,比如IBM就把飞机上部署传感器,来搜集天气、空气质量等等资料。类似应用还能帮助用户极大节约成本,还记得此前记者采访南车四方的时候获悉,过去每维修一列列车,所有零件都需要进行更换,因为没有人知道每一个零件用了多久,是否到了更换的时候,换下来的库存零件的价值已经累计达到20多亿人民币。而有了对关键零部件的大数据记录和维修计划管理体系,零部件从出厂到淘汰都可以进行档案追踪和管理。在IBM的项目实施中,从2013年3月开始,南车四方部分车型已经建立ERP平台上的大数据分析,实现关键零部件的全生命周期管理。
在IBM认知商业的落地上,IBM的大数据和分析能力让其业务触角得以深入到每个人、每家公司,但是这其中的重要支持,也有赖于云计算的发展和推波助澜。为什么IBM对自己的大数据和分析能力这么有自信?也在于他能够把大数据与云计算真正结合在一起,IBM称其为云数据服务超市,这个说法特别形象:把大数据和分析能力通过云端提供给使用者,而且可以让使用者自由选择、灵活搭配、按需付费。
在IBM大中华区大数据与分析平台技术总监刘胜利看来, 如果从数据角度看云计算的IaaS、PaaS和SaaS三种模式,可能IaaS层面很容易实现,但是PaaS和SaaS层面就比较难了。而对于IBM来说,其所能提供的DBaaS(Database as a Service)服务,更不是谁都敢染指的。
IBM大中华区大数据与分析平台技术总监刘胜利
想象这样一个场景,如果某家保险公司或者银行需要人脸识别服务的话,如果有一个SaaS软件直接就能拿来用,是不是特别酷?其实在IBM的Watson环境下,这样的SaaS模式IBM已经能够提供了。
如果提大数据和云计算的融合,大数据领域的开源趋势不容小觑,但是开源无疑会让大数据平台越来越复杂,这种复杂度甚至会给企业运维带来巨大压力。对于银行、电信等传统厂商来说,自身技术体系本来比较成熟,加入开源技术后运维压力陡然增大,不同产品之间不匹配怎么办?Hadoop和Spark不兼容也很令人崩溃。
IBM会用云技术来解决这些问题,从IaaS层到PaaS层,把大数据和分析核心功能快速组装成云端应用,不需要用户再花费人力物力去运维复杂的IT系统。
有了这套解决方案,用户基于开源构造的大数据和分析能力就能够逐渐实现云化了,当然有的数据太关键根本不会放在云上,而有的数据原生就可以在云上。
对于原生就在云上的大数据和分析产品,可以关注IBM在中国正式发布的Watson Analytics,Watson Analytics在全球已经有上百万用户,在中国发布的很短时间内已经拥有将近2万注册用户。据IBM大数据与分析事业部、分析工具产品线大中华区主管洪建勋介绍,这款一出娘胎就是云端服务的产品,具备自然语言认知查询、预测性分析以及可视化分析能力。你只要把想了解的问题用自然语言输入,就能获得答案。答案得出的逻辑、甚至你要的答案究竟是什么,可能你自己都不知道。 Watson Analytics可以采纳各种各样的数据源,不用管数据结构和方式,这样的一款产品最适合业务人员使用,它帮助你探索数据背后的价值,还能做出预测。在记者看来这款产品最大价值在于让普通人也能拥有数据分析能力,过去这种能力可是只有数据分析师或者IT技术人员才有。
IBM大数据与分析事业部、分析工具产品线大中华区主管洪建勋
值得关注的是,Watson Analytics是免费的,而如果有人觉得免费版本不够用,还有一款IBM传统产品可供使用,那就是SPSS for Machine Learning。对于这款工具,一方面IBM会继续发展算法;另一方面随着开源的演进,已经可以支持Hadoop、Spark;另外更重要的一点在于,SPSS for Machine Learning也会在云端实现,让大家可以深度体验认知技术。
这篇文章展现了IBM大数据及分析业务开年的几板斧,更进一步的消化、吸收,还需要假以时日。在IBM认知商业转型战略中,只有深入了解各业务线的想法和做法,才是真正的剥丝抽茧。
好文章,需要你的鼓励
这项研究由德累斯顿工业大学等机构的研究团队完成,旨在解决主动学习未被广泛应用的问题。研究者构建了包含460万种超参数组合的实验网格,系统分析了各参数对主动学习性能的影响。研究发现,不同策略实现间存在显著差异,基于边缘的不确定性策略整体表现最佳,随机选择约4000个超参数组合即可获得可靠结果。这些发现为设计可重现、可信赖的主动学习实验提供了明确指导,有助于降低入门门槛,促进技术在实际应用中的普及。
这项由英国爱丁堡大学和上海人工智能实验室研究者共同完成的工作提出了LongBioBench,一种用于评估长文本语言模型的新型基准测试框架。通过使用人工生成的虚构人物传记作为测试环境,该框架在保持可控性的同时,提供了更真实的评估场景。研究对18个长文本模型的测试表明,即使最先进的模型在检索、推理和可信任性方面仍存在显著挑战,特别是上下文长度增加时。研究还揭示了现有合成基准测试的设计缺陷和长上下文预训练的局限性,为未来模型开发提供了重要指导。
SuperWriter是一项来自新加坡科技设计大学和清华大学的突破性研究,通过模仿人类"先思考后写作"的过程,彻底改良了AI长文生成能力。该研究团队开发的框架包含三个关键阶段:规划、写作和修改,使AI能像专业作家一样进行结构化思考。实验结果表明,经过训练的SuperWriter-LM模型不仅超越同等规模的所有AI模型,甚至在某些领域表现优于规模更大的顶级模型,为AI辅助写作开创了新的可能性。
香港大学与阿里巴巴达摩院合作开发的LayerFlow是一种突破性的层级视频生成技术,能同时生成透明前景、完整背景和混合场景视频。该技术通过创新的框架设计将不同视频层级作为子片段连接,并引入层级嵌入使模型区分各层级。面对高质量训练数据稀缺的挑战,研究团队设计了三阶段训练策略,结合Motion LoRA和Content LoRA,实现了图像和视频数据的联合训练。LayerFlow不仅支持多层视频生成,还能实现视频分解和条件层生成,为视频创作领域带来革命性变革。