至顶网软件与服务频道消息:当前,数据经济蓬勃发展,各行各业在积极拥抱数字化转型。而数字化转型的一个关键特质就是实现数据驱动,面对滚滚而来的数据洪流,企业如何实现从数据中兑现价值成为关键。数据蕴含着巨大生产力,掌握数据就掌握了发展的资源和主动权。而大数据技术成为传统行业转型升级的新动能。
中科天玑数据科技股份有限公司(以下简称“中科天玑”)首席技术官余智华告诉记者,大数据产业经过这么多年的发展,虽然热度没有前几年那么火了,但是这也代表了大数据技术已经进入常态化成熟期,浸透到各个行业中,成为企业数字化基础设施的必备选项。
同时,大数据也从基础平台层开始向应用和分析层发展,也就是大数据技术与人工智能开始更多融合。大数据的价值需要依靠数据挖掘、人工智能算法等技术的加持,提炼出有效的模型,才能落地成实际的应用。
余智华说,中科天玑以大数据计算引擎、人工智能算法为核心,围绕大数据平台、自然语言处理、机器学习、知识图谱、人工智能等方面进行不断拓展。“大数据的发展应该强化应用导向,加速各个行业领域模型的构建。中科天玑为此推出了人工智能模型工厂,降低算法模型开发门槛。”
现在各种新技术不断涌现,比如5G和AI等,这也对大数据产业产生了影响。余智华以5G为例介绍说,5G的特点是高速率、大容量、低延时高可靠等。所以,5G的发展丰富了数据来源,以前受制于传输和感知层面,有些应用场景的数据来源收到制约。现在5G增加了数据规模,同时在数据类型方面也得到了丰富,比如音视频。5G让大数据能够实施交互,应用场景也得到了延展,比如远程医疗。
对于AI,其实与大数据是不分家的。余智华表示,企业大数据经过这些年的发展,已经实现了从无到有。下一步要解决数据价值的问题,AI是必不可少的。AI算法和模型与大数据结合能够加速数据价值的实现。但是AI算法和模型门槛比较高,中科天玑将智能模型和算法易用化,实现快速交付和AI大规模应用。
在大数据产业迭代的同时,客户对于大数据的需求也在发生变化。中科天玑一直深耕大数据产业,对于客户需求的变化也深有体会。余智华说,第一,多元融合需求。因为现在数据越来越多元化,企业需要从以前的单一维度向多维度解决数据治理和融合分析问题。第二,智能算法模型需求,数据有了,如何依靠算法模型实现数据价值成为当前要解决的首要需求。第三,企业技术能力越来越高,对大数据分析的速度期望越来越高。以前数据更多是离线分析,现在是在线分析。比如TB级规模的数据处理要求毫秒级实现。
很显然这些新的需求对于相应的大数据厂商提出了更高的要求,中科天玑也在不断进行技术更新来满足客户的需求,为用户提供大数据整体解决方案,助力中国大数据产业创新发展。
面对产业变化和客户需求,中科天玑自身也在不断创新技术和产品交付,帮助客户解决数据挑战。例如现在容器技术非常流行,可以实现应用快速交付。中科天玑也推出了基于容器云的大数据管理平台,帮助企业、组织或个人简化大数据系统的构建,降低大数据系统的部署、维护和使用门槛,准确对接业务逻辑、提高数据分析、挖掘和预测过程的效率。
余智华表示,大数据应用与产业不断渗透融合,需要新的技术和手段来应对。中科天玑全面支撑从单独产品研发应用到行业解决方案定制,再到行业整体生态布局的全产业链战略布局。
在基础设施平台层面,为了响应大数据与AI的融合趋势,中科天玑强化推出了数据大脑,把共性技术整合成技术平台,从平台数据存储到治理到算法模型,打造云、大数据、智能服务的融合共性平台,支撑企业级大数据智能应用。
在应用层面,面向网信、情报、金融、教育等应用领域,中科天玑强化舆情类、情报方面的布局。比如人机协同智能情报分析引擎(GoIN),其通过对覆盖政治、军事、经济、社会等方面的大数据关联融合,构建贴近业务场景的分析挖掘、预测研判和智能生成系列工具,形成一套人脑决策和计算机智能共生的大数据分析环境及工具系统,辅助用户从大数据中萃取重大战略情报,并进一步转化为可操作的决策指挥能力。
余智华说,中科天玑打造全线产品体系技术平台,依靠核心产品实现行业纵深发展。顺应国家自主可控的大战略,中科天玑聚焦优势行业,参与行业标准制定,强化对行业需求的理解。“在深入行业中,中科天玑会与众多合作伙伴一起赋能客户大数据创新。比如与集成商一起打造行业解决方案。并通过投资手段实现垂直领域发展,与具有技术互补的厂商开展更多联合创新。”
好文章,需要你的鼓励
这项研究由德累斯顿工业大学等机构的研究团队完成,旨在解决主动学习未被广泛应用的问题。研究者构建了包含460万种超参数组合的实验网格,系统分析了各参数对主动学习性能的影响。研究发现,不同策略实现间存在显著差异,基于边缘的不确定性策略整体表现最佳,随机选择约4000个超参数组合即可获得可靠结果。这些发现为设计可重现、可信赖的主动学习实验提供了明确指导,有助于降低入门门槛,促进技术在实际应用中的普及。
这项由英国爱丁堡大学和上海人工智能实验室研究者共同完成的工作提出了LongBioBench,一种用于评估长文本语言模型的新型基准测试框架。通过使用人工生成的虚构人物传记作为测试环境,该框架在保持可控性的同时,提供了更真实的评估场景。研究对18个长文本模型的测试表明,即使最先进的模型在检索、推理和可信任性方面仍存在显著挑战,特别是上下文长度增加时。研究还揭示了现有合成基准测试的设计缺陷和长上下文预训练的局限性,为未来模型开发提供了重要指导。
SuperWriter是一项来自新加坡科技设计大学和清华大学的突破性研究,通过模仿人类"先思考后写作"的过程,彻底改良了AI长文生成能力。该研究团队开发的框架包含三个关键阶段:规划、写作和修改,使AI能像专业作家一样进行结构化思考。实验结果表明,经过训练的SuperWriter-LM模型不仅超越同等规模的所有AI模型,甚至在某些领域表现优于规模更大的顶级模型,为AI辅助写作开创了新的可能性。
香港大学与阿里巴巴达摩院合作开发的LayerFlow是一种突破性的层级视频生成技术,能同时生成透明前景、完整背景和混合场景视频。该技术通过创新的框架设计将不同视频层级作为子片段连接,并引入层级嵌入使模型区分各层级。面对高质量训练数据稀缺的挑战,研究团队设计了三阶段训练策略,结合Motion LoRA和Content LoRA,实现了图像和视频数据的联合训练。LayerFlow不仅支持多层视频生成,还能实现视频分解和条件层生成,为视频创作领域带来革命性变革。