在进入大数据时代的今天,数据对企业而言具有了越来越丰富的内涵:一方面,越来越多的企业依靠对数据的不断探索和深入挖掘赢得了竞争优势;另一方面,一些新的商业模式依靠对数据的深入挖掘而诞生,数据已经成为企业是一种新的“能源”,并成为企业正在进行的数字化转型的基石和助推剂。很显然,企业对数据价值的追求已经成为了数字经济发展的一股强大动力。与此同时,随着企业对数据利用不断走向深入,对相关的技术和解决方案也提出很高的要求。

全生命周期的数据服务
数据从其产生到采集、传输、存储到分析和展现涉及到很多技术和多个环节,任何一个环节处理不好都会影响数据价值的最终体现。
比如,在数据的采集上不仅会有实时数据的采集也会有批量的数据采集;不仅有结构化数据的采集还有非结构化数据的采集。而且,对于大多数企业而言其数据的来源往往都是多源的,比如销售可能是多渠道的,有线上和也有线下,线上又有社交渠道还有传统电商;数据不仅来自企业内部也可能来自外网(如社交媒体)等,这就要求解决方案能支持各种数据源、各种数据类型。
数据采集后在进入数据库、数据仓库或者数据湖进行存储之前,需要进行数据的清洗和整合,以确保后期数据分析的准确性。因为由于设备和传输以及人为方面的原因,数据采集过程中可能会有错误数据混入。
在存储环节,不仅在存储空间上要满足未来可能的扩展需求,还需要支持各种业务使用需求,包括实时查询和批量处理。由于数据的用途不同,会使用到不同的存储技术,比如有的用传统关系型数据库,有的则用Hadoop等NoSQL数据库。
而在数据分析和展现上,需要数据建模和各种数据挖掘工具,企业需要借助这些工具,最后才能形成各种分析结果,如用户画像、营销策略分析、风险和故障预警等,为企业业务运营提供支持。
另外,这几年技术进步的脚本明显加快。以基础架构为例,英特尔一直在持续更新至强® 可扩展平台,处理器不仅在性能上不断提升,让用户很方便地获得性能强劲、简单易用的云化基础设施,同时,还通过融合自动化和智能化管理特性,确保云的弹性扩展、稳定可靠和降本增效。尤为值得一提的是,至强可扩展处理器还特别为数据的分析和处理进行了优化。另外,在存储、网络等相关产品上也在持续升级,特别是英特尔傲腾™持久内存的推出,可以大幅提升应用程序效率,显著改善用户体验。是否能紧跟技术发展的脚步,充分享受技术红利也非常考虑厂商的技术实力。
正是由于涉及太多技术,因此对厂商的解决方案能力提出了很高要求,不仅有广度还有深度,因此,很长时间以来,市场上能提供全功能的数据服务解决方案的企业并不多。中科曙光是其中之一。实际上,由于中科曙光软硬一体化的能力、多年来在数据领域的技术积累以及方案的完整性,中科曙光的数据工程服务解决方案得到了市场的广泛认可和使用。
全流程的曙光数据工程服务解决方案
中科曙光数据工程服务解决方案主要围绕用户数据提供专业全流程数据服务,帮助用户完成数据采集、数据规范、数据智能分析,生成数据资源目录、构建知识图谱,设计可视化主题,支撑业务应用,发挥数据价值,展示数据魅力。

中科曙光数据工程服务解决方案整体架构
数据源: 能够适配用户各类结构化、半结构化、非结构化以及第三方系统等各类异构数据源,根据应用需求定制实现数据汇聚采集。
数据综合治理:针对用户数据特性及行业数据应用要求,提供专业的数据采集和治理服务;智能感知数据类型,实现对多源异构数据的自动采集,统一规范,提升数据质量;为数据智能应用夯实基础。
数据智能分析: 基于曙光大数据先进技术和应用经验,针对用户智能分析应用要求提供数据智能工程服务,帮助用户构建各类专题数据集、生成数据资源目录、打造行业知识图谱、训练专业机器学习及人工智能模型;为用户业务应用提供数据价值支撑。
数据共享交换: 根据用户数据使用特性及安全要求,构建共享转换服务,实现共享前天下保障数据安全,真正帮助用户发挥数据价值。
数据价值服务: 为用户量身打造大数据应用服务,包括:数据资源目录、知识图谱、行业智库、数据共享、数据可视化、数据查询等。
行业数据标准: 结合数据综合治理过程中发现的数据质量问题、积累的数据处理规范,为用户制定行业数据标准规范,为数据质量管理提供指导依据。
中科曙光数据工程服务解决方案具有三大特点:
1. 专业定制:专家团队针对用户需求场景、数据特性量身打造数据工程服务方案,提供专业定州服务,满足用户所需。
2. 灵活交付:服务方案、业务咨询、服务定制、数据标准、算法模型、业务系统。
3. 平台兼容:兼容主流厂商大数据平台产品开展数据定制服务,无需重建大数据平台,节约成本。众多周知,x86平台强大的生态孕育了各种主流大数据平台和丰富的工具、应用软件。而且,近几年英特尔在至强可扩展处理器及配套软件上面向大数据做出大量的优化,进一步加速了大数据平台的普及,也丰富了用户的选择。面对丰富的选择,中科曙光的平台兼容能力无疑为用户解除了后顾之忧。
“1+4+N”大数据布局为数字经济加油
中科曙光数据工程服务解决方案只是中科曙光完整数据能力的一个体现。这些年,“数据”成为中科曙光市场战略中的关键词,围绕数据中科曙光做出了全面的规划,提出了“1+4+N”的大数据布局。
“1+4+N”大数据布局中的“1”是指一体化智能大数据平台。它是中科曙光整个大数据解决方案的底座,能提供从数据的采集、治理到数据的存储、计算,以及贯穿数据整个生命周期中的安全、标准、运维等能力,用以支撑上层应用来满足智能分析、数据可视化等各种不同的数据服务需求。中科曙光数据工程服务解决方案也正是基于这个平台产生。
“4”是指中科曙光大数据拥有的“敏捷、智能、融合、安全”四大核心能力,这是中科曙光进军大数据市场的核心竞争力。
“N”表示联合生态伙伴构建N个行业解决方案,服务百城百行,推动客户数字化转型升级。这是中科曙光大数据解决方案走向百行百业的桥梁。
值得一提的是,在大数据市场中科曙光软硬一体化能力发挥了关键作用,并成为中科曙光一个独特优势。众所周知,中科曙光在服务器领域多年的技术积累,这种能力使得其能够通过软硬件的深度融合,在数据处理过程将硬件性能发挥到极致,为数据的处理和使用带来非常积极的帮助,助力客户早日迈向大数据时代。
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。