对于工业而言,工业实时生产数据犹如企业的血液,更是数字经济时代的“新黄金”。如何保障血液畅通,如何挖掘数据价值,无疑已经成为流程工业和离散工业目前数字化转型的重中之重。对于以“为工业生产负责”为使命的国产实时数据库厂商庚顿数据而言,这是最好的机遇,也是最大的挑战。
2023年3月10日,国家数据局正式成立。作为中国工业实时数据采集、存储及可视化软件领域的开山鼻祖之一,庚顿数据陪跑流程工业信息化建设近20年,一路披荆斩棘,逢山开路,遇水架桥。因此,对总经理姚羽来说,这则消息给他的感受格外不同。
只争朝夕,突破“卡脖子”重围,开辟国产化之路
庚顿数据核心创业团队出身于上世纪九十年代的电力系统。1995年,山东省电科院启动中国第一个大型火电机组远程故障诊断分析系统项目,开始引入海外工业实时数据库软件。那是改革开放后的高速发展时期,电力需求一路高涨,刚和电网分家后的发电行业急剧扩张,燃煤发电厂的建设如雨后春笋,信息化建设如火如荼。作为信息化配套基础设施,以工业实时数据采集、存储、可视化为核心目标的工业实时数据库逐渐成为电力信息化的新生力量,海外品牌迅速占领市场。
实时数据是工业自动化专有名词,统一表示强实时属性工业系统、过程或行为随时间变化的数据。作为数据库系统发展的分支之一,实时数据库主要用于处理机器、设备、传感、系统产生的连续不断的,高频率更新变化的,打着时间戳标签的数据,并且这些数据在任何时间都需要在业务要求的时间窗口范围内及时处理完成的事务处理。因此,和其他通用数据库不同之处在于,实时数据库技术不止是数据库,而是工业技术、实时技术、数据库技术以及先进的IT技术深度融合的产物,是一套包括数据采集、数据存储、数据传输、数据计算、数据传输及数据可视化的工业数据管理系统,管理工业数据从产生到应用的全生命周期,是工业企业信息系统的工业数据管理底座,是工业数字化、信息化和智能化的核心基础软件。
实时数据库处理的数据完全不同于关系数据库里常见的人为表单创建的数据,工业实时数据源头主要涵盖生产设备、原材料、能源以及环境,尤其对于以设备密集、知识密集及强实时、高稳定、高安全著称的流程工业而言,数据测点多少则上万,多则几十上百万,数据量级大,数据精度高,数据传输速度快,数据存储效率高,数据应用实时性强,有的数据时间戳最高可到纳秒,数据采集速度最高可达微秒级,每一条数据都需要及时地被采集、存储、传输、查询、计算,用于生产实时监控以保证生产安全,或用于优化生产运营、提高设备利用率、降低能源消耗。
举例来说,一个600MW机组的燃煤发电厂一般配备锅炉、汽轮机、发电机等主辅机6kV、400V 50kW以上大型设备近150台套,大概拥有12000到20000个数据测点,这些测点每天持续生产温度、压力、声音、振动、转速等工业实时数据。假设一个测点每秒钟报告一次数据,一天就会产生86400条数据,一个火力发电厂每天就会产生近20亿条数据,这还仅仅只是一天的数据量,而能源电力这类流程性企业一旦投产,往往都是7×24小时×365天×3年以上的连续生产,这个数据量是极其庞大的,关键是还容不得一点问题存在,否则都是致命灾难,这就对工业实时数据库的高可靠、高性能等维度提出了极高的要求。
2000年,第一个国产实时数据库研发项目正式启动,比国外起步晚了20年,但幸运的是,21世纪初由于国家层面将实时数据库作为与操作系统同一级别的软件鼓励支持,同时赶上了中国流程工业声势浩大的信息化浪潮的推动,中国实时数据库产业得以快速高质量发展。2007年,庚顿数据正式成立,20年间步履不停,不断突破多项卡脖子重围。到2020年,以庚顿数据为代表的实时数据库厂商开启了以应用为核心的新一代实时数据库阶段(2020至今),该阶段由于数据规模爆炸增长、数据采集难度提高,工业企业深水区的数据应用进入全面数字化和智能化阶段,大型工业集团化应用日益增多,工业企业生产连续性、工业安全以及智能化应用需求不断提升,实时数据库技术路线呈现多样化和融合化发展。随着全球市场格局剧烈变革,工业数字化转型不断进入核心业务深水区,我国工业企业进入通过新型工业技术和数字化技术实现高质量和低碳化发展目标的发展新阶段,5G、云计算等新兴技术快速发展,智慧工厂建设需求迅速规模化,传统实时数据库的应用系统纷纷优化升级,我国实时数据库产业正在迎来重大发展机遇。
奇点已来,共赴山海,迈进智慧工厂时代
近年来,随着国家鼓励发展实时数据库等基础软件的鼓励以及数字化转型、双碳目标等国策的出台,国内实时数据库系统研究和应用不断深入,国产实时数据库软件取得长足进展,其功能和性能在电力、化工、冶金、烟草、军工、新能源等众多行业的重大项目中不断得到验证,逐步实现了对国外软件的赶超。
庚顿数据研发的新一代实时数据库管理系统创新融合了工业数据采集技术、中断触发技术、自动化控制技术、内存库技术、关系库技术、行列存储技术、多核并行技术、安全通信技术、高效实时检索技术等等,在国外垄断的核心技术领域突破了卡脖子重围,实现了完全的自主创新,通过用户共创,完成了大量实践和长期检验,在提高工业数据管理能力的同时,为企业数字化、信息化和智能化做出了重大贡献。
虽然实时数据库管理系统属于核心基础软件,但目前大部分国产实时数据库软件针对自主可控 CPU和操作系统进行优化不足,软件在一些功能的技术实现上使用通用但更依赖 CPU计算能力的方法,CPU、IO设备等硬件能力不足。因此,如果想要真正满足大工业市场海量传感器数据实时存储和处理的需求,尤其核电应用等态势感知、装备运行状态监控等高级数据应用领域的特殊需求,目前大部分国产数据库管理系统还需要更进一步。针对以上问题,以庚顿数据为代表的实时数据库厂商例近年来不断突破创新,海量顺序和乱序数据的高性能写入、海量实时和历史数据的原始及聚合查询、广泛适配国产硬件设备和操作系统以及如何实现实时数据库更高可靠性和安全性等领域均进行了大量深入的研究与创新应用,取得了丰硕的成果和市场回报的同时,也面临了诸如人才溃乏、应用场景单一、市场发育不良以及市场竞争同质化甚至价格战等一系列难题。
在数据库基础软件实际开发过程中,姚羽直言,做数据库这样的底层基础软件,面临着人才、技术和时间的三重难关,全国乃至全世界做数据库的厂商寥寥无几,近几年在国家的政策支持、需求深入的催化下,资本逐渐介入,数据库进入风口期,不少新生力量进入赛道,甚至出现了香蕉型数据库,一些基于国外开源内核代码的一些伪国产数据库品牌纷纷问世,看似热闹,实则鱼龙混杂的国产数据库市场逐渐形成,导致人才、市场竞争进一步加剧。
姚羽表示,“原来就人才稀缺的数据库领域,现在更难招到合适的人才。普遍存在的浮躁与急功近利风气,导致一小部分年轻人不能专注专心,这些因素对于基础软件研发和应用十分不利。而底层基础软件研发非常需要长期的技术沉淀和创新,实时数据库背后涉及到工业技术与信息技术的深度融合,包括工业控制技术、数据存储技术、压缩技术、多索引技术、超大内存管理技术、数据聚合技术、中断技术、安全机制技术、软硬融合技术等众多核心技术,因此需要一定数量的复合型人才才能支撑工业实时数据库的技术创新与产品应用,而这一点或将导致实时数据库领域在一段时期内很难实现质的突破。”
而这些原因,正是庚顿数据获得专精特新认证的核心原因。“既然我们的第一代创业团队选择了最具挑战性的赛道,在最难的地方持续投入精力,作为第二代团队的带领者,我愿意接过薪火,坚持我们的长期主义信念,象龟兔赛跑的乌龟那样,锲而不舍,做时间的朋友,潜心用时间和用户共创,持续打磨产品,为用户创新价值。”
“做工业软件不能闭门造车,所有工业软件都是在真实的用户数据和真实的工业场景中迭代成长的,用户提出的看似苛刻的技术要求,都是工业软件创新发展的营养和沃土。与同类软件相比,庚顿数据旗下的所有实时数据库都经过了大量的客户验证,在近千家企业稳定运行10年以上,庚顿数据的产品不是研发人员在办公室里敲代码写出来的,而是在应用现场不断完善和优化的,是大量用户用出来的。这是庚顿实时数据库能够进入航空母舰、卫星发射、大型船舶等高端领域众多严苛的场景的根本原因。”
截至目前,庚顿数据的实时数据采集、存储及可视化产品及解决方案已经广泛应用于电网、火电、风电、光电、水电、储能以及石油石化、轨道交通、车联网、医疗、军工、航天等重资产、重安全行业领域,涉及数字化运营、先进控制、智慧节能、智慧环保、节能降碳、智能制造、智慧安监、质量管理等众多场景,装机量超过1000台套,管理超过2.6亿传感测点,拥有合作伙伴超过2000家。
对大型工业企业而言,精准、快速掌握数字化转型进程中产生的各种数据和信息,可以进一步保障生产稳定、业务优化、设备健康和能耗降低,而这些正是企业获得高质量发展的关键驱动力。充分发掘工业数据价值的企业,才能最大限度释放工业数据生产力,帮助工业用户在激烈的市场竞争中抢占主动、获得先机。
随着5G技术、高性能电池技术的发展和低成本传感器的普及,工业数据呈现爆炸式增长,流程工业的工业数据资源日益丰富,但企业对数据的掌握和应用没有跟上数据增长的速度,大部分工业数据并没有得到有效的共享和利用,数据收集和整理的时间占比过大,真正被发掘并运用到企业的日常运营中的数据不到三分之一。因此,流程工业迫切需要海量工业数据的整体解决方案,更加高效地、精准地、实时地采集需要的工业数据,同时对这些数据进行整合分析并及时共享给各业务部分的数据使用方,以期创造更新的增长极。工业实时数据已然成为现代流程工业数字化转型的核心,真正实现工业数据的采集、存储并帮助建立工业数据分析和应用平台挖掘工业数据价值,成为驱动实时数据库行业面临的挑战和机遇。
实时数据库开发的理念是为了实现工业监控及工业数据分析应用,其数据读取以及存储压缩能力作为核心功能一直在升级迭代。为满足工业企业更高标准要求,突破原有应用场景限制,开辟新的增量市场,实时数据库厂商需要在技术层面上需要实现更多种信息技术的深度融合,尤其要和边缘计算结合互补;为了降低企业应用难度,提升使用感受,需要高度统一协议接口,进一步提高系统一体化水平。
流水争先,滔滔不绝,专精特新向未来
2022年,庚顿数据获得专精特新企业认证。“事实上2020年下半年庚顿数据就已经符合专精特新的条件了,但当时不了解专精特新的意义”。在姚羽看来,“专”是指从普世化向专业化转型,把“万金油”做成“特效药”,把“综合医院”做成“专科门诊”,然后整合内外部资源,深入了解细分行业的业务,形成专业领域的解决方案,比如在能源电力、国防军工等领域打造细分赛道上专业化的解决方案。“精”是指在产品上精益求精,深耕细作,不满足于做通用产品,重点打造需要长时间积累才能形成的核心能力。“特”是指找准夹缝市场,做出自己的专业特色,实现与业内龙头企业差异化竞争和战略补位,实现互补优势,绝不人云亦云。“新”是指通过挖掘新需求,引进更先进的技术,创新商业模式,通过变革创新来提升整体组织效能。
“专精特新认证,从市场的角度上讲,可能会为庚顿数据这类在某个细分领域深耕多年的企业带来更多的市场机遇,但同时更是对庚顿数据进一步专注于专业化、特色化的一种高度肯定和激励”,姚羽表示,“专精特新跟高新认证对于庚顿数据而言,意义重大。庚顿数据2008年获得高新技术企业的资质,至今已经连续15年保持这一身份,充分证明庚顿数据在研发投入的成果和决心。”
但相较于高新认证,专精特新更细分化和深入化,对于庚顿数据目前以及未来的发展更具有指导性和鞭策力。 姚羽表示,未来10年,庚顿数据将会继续深耕传感设备数据处理领域,打造更坚实的技术底座,提升产品的核心能力和价值,真正解决用户面临的核心痛点问题。同时庚顿数据也会继续围绕数据价值要素进行布局,建立生态圈,联合合作伙伴共同丰富应用场景。姚羽透露,2022年年初,庚顿数据专门成立了数据应用组,未来将利用专业的模型和算法,帮助客户基于实时数据和历史数据进行深度挖掘和分析,为用户提供更大的数据价值,帮助用户更好地利用数据要素和数据资源,为流程工业及离散工业的生产运营、设备管理、降本增效以及低碳化、高质量发展提供更有力的数据支撑。
随着大数据时代的来临,数据成为企业的重要战略资源,数据的隐私性和安全性是企业在选择实时数据库时的重要考量因素。特别是工业数据,具有其他行业不具备的特征。与互联网大数据不同,工业数据规模庞大,数据质量高, 数据价值密度高,对企业而言具有绝对的商业价值。海外产品灵活性不足及数据隐私两个主要驱动因素暗示着国产化替代浪潮的到来。在保证数据安全的前提下使用性能优秀、维护便捷、成本更低、接口协议更开放的产品是每一个理性的中国企业都会做的选择,本土化产品的迅速崛起让中国企业看到了新方向。
工业实时数据库在生产线的运行时间可长达十数年,是企业实时系统的核心构成。在初期选择阶段企业会进行再三考量,安装使用后不会轻易更换。替换周期长、成本高或造成未来市场产生头部效应。对实时数据库有迫切需求的更多是中大型工业企业,产品应用一步到位和可持续运行是首要考量因素。实时数据库未来的市场将属于拥有绝对产品竞争力的优秀企业。
工业实时数据库是典型的长期主义市场,爬坡周期长,产品成熟慢,用户共创程度高,成熟稳定性要求高,需要不断优化调节和岁月的沉淀。“流水要争先,也要争滔滔不绝”,对于中国国产实时数据库的未来,姚羽以及他带领下的庚顿数据,创造另一番未来之势已然明显。
好文章,需要你的鼓励
数据湖这个词在21世纪10年代初出现的时候,有些人认为它是在恰当的时间出现的一种恰当的架构。数据湖是一种非结构化的数据存储库,利用了新的低成本云对象存储格式(如Amazon S3),可以容纳来自网络的大量数据。
CIO越来越多地开始以更清晰的商业价值为重点审查生成式AI项目,特别是关注生成式AI技术的成本及其潜在优势。
十多年前,Minor Hotels这家总部位于曼谷的酒店运营商开始了技术变革过程,旨在打造一个强大的生态系统以实现增长和规模。利用此后出现的所有技术,这家公司继续保持着蓬勃的发展。