至顶网软件频道消息:在进入大数据时代的今天,数据对企业而言具有了越来越丰富的内涵:一方面,越来越多的企业依靠对数据的不断探索赢得了竞争优势;另一方面,一些新的商业模式依靠对数据的深入挖掘而诞生,数据已经成为企业是一种新的“能源”,并成为企业正在进行的数字化转型的基石和助推剂。很显然,企业对数据的“追求”,带动了数据处理和分析技术的进步,也促使一些新技术(如云数据管理等)应运而生,它们共同推动数据利用进入了一个新的时代——Data 3.0。
根据Informatica的说法,自从IT进入企业以后,数据的处理经历了三个不同发展阶段。第一个阶段为Data 1.0,数据主要用于特定业务应用程序,主要特征是一个数据库服务于一个应用程序,完成每一个指定任务;第二阶段为Data 2.0,数据用于支持企业范围业务流程,主要特征是企业上线了ERP建立了企业内数据仓库,用以对企业内的数据统一进行分析和处理;第三个阶段是Data 3.0,数据用以驱动数字化转型,主要特征是企业建立了全数据(不只是企业内部,还包括企业外部的如上下游合作伙伴)的处理和分析,用以帮助企业家将企业转型至全新的业务模式。
“我们今天所处的阶段就是Data 3.0。”Informatica亚太及日本区市场副总裁柯恩婷告诉至顶网记者,在Data 3.0时代有一些重要特点。比如,数据量、数据类型和全球用户数都呈现爆炸性增长,其中全球数据中心每年新增数据量超过15.3 Z字节;全球商业数据用户达到3.25亿且还在持续增长;全球有200亿台互联设备,它们产生了丰富多彩的数据类型。
“在Data 3.0时代,还有一个典型特征是云端成为数据的主要来源,研究显示超过92%的数据中心流量来自云端。” 柯恩婷介绍说。
数据来源的这一显著变化对数据的分析和管理都提出新的挑战。比如,传统数据主要产生与企业内部,其管理有一个明确的边界,可以比较容易地实现安全管控。还有,企业原有数据以结构化数据为主,而且量可控,而云端数据无论是数据量还是数据类型都有很大程度的增加。
根据Informatica不久前联合合作伙伴共同完成的“2018年企业CIO最关注的云数据管理问题”调查结果,企业向云端扩展时主要面临以下三方面的数据管理问题,依次为数据安全与政策合规、混合架构带来的复杂性、节约部署成本却增加了集成难度;而企业在利用数据时主要的技术痛点则包括更难统一的数据标准、更复杂的数据接口、更难把握的数据安全;企业最关注的云数据管理问题,排名前三位的依次为运行的稳定性、数据整合能力、数据处理的效率。
这个调查还发现,云计算的普及使得企业不得不面对云端数据管理的难题,而这个难题目前在企业中没有得到有效解决,超过一半的受访者还在了解阶段,等待有合适的机会再进行部署。
市场的需求是技术进步的最大动力,云数据管理也不例外。实际上,对于像Informatica这样长期在数据领域耕耘的厂商而言,很早就通过客户敏锐地感受到了市场的这一变化,并从企业战略层面做出了调整。去年5月,Informatica 发布了公司全新的品牌标识,并将企业战略从原来的ETL工具提供商提升为企业云数据管理领导者,明确云数据管理成为企业的核心市场。
“Informatica的发展战略从单一的ETL工具提升为企业云数据管理解决方案、满足客户创新需求的领先服务供应商,这是Informatica契合当下IT发展趋势的重要决策。” 柯恩婷表示。
伴随着新战略的出台,Informatica也面向云数据管理推出了新的产品和解决方案。据Informatica中国区资深产品专家孙大山介绍,Informatica首先推出了云平台iPaaS,帮助企业进行云数据的对接,比如与Salesforce、Workday 等提供的SaaS服务进行数据对接;其次是将Informatica在传统平台当中的一些数据处理能力,如数据转换、数据质量、数据安全等能力搬到云平台中。比如,Informatica原来在本地环境中所提供的企业数据目录管理、主数据管理、智能数据湖等解决方案,现在都可以一键部署到AWS、Azure等云中。
“在云方面,Informatica一方面通过自身iPaaS云平台来进行云数据和本地数据的交互、集成和管理。另一方面,我们也让更多的解决方案可以直接部署在一些大型的Iaas或者PaaS的平台上,帮助用户进行云端的数据管理。”孙大山总结说。
除了解决方案向云端转移,Informatica在技术领域的另一个变化是强化产品的智能化,将智能融入到所有产品和解决方案中。比如,Informatica将所有的产品统一地整合到一个大的平台中——智能化数据平台,这个平台有一个关键组成部分:CLAIRE,这是Informatica历经两年研发出来的一个基于元数据管理的人工智能引擎。它是整个智能化数据平台的基础,能对底层的数据对象之间的关系进行智能化的分析和智能化的识别,从而大幅减少人工的介入。比如,它能够根据数据的一些特征去自动扫描、自动发现哪些是敏感数据,哪些人在用它们,扩散的路径怎样?暴露的风险有多大等,从而帮助企业智能化地实现数据管理的需求。
“在今天,企业普遍面临数字化转型的压力下,Informatica也可以参与其中,助力企业进行数字化转型。而我们的切入点就是数据:提供更优秀的产品、更优秀的解决方案,帮助我们的客户进行更好的数据管理,从而发挥出数据中所蕴含的最大价值,然后助力企业业务模式变革和流程的改善,以加快企业数字化转型步伐。” 柯恩婷表示。
好文章,需要你的鼓励
中国生数科技旗下AI产品Vidu发布新版本更新,推出"参考图像生成"功能,用户可上传最多7张参考图片,通过AI模型的语义理解技术将多张图像合成为高度一致的新图像。该功能支持快速编辑照片、替换物体、调整光照等操作,为摄影师、营销人员提供便捷的AI图像编辑工具,在保持视觉一致性方面与谷歌等竞品形成竞争。
CORA是微软研究院与谷歌研究团队联合开发的突破性AI视觉模型,发表于2023年CVPR会议。它通过创新的"区域提示"和"锚点预匹配"技术,成功解决了计算机视觉领域的一大挑战——开放词汇目标检测。CORA能够识别训练数据中从未出现过的物体类别,就像人类能够举一反三一样。在LVIS数据集测试中,CORA的性能比现有最佳方法提高了4.6个百分点,尤其在稀有类别识别上表现突出。这一技术有望广泛应用于自动驾驶、零售、安防和辅助技术等多个领域。
芯片初创公司SiFive推出四款专为运行人工智能模型优化的CPU核心。这些基于开源RISC-V架构的新核心增加了矢量扩展功能,能够更高效地并行处理多个数据点,显著加速AI模型运算。其中X160和X180是主打产品,具备加速卷积运算的矢量处理功能,可用于工业设备、消费电子和数据中心。公司预计客户将于2026年第二季度开始基于新核心设计生产芯片。
中国电信研究院联合重庆大学、北航发布T2R-bench基准,首次系统评估AI从工业表格生成专业报告的能力。研究涵盖457个真实工业表格,测试25个主流AI模型,发现最强模型得分仅62.71%,远低于人类专家96.52%。揭示AI在处理复杂结构表格、超大规模数据时存在数字计算错误、信息遗漏等关键缺陷,为AI数据分析技术改进指明方向。