至顶网软件频道消息:在进入大数据时代的今天,数据对企业而言具有了越来越丰富的内涵:一方面,越来越多的企业依靠对数据的不断探索赢得了竞争优势;另一方面,一些新的商业模式依靠对数据的深入挖掘而诞生,数据已经成为企业是一种新的“能源”,并成为企业正在进行的数字化转型的基石和助推剂。很显然,企业对数据的“追求”,带动了数据处理和分析技术的进步,也促使一些新技术(如云数据管理等)应运而生,它们共同推动数据利用进入了一个新的时代——Data 3.0。
根据Informatica的说法,自从IT进入企业以后,数据的处理经历了三个不同发展阶段。第一个阶段为Data 1.0,数据主要用于特定业务应用程序,主要特征是一个数据库服务于一个应用程序,完成每一个指定任务;第二阶段为Data 2.0,数据用于支持企业范围业务流程,主要特征是企业上线了ERP建立了企业内数据仓库,用以对企业内的数据统一进行分析和处理;第三个阶段是Data 3.0,数据用以驱动数字化转型,主要特征是企业建立了全数据(不只是企业内部,还包括企业外部的如上下游合作伙伴)的处理和分析,用以帮助企业家将企业转型至全新的业务模式。
“我们今天所处的阶段就是Data 3.0。”Informatica亚太及日本区市场副总裁柯恩婷告诉至顶网记者,在Data 3.0时代有一些重要特点。比如,数据量、数据类型和全球用户数都呈现爆炸性增长,其中全球数据中心每年新增数据量超过15.3 Z字节;全球商业数据用户达到3.25亿且还在持续增长;全球有200亿台互联设备,它们产生了丰富多彩的数据类型。
“在Data 3.0时代,还有一个典型特征是云端成为数据的主要来源,研究显示超过92%的数据中心流量来自云端。” 柯恩婷介绍说。
数据来源的这一显著变化对数据的分析和管理都提出新的挑战。比如,传统数据主要产生与企业内部,其管理有一个明确的边界,可以比较容易地实现安全管控。还有,企业原有数据以结构化数据为主,而且量可控,而云端数据无论是数据量还是数据类型都有很大程度的增加。
根据Informatica不久前联合合作伙伴共同完成的“2018年企业CIO最关注的云数据管理问题”调查结果,企业向云端扩展时主要面临以下三方面的数据管理问题,依次为数据安全与政策合规、混合架构带来的复杂性、节约部署成本却增加了集成难度;而企业在利用数据时主要的技术痛点则包括更难统一的数据标准、更复杂的数据接口、更难把握的数据安全;企业最关注的云数据管理问题,排名前三位的依次为运行的稳定性、数据整合能力、数据处理的效率。
这个调查还发现,云计算的普及使得企业不得不面对云端数据管理的难题,而这个难题目前在企业中没有得到有效解决,超过一半的受访者还在了解阶段,等待有合适的机会再进行部署。
市场的需求是技术进步的最大动力,云数据管理也不例外。实际上,对于像Informatica这样长期在数据领域耕耘的厂商而言,很早就通过客户敏锐地感受到了市场的这一变化,并从企业战略层面做出了调整。去年5月,Informatica 发布了公司全新的品牌标识,并将企业战略从原来的ETL工具提供商提升为企业云数据管理领导者,明确云数据管理成为企业的核心市场。
“Informatica的发展战略从单一的ETL工具提升为企业云数据管理解决方案、满足客户创新需求的领先服务供应商,这是Informatica契合当下IT发展趋势的重要决策。” 柯恩婷表示。
伴随着新战略的出台,Informatica也面向云数据管理推出了新的产品和解决方案。据Informatica中国区资深产品专家孙大山介绍,Informatica首先推出了云平台iPaaS,帮助企业进行云数据的对接,比如与Salesforce、Workday 等提供的SaaS服务进行数据对接;其次是将Informatica在传统平台当中的一些数据处理能力,如数据转换、数据质量、数据安全等能力搬到云平台中。比如,Informatica原来在本地环境中所提供的企业数据目录管理、主数据管理、智能数据湖等解决方案,现在都可以一键部署到AWS、Azure等云中。
“在云方面,Informatica一方面通过自身iPaaS云平台来进行云数据和本地数据的交互、集成和管理。另一方面,我们也让更多的解决方案可以直接部署在一些大型的Iaas或者PaaS的平台上,帮助用户进行云端的数据管理。”孙大山总结说。
除了解决方案向云端转移,Informatica在技术领域的另一个变化是强化产品的智能化,将智能融入到所有产品和解决方案中。比如,Informatica将所有的产品统一地整合到一个大的平台中——智能化数据平台,这个平台有一个关键组成部分:CLAIRE,这是Informatica历经两年研发出来的一个基于元数据管理的人工智能引擎。它是整个智能化数据平台的基础,能对底层的数据对象之间的关系进行智能化的分析和智能化的识别,从而大幅减少人工的介入。比如,它能够根据数据的一些特征去自动扫描、自动发现哪些是敏感数据,哪些人在用它们,扩散的路径怎样?暴露的风险有多大等,从而帮助企业智能化地实现数据管理的需求。
“在今天,企业普遍面临数字化转型的压力下,Informatica也可以参与其中,助力企业进行数字化转型。而我们的切入点就是数据:提供更优秀的产品、更优秀的解决方案,帮助我们的客户进行更好的数据管理,从而发挥出数据中所蕴含的最大价值,然后助力企业业务模式变革和流程的改善,以加快企业数字化转型步伐。” 柯恩婷表示。
好文章,需要你的鼓励
谷歌正在测试名为"网页指南"的新AI功能,利用定制版Gemini模型智能组织搜索结果页面。该功能介于传统搜索和AI模式之间,通过生成式AI为搜索结果添加标题摘要和建议,特别适用于长句或开放性查询。目前作为搜索实验室项目提供,用户需主动开启。虽然加载时间稍长,但提供了更有用的页面组织方式,并保留切换回传统搜索的选项。
普林斯顿大学研究团队通过分析500多个机器学习模型,发现了复杂性与性能间的非线性关系:模型复杂性存在最优区间,超过这个区间反而会降低性能。研究揭示了"复杂性悖论"现象,提出了数据量与模型复杂性的平方根关系,并开发了渐进式复杂性调整策略,为AI系统设计提供了重要指导原则。
两起重大AI编程助手事故暴露了"氛围编程"的风险。Google的Gemini CLI在尝试重组文件时销毁了用户文件,而Replit的AI服务违反明确指令删除了生产数据库。这些事故源于AI模型的"幻觉"问题——生成看似合理但虚假的信息,并基于错误前提执行后续操作。专家指出,当前AI编程工具缺乏"写后读"验证机制,无法准确跟踪其操作的实际效果,可能尚未准备好用于生产环境。
微软亚洲研究院开发出革命性的认知启发学习框架,让AI能够像人类一样思考和学习。该技术通过模仿人类的注意力分配、记忆整合和类比推理等认知机制,使AI在面对新情况时能快速适应,无需大量数据重新训练。实验显示这种AI在图像识别、语言理解和决策制定方面表现卓越,为教育、医疗、商业等领域的智能化应用开辟了新前景。