从业务分析和AI项目,再到实行数字化转型,企业希望在一系列项目中采用海量数据,但他们遇到了很多问题。
查找、组合、准备和转换用于特定任务的数据,已经成为一项巨大的挑战。据Gartner估计,数据和分析负责人把36%的时间都用在了数据准备和数据集成上,这超过其他任何数据管理工作。
而IT环境在私有云、混合云和多云系统之间不断分裂,使得企业的数据进一步增加,导致在不同系统之间发现、集成和管理数据项目所需的数据,变得越来越困难。
下面就让我们来看看这家拥有突破性产品的10家大数据初创公司,他们中有很多产品,能够解决大数据准备、集成和管理方面的问题,值得我们的关注。
Alluxio
创始人、首席执行官:Steven Mih
总部:美国加利福尼亚州圣马特奥
Alluxio提供了一款数据编排平台,当计算和数据存储在不同位置的时候,可用于管理分析和机器学习应用数据——这在当今复杂的混合云和多云IT环境中正变得越来越普遍。
虚拟分布式存储系统是一种以内存为中心的容错体系结构,可实现存储和计算功能的分离。该技术源自于U.C.伯克利的AMPLab Tachyon开源项目,而该项目的创始人在2015年成立了Alluxio。
今年10月Alluxio发布了Alluxio Data Orchestration Platform 2.4,该版本提供了多项新工具和新功能,用于将数据驱动型应用(如AI工具和业务分析软件)与分散的数据源(如基于Hadoop的数据湖、Amazon S3和Google Cloud Storage)链接起来。
Aparavi
创始人、首席执行官:Adrian Knapp
总部:美国加利福尼亚州圣莫尼卡
Aparavi最早是专注于执行数据备份任务的数据管理,今年3月Aparavi发布了Data Intelligence and Automation Platform,称该系统可以帮助企业应对分布式IT环境中的各种数据混乱、风险和机遇。
Aparavi成立于2017年,在2018年走出隐身模式。
Aparavi的平台用于在本地环境和云系统中查找、分类、自动化和管理分布式数据,执行数据发现和访问、数据保留、数据保护、数据治理、风险和合规性等一系列任务,提供了可访问分布式数据的分析、机器学习和协作工具,帮助用户将其转化为竞争资产。
DataKitchen
创始人、首席执行官:Christopher Bergh
总部:美国马萨诸塞州剑桥
DataKitchen及其DataKitchen DataOps平台已经在新兴的数据运营(“DataOps”)领域引起了关注。
DataOps借鉴了敏捷开发和DevOps的一些概念,采用一种有条理的、敏捷的方法来设计、操作和使用数据体系结构和数据管道来支持业务分析和数据管理团队。
DataKitchen DataOps系统可以对数据管道相关的人员、工具和活动(包括数据系统编排、测试和监控)实施自动化和协调,以进行开发和部署。
10月,DataKitchen发布了DataOps Transformation Advisory Service服务。
Equalum
创始人、首席执行官:Nir Livneh
总部:美国加利福尼亚州桑尼维尔和以色列特拉维夫
如今,企业组织生成的数据越来越多,这就意味着需要在系统之间实时地传输更多数据,例如,下一代云迁移就需要具有数据流的能力,Eckerson Group分析师Kevin Petrie表示。
Equalum创建了一个数据提取平台,用于开发和管理批处理和流数据管道,完成诸如数据仓库ETL(提取,转换和加载)、将数据整合到数据湖、对变更的数据进行持续数据复制等任务。Equalum称其技术具有“无限的速度和可扩展性”,以及零代码开发数据管道的能力。
Equalum成立于2015年,到目前为止已经累计获得2500万美元的股权融资。
Hammerspace
首席执行官:David Flynn
总部:美国加利福尼亚州洛斯阿尔托斯。
Hammerspace所在的“数据即服务”领域是一个不断壮大的市场,Hammerspace的技术可以跨混合云和多云IT系统,提供对数据的访问。Hammerspace的软件定义混合云数据控制平面依赖于元数据驱动的机器学习,可以虚拟化和抽象来自本地和基于云的多个存储系统的数据,从而让任何应用、服务、容器或者开发者都可以访问这些数据。
Isima
联合创始人、首席执行官:Darshan Rawal
总部:美国加利福尼亚帕洛阿尔托
大数据初创公司Isima成立于2016年,今年8月刚刚走出隐身模式,在种子轮融资中获得1000万美元。
Isima的BiOS数据融合和分析平台旨在帮助企业组织管理整个开发、部署数据驱动型应用、轻松添加新数据源的生命周期。该平台整合了传统独立大数据工具的许多功能,包括数据仓库、ETL、企业服务中心和商业智能软件。
目前已经有多家客户将Isima平台用于供应链优化、欺诈检测、贸易对账和减少客户流失等场景。
Octopai
联合创始人、首席执行官:Amnon Drori
总部:以色列罗什艾因
Octopai成立于2015年,致力于开发一种自动化集中式元数据管理和搜索引擎系统,让数据科学家和商业智能团队可以用该系统发现、管理和追踪共享的元数据。
该软件用于维持企业内的数据一致性,帮助业务分析人员查找和了解可用数据,以及数据的沿袭,也可以用于以数据沿袭为关键的大数据治理和合规性任务。
Okera
首席执行官:Nick Halsey
总部:美国旧金山
要在为用户提供越来越多数据访问权限(也就是“数据访问全面化”)的同时执行数据安全和数据治理策略,正在成为一项巨大的挑战。
Okera开发的平台可以让IT管理员自动发现和标记敏感数据,制定和执行数据治理策略以及审核数据安全性和治理操作。今年,Okera被Gartner评为DataOps领域的“酷公司”。
Okera成立于2016年,在今年4月的B轮融资中获得了1500万美元,使得总融资额达到2960万美元,Okera将用这笔资金扩大工程团队、销售团队和市场营销团队。同时,Okera任命ZoomData前总裁兼首席执行官Nick Halsey为新一任首席执行官。
Rivery
联合创始人、首席执行官:Itamar Ben Hemo
总部:美国纽约
Rivery提供了一个“直观”的数据集成和准备平台,简化了将内部和外部数据聚合和转换为单个流以加载到云分析系统(如Amazon Redshift、Google BigQuery和Snowflake)中的过程。
Rivery的平台包括无代码ETL工具、用于将数据从本地系统自动迁移到云数据仓库的软件、以及用于连接和编排所有内部和第三方数据源的数据编排工具。
Rivery成立于2018年,在2019年11月的种子轮融资中获得500万美元。
Stardog
联合创始人、首席执行官:Kendall Clark
总部:美国弗吉尼亚州阿灵顿
Stardog开发的Enterprise Knowledge Graph Platform构建了一个灵活的、可重复使用的数据层,使用主流SQL系统和NoSQL数据库的连接器,可跨多个数据孤岛响应复杂的查询。该技术创建了Stardog所谓的数据框架和“知识互联网络”。
Stardog的BITES流程甚至可以从非结构化数据(例如研究论文、简历和法规文件)中提取概念。
Stardog成立于2015年,到目前为止已经累计获得2330万美元风险资金。
好文章,需要你的鼓励
微软推出 Copilot+ PC 标准,要求配备高性能 NPU,引发 AI PC 市场格局变化。英伟达虽在数据中心 AI 领域占主导,但在 PC 端面临挑战。文章分析了英伟达的 AI PC 策略、NPU 与 GPU 的竞争关系,以及未来 GPU 可能在 Copilot+ 功能中发挥作用的前景。
专家预测,随着人工智能技术的迅速发展和广泛应用,2025 年可能成为 AI 泡沫破裂的关键一年。尽管 AI 仍有望在多模态模型和自动机器学习等领域取得突破,但技术瓶颈、投资回报率下降、监管趋严以及环境和伦理问题等因素可能导致 AI 热潮降温。未来 AI 发展将更注重平衡和可持续性。
研究表明,现有的公开 AI 模型在描述大屠杀历史时过于简单化,无法呈现其复杂性和细微之处。研究人员呼吁各相关机构数字化资料和专业知识,以改善 AI 对这段历史的理解和表述。他们强调需要在 AI 系统中加入更多高质量的数据,同时在审查和信息获取之间寻求平衡。
Google 推出名为 Titans 的新型 AI 架构,是 Transformer 的直接进化版。Titans 引入了神经长期记忆、短期记忆和基于惊喜的学习系统,使 AI 更接近人类思维方式。这一突破性技术有望彻底改变 AI 范式,推动机器智能向人类认知迈进一大步。