企业和组织被大数据淹没,难以有效管理数量不断增长、种类繁多、速度不断加快的数据,更不要说梳理和分析所有这些数据以获得有价值、可以带来竞争优势的洞察了。
下面让我们来看看2021年这10家拥有颠覆性技术的大数据初创公司,这些公司开发了在数据运营、数据管理和自动化、数据质量、数据转换和集成、数据分析、数据库、数据仓库方面领先的众多产品。
Airbyte

高管:Michel Tricot,联合创始人、首席执行官
总部:美国旧金山
Airbyte开发了一种开源的数据集成/ELT提取、加载和转换)引擎,让企业和组织可以用来快速构建数据管道,使用现有的和自定义的连接器,在数据库、数据仓库和数据湖之间复制数据。
Airbyte的竞争对手包括Informatica和Talend等老牌数据管理技术厂商,以及Fivetran和Matillion等年轻的ELT公司。Airbyte目前是以免费社区版提供其软件的,并且正在开发商业云版本和企业版本,带有更多扩展功能。
Airbyte成立于去年,在今年5月由Benchmark领投的A轮融资中获得2600万美元,此前今年3月在种子轮融资中获得520万美元。
Bigeye

高管:Kyle Kirwan,联合创始人、首席执行官
总部:美国旧金山
数据的延迟、丢失、重复和损坏会阻碍大数据项目和数字化转型计划。Bigeye提供的数据质量工程平台,可以帮助数据管理团队识别和修复数据质量问题。
该平台通过检测数据集和数据管道、应用指标来监控和衡量数据质量、检测数据异常并在出现问题时向数据管理人员发出警报,从而自动执行数据质量管理任务。
Bigeye成立于2019年,在今年4月的A轮融资中获得1700万美元,将用于加速其产品开发并加快入市。
Cardagraph

高管:Bentley Wilson,联合创始人、首席执行官
总部:美国犹他州李海
Cardagraph成立于2019年,经过两年的开发和测试客户使用之后,在今年3月正式推出了他们的业务生产力分析软件。
这个基于SaaS的Cardagraph Platform旨在为业务经理提供业务数据和分析洞察,尤其是那些担任运营、财务和营销角色的业务经理,以取代那些不再适用的传统业务报告系统。
Cardagraph的软件可连接到Salesforce、Slack、Google、HubSpot、Workfront、Jira 等系统,然后将专有算法、人工智能和机器学习应用于收集来的数据,为管理者提供有关所谓“重点领域、机会和改进”的信息。
在今年3月的发布中,Cardagraph宣布进行了一轮由很多个人投资者参与的“重要融资”,包括ObservePoint首席执行官、Omniture联合创始人John Pestana,以及Startup Ignition创始人、首席执行官John Richards。融资金额未对外披露。
Dgraph

高管:Gary Hagmueller,首席执行官
总部:美国加州帕洛阿尔托
Dgraph开发的原生“GraphQL”图形数据库,是一种挑战传统关系数据库系统优势的新一代数据库技术。Dgraph数据库不仅存储数据,而且还存储有关数据之间关系的信息,使用图形架构来表示数据以便进行语义查询。
对于社交媒体和其他数据关系至关重要的任务来说,图形数据库是特别有效的,而Dgraph号称他们的数据库可以有效地将复杂数据结构中的孤立数据转化为实时智能。上个月,Dgraph称他们是GitHub上排名第一的图形数据库。
今年4月,Dgraph聘请了商业保险行业AI技术提供商Clara Analytics的前任首席执行官Gary Hagmueller加入Dgraph,担任首席执行官。Dgraph公司创始人Manish Jain担任首席技术官。
Firebolt

高管:Eldad Farkash,联合创始人、首席执行官
总部:以色列特拉维夫
Firebolt开发了一个云数据仓库,用来与Snowflake和AWS Redshift等巨头展开竞争。Firebolt称他们的技术运营模式是规模速度的、易于使用的、且负担得起的。
Firebolt的系统旨在解耦存储和计算,从而在无共享架构中实现细粒度的弹性和可扩展性,同时要依赖于S3共享存储。此外Firebolt使用标准SQL查询半结构化数据,以提升系统性能,无需复杂的ETL(提取、转换和加载),并利用Firebolt File Format加快数据更新。
Firebolt是由Sisense资深人士Eldad Farkash和Saar Bitner在2019年创立的。
Imply

高管:Fangjin Yang,联合创始人、首席执行官
总部:美国加州伯灵格姆
Imply号称是“动态分析”的先驱,开发的多云实时大数据分析平台可以提供自助式分析功能。该平台用于构建分析驱动的应用,基于Imply创始人开发的开源Apache Druid实时分析数据库。
Imply成立于2015年,在近日由Bessemer Venture Partners领投的C轮融资中获得7000万美元,使其总融资额超过1.16亿美元。
Rivery

高管:Itamar Ben Hemo,联合创始人、首席执行官
总部:美国纽约
Rivery在不断扩大的DataOps(数据运营管理)领域受到关注。
这家初创公司提供了号称“直观”的数据集成和准备平台,简化了将内外部数据聚合和转换为单个流以加载到云分析系统(例如Amazon Redshift、Google BigQuery和Snowflake)的过程。
Rivery的平台包括无代码ETL(提取、转换、加载)工具、用于将数据从本地系统自动迁移到云数据仓库的软件、以及用于连接和编排所有内部及第三方数据的数据编排工具。
Rivery成立于2018年,在由Entrée Capital和State Of Mind Ventures领投的A轮融资中获得了1600万美元,此前在2019年11月的种子轮融资中获得了500万美元。
Syncari

高管:Nick Bonfiglio,联合创始人、首席执行官
总部:美国旧金山
Syncari的无代码数据自动化平台可以帮助数据专业人员在企业中统一化、清理、管理和分发受信的客户数据。该系统依靠一系列数据同步、统一、治理和访问功能来执行各项任务。
上周,Syncari宣布新增了更为先进的工作流程功能,帮助销售和营销团队更有效地利用客户数据。
Syncari是由Marketo、Mulesoft和Zendesk前高管在2019年6月创立的,在今年5月的A轮融资中获得了1730万美元。
Varada

高管:Eran Vanounou,首席执行官
总部:以色列特拉维夫
Varada开发的数据湖查询加速软件,旨在帮助企业和组织从数据湖(海量无组织数据存储)中获得更多价值。Varada的一大亮点是其自主索引技术,可利用机器学习功能来动态加速查询。
Varada成立于2017年,在2020年12月全部推出了Varada Data Platform平台。
今年5月Varada宣布在其系统中添加交互式文本分析功能,并与开源Apache Lucerne搜索引擎进行集成。此外,新功能了直接与数据湖配合使用,以辅助SQL数据使用者。最近Varada还对该平台进行了增强,可帮助网络安全团队分析数据湖存储以进行威胁检测。
Yugabyte

高管:Bill Cook,首席执行官
总部:美国加州桑尼维尔
Yugabyte开发的YugabyteDB是下一代分布式关系数据库,旨在处理跨越多个地理区域和可用区的大量数据。该数据库支持需要低查询延迟和极强故障恢复能力的全球关键业务型应用(例如网络安全和金融服务)。
Yugabyte创始人包括总裁Kannan Muthukkaruppan、首席技术官Karthik Ranganathan和软件架构师Mikhail Bautin,在Oracle和Facebook开发了关键业务数据库技术后,于2016年创立了Yugabyte。
在今年3月的B轮融资中Yugabyte获得了4800万美元。
好文章,需要你的鼓励
脑机接口技术正快速发展,特别是非侵入性方法取得重大突破。通过EEG、fNIRS、MEG等传感技术结合人工智能,实现思维解码、图像重构等功能。聚焦超声波技术能精确调节大脑深层结构,为神经疾病治疗带来新希望。消费级可穿戴设备已能改善睡眠、缓解抑郁。这些技术将重塑人机交互方式,从医疗应用扩展至认知增强领域。
波士顿大学团队发现当今多模态AI存在严重"偏科"问题:面对冲突的文字、视觉、听觉信息时,AI过分依赖文字而忽视真实感官内容。研究团队构建MMA-Bench测试平台,通过创造视听冲突场景暴露了主流AI模型的脆弱性,并提出模态对齐调优方法,将模型准确率从25%提升至80%,为构建更可靠的多模态AI系统提供重要突破。
OpenAI首席执行官山姆·阿尔特曼本周宣布进入"红色警戒"状态,要求员工快速响应来自谷歌和Anthropic的竞争压力。据知情人士透露,OpenAI计划下周发布GPT-5.2更新以应对谷歌Gemini 3的挑战。原计划12月下旬发布的GPT-5.2现已提前至12月9日发布,旨在缩小与谷歌上月发布的领先模型Gemini 3之间的差距。
UC伯克利研究团队发现了一种名为"双重话语"的AI攻击方法,能够通过简单的词汇替换绕过当前所有主流聊天机器人的安全防护。攻击者只需用无害词汇替换危险词汇,就能让AI在不知不觉中提供危险信息。研究揭示了现有AI安全机制的根本缺陷,迫切需要开发新的防护策略来应对这一威胁。