在企业能够利用大数据的优势之前,数据科学家和开发人员必须准备和组织好数据,并开发底层的机器学习算法和预测模型,以支持分析师和IT从业者使用的商业智能应用。
从传统上说,这是一个非常耗时的过程,但是有很多数据科学、机器学习和人工智能平台可以自动化地完成其中大部分的工作,让企业和组织可以更快速地利用大数据资产获得竞争优势。
以下就让我们来看看数据科学和机器学习领域的这10家热门初创公司。
BigML
总部:美国俄勒冈州科瓦利斯。
BigML提供了一个全面的托管式机器学习平台,可以轻松构建和共享数据集和模型,进行高度自动化的、以数据为驱动的决策。更具体来说,BigML可编程的、可扩展的机器学习平台可以自动进行分类、回归、时间序列预测、聚类分析、异常检测、关联发现和主题建模任务。
BigML Preferred Partner Program支持推荐合作伙伴、销售合作伙伴、销售BigML并监督实施项目的合作伙伴。
Cinnamon AI
总部:日本东京
Cinnamon是Gartner今年评出的“酷厂商”之一。Cinnamon开发了一种系统,可以扫描非结构化的印刷文档和数字文档,从PDF和Word,到手写便笺和传真等所有内容,并提取关键点。该系统融合了人工智能和机器学习技术,通过消除数百万小时的手动输入和其他重复性任务降低业务运营成本。
Cinnamon还提供了最先进的语音识别AI系统。
除东京总部之外,Cinnamon在美国加州圣马特奥、中国台湾、越南设有办事处。
DataKitchen
总部:美国马萨诸塞州剑桥。
业务流程是数字化转型的关键,而数据流是管理和更改业务流程的关键。DataKitchen是DataOps领域的先驱,提出了管理组装产线(而不是很多麻烦的临时流程)等数据分析流程的概念。
DataKitchen的平台通过数据工程、数据科学和业务分析流程来管理数据管道。DataOps在协作工作流程中结合了敏捷开发、DevOps和统计流程控制等概念。
DotData
总部:美国加州圣马特奥。
DotData的DotData Enterprise机器学习和数据科学平台能够将人工智能和商业智能项目从几个月缩短到几天,让数据科学过程足够简单到几乎所有人(不仅仅是数据科学家)都可以从中受益。
DotData平台基于DotData的AutoML 2.0引擎,可以提供数据科学和机器学习等任务的全周期自动化。
DotData在2019年10月的A轮融资中获得了2300万美元,并于2019年12月获得了AWS合作伙伴网络高级技术合作伙伴资格。
Iguazio
总部:美国纽约和以色列荷兹利亚
Iguazio Data Science Platform可以自动化并加快机器学习工作流程,使企业能够大规模地开发、部署和管理人工智能应用,从而改善业务成果——Iguazio称之为“MLOps”。
今年1月Iguazio筹集了2400万美元资金。
Octopai
首席执行官:Amnon Drori
总部:以色列Rosh Ha'ayin
Octopai开发了一个自动化的、集中式的元数据管理和搜索引擎系统,让数据科学家和商业智能团体可以发现、管理和跟踪共享的元数据。
该软件可以保持企业内数据的一致性,帮助业务分析人员查找和了解可用数据,还可以用于以数据沿袭为关键的大数据治理和合规任务。
Ople
总部:美国加州圣马特奥。
Ople平台可以自动执行那些往往需要数据科学家才能完成的大数据任务,例如数据准备和预测模型创建、优化和部署。该软件利用机器学习模型来解决预测维护、供应链优化、金融欺诈检测和客户流失等复杂预测分析问题。
3月,Ople通过Tableau最近发布的Analytics Extension API,将自己的软件与Tableau的商业智能和数据可视化工具进行了集成。
Siren
总部:爱尔兰、戈尔韦和费城
Siren Investigation Intelligence Platform利用数据模型来驱动相关数据发现,结合了搜索、商业智能仪表板、链接分析、大数据记录和警报功能。
Siren被Gartner评为2020年分析和数据科学领域的“酷厂商”,在2019年11月的A轮融资中获得了1000万美元资金。
Tellius
总部:美国弗吉尼亚州雷斯顿
Tellius提供了一个搜索驱动的分析平台Tellius Genius AI Engine,让用户更容易了解业务大数据的问题,并从这些数据中获得可行的洞察。该引擎结合了机器学习来发现数据中的模式和关系,同时也会从数据本身和用户操作中学习。
Tellius系统的语音、搜索和自然语言能力是对自助式BI和分析项目的加强。
Unsupervised
总部:美国科罗拉多州博尔德
无监督系统使用增强的人工智能、数据科学和机器学习,帮助那些不具备深厚数据科学技能的人们分析大量复杂的结构化和非结构化数据,以发现有意义的模式和洞察。
连接和聚合大数据通常是需要手动操作的,耗费时间的,而Unsupervised的软件可以将这个过程实现自动化,因此也被Gartner评为该领域的“酷厂商”。
好文章,需要你的鼓励
戴尔、微软、Salesforce等科技领导者发布2026年AI预测,认为AI代理安全防护和投资回报率是客户关注焦点。戴尔CTO预测AI将转向本地部署以加强控制;ServiceNow强调AI价值必须体现在业务收益上;Snowflake重视数据治理在AI代理管控中的作用;Salesforce认为AI将成为品牌形象代言人;微软强调信任是AI代理部署的关键要素。
MBZUAI和法国综合理工学院联合开发的SchED算法能让AI写作速度提升3-4倍。该算法通过监测AI生成文本的置信度,采用进度感知的动态阈值策略,在保持99.8%-100%原始质量的同时显著减少计算时间。实验覆盖多种任务类型,证明了算法的有效性和鲁棒性。
苹果计划在2026年推出多款重磅新品,包括配备miniLED面板和A19 Pro芯片的27英寸外接显示器、搭载homeOS系统的7英寸智能家居控制设备、首次采用OLED屏幕的全新MacBook Pro、具备7.8英寸内屏的iPhone Fold折叠手机、售价699美元起的入门级MacBook,以及升级OLED显示技术的iPad mini。
西安交通大学研究团队发现,AI视觉语言模型容易受到功能词(如"是"、"的"等)的干扰而遭受攻击。他们开发了功能词去注意力(FDA)机制,让AI减少对这些词汇的关注。测试显示,该方法可将攻击成功率降低18%-90%,而正常性能仅下降0.2%-0.6%。FDA无需额外训练即可集成到现有模型中,为AI安全防护提供了简单有效的解决方案。