在企业能够利用大数据的优势之前,数据科学家和开发人员必须准备和组织好数据,并开发底层的机器学习算法和预测模型,以支持分析师和IT从业者使用的商业智能应用。
从传统上说,这是一个非常耗时的过程,但是有很多数据科学、机器学习和人工智能平台可以自动化地完成其中大部分的工作,让企业和组织可以更快速地利用大数据资产获得竞争优势。
以下就让我们来看看数据科学和机器学习领域的这10家热门初创公司。
BigML
总部:美国俄勒冈州科瓦利斯。
BigML提供了一个全面的托管式机器学习平台,可以轻松构建和共享数据集和模型,进行高度自动化的、以数据为驱动的决策。更具体来说,BigML可编程的、可扩展的机器学习平台可以自动进行分类、回归、时间序列预测、聚类分析、异常检测、关联发现和主题建模任务。
BigML Preferred Partner Program支持推荐合作伙伴、销售合作伙伴、销售BigML并监督实施项目的合作伙伴。
Cinnamon AI
总部:日本东京
Cinnamon是Gartner今年评出的“酷厂商”之一。Cinnamon开发了一种系统,可以扫描非结构化的印刷文档和数字文档,从PDF和Word,到手写便笺和传真等所有内容,并提取关键点。该系统融合了人工智能和机器学习技术,通过消除数百万小时的手动输入和其他重复性任务降低业务运营成本。
Cinnamon还提供了最先进的语音识别AI系统。
除东京总部之外,Cinnamon在美国加州圣马特奥、中国台湾、越南设有办事处。
DataKitchen
总部:美国马萨诸塞州剑桥。
业务流程是数字化转型的关键,而数据流是管理和更改业务流程的关键。DataKitchen是DataOps领域的先驱,提出了管理组装产线(而不是很多麻烦的临时流程)等数据分析流程的概念。
DataKitchen的平台通过数据工程、数据科学和业务分析流程来管理数据管道。DataOps在协作工作流程中结合了敏捷开发、DevOps和统计流程控制等概念。
DotData
总部:美国加州圣马特奥。
DotData的DotData Enterprise机器学习和数据科学平台能够将人工智能和商业智能项目从几个月缩短到几天,让数据科学过程足够简单到几乎所有人(不仅仅是数据科学家)都可以从中受益。
DotData平台基于DotData的AutoML 2.0引擎,可以提供数据科学和机器学习等任务的全周期自动化。
DotData在2019年10月的A轮融资中获得了2300万美元,并于2019年12月获得了AWS合作伙伴网络高级技术合作伙伴资格。
Iguazio
总部:美国纽约和以色列荷兹利亚
Iguazio Data Science Platform可以自动化并加快机器学习工作流程,使企业能够大规模地开发、部署和管理人工智能应用,从而改善业务成果——Iguazio称之为“MLOps”。
今年1月Iguazio筹集了2400万美元资金。
Octopai
首席执行官:Amnon Drori
总部:以色列Rosh Ha'ayin
Octopai开发了一个自动化的、集中式的元数据管理和搜索引擎系统,让数据科学家和商业智能团体可以发现、管理和跟踪共享的元数据。
该软件可以保持企业内数据的一致性,帮助业务分析人员查找和了解可用数据,还可以用于以数据沿袭为关键的大数据治理和合规任务。
Ople
总部:美国加州圣马特奥。
Ople平台可以自动执行那些往往需要数据科学家才能完成的大数据任务,例如数据准备和预测模型创建、优化和部署。该软件利用机器学习模型来解决预测维护、供应链优化、金融欺诈检测和客户流失等复杂预测分析问题。
3月,Ople通过Tableau最近发布的Analytics Extension API,将自己的软件与Tableau的商业智能和数据可视化工具进行了集成。
Siren
总部:爱尔兰、戈尔韦和费城
Siren Investigation Intelligence Platform利用数据模型来驱动相关数据发现,结合了搜索、商业智能仪表板、链接分析、大数据记录和警报功能。
Siren被Gartner评为2020年分析和数据科学领域的“酷厂商”,在2019年11月的A轮融资中获得了1000万美元资金。
Tellius
总部:美国弗吉尼亚州雷斯顿
Tellius提供了一个搜索驱动的分析平台Tellius Genius AI Engine,让用户更容易了解业务大数据的问题,并从这些数据中获得可行的洞察。该引擎结合了机器学习来发现数据中的模式和关系,同时也会从数据本身和用户操作中学习。
Tellius系统的语音、搜索和自然语言能力是对自助式BI和分析项目的加强。
Unsupervised
总部:美国科罗拉多州博尔德
无监督系统使用增强的人工智能、数据科学和机器学习,帮助那些不具备深厚数据科学技能的人们分析大量复杂的结构化和非结构化数据,以发现有意义的模式和洞察。
连接和聚合大数据通常是需要手动操作的,耗费时间的,而Unsupervised的软件可以将这个过程实现自动化,因此也被Gartner评为该领域的“酷厂商”。
好文章,需要你的鼓励
随着大语言模型在人工智能时代展现强大力量,可穿戴设备成为收集人体数据的重要载体。通过实时监测血压、心率、血糖等生命体征,结合AI边缘计算能力,医疗正向个性化转型。基因治疗、数字孪生技术让每个人都能拥有专属的医疗数字化身,实现从"报销型医疗"向"创新循证医疗"的转变,为疾病预防和健康管理带来革命性突破。
哥伦比亚大学研究团队开发了MathBode动态诊断工具,通过让数学题参数按正弦波变化来测试AI的动态推理能力。研究发现传统静态测试掩盖了AI的重要缺陷:几乎所有模型都表现出低通滤波特征和相位滞后现象,即在处理快速变化时会出现失真和延迟。该方法覆盖五个数学家族的测试,为AI模型选择和部署提供了新的评估维度。
在巴黎举办的欧洲开放基础设施峰会期间,专门用一整天时间讨论VMware迁移问题。博通收购VMware后许可证价格上涨,导致客户运营成本大幅增加。开源开发者展示了将VMware虚拟机迁移到开源替代方案的产品。Forrester分析师指出VMware客户对此感到信任破裂。OpenStack等开源解决方案虽然复杂度较高,但提供了健康的开源生态系统替代方案。
这项研究首次发现AI推理模型存在"雪球效应"问题——推理过程中的小错误会逐步放大,导致AI要么给出危险回答,要么过度拒绝正常请求。研究团队提出AdvChain方法,通过训练AI学习"错误-纠正"过程来获得自我纠错能力。实验显示该方法显著提升了AI的安全性和实用性,用1000个样本达到了传统方法15000个样本的效果,为AI安全训练开辟了新方向。