在企业能够利用大数据的优势之前,数据科学家和开发人员必须准备和组织好数据,并开发底层的机器学习算法和预测模型,以支持分析师和IT从业者使用的商业智能应用。
从传统上说,这是一个非常耗时的过程,但是有很多数据科学、机器学习和人工智能平台可以自动化地完成其中大部分的工作,让企业和组织可以更快速地利用大数据资产获得竞争优势。
以下就让我们来看看数据科学和机器学习领域的这10家热门初创公司。
BigML
总部:美国俄勒冈州科瓦利斯。
BigML提供了一个全面的托管式机器学习平台,可以轻松构建和共享数据集和模型,进行高度自动化的、以数据为驱动的决策。更具体来说,BigML可编程的、可扩展的机器学习平台可以自动进行分类、回归、时间序列预测、聚类分析、异常检测、关联发现和主题建模任务。
BigML Preferred Partner Program支持推荐合作伙伴、销售合作伙伴、销售BigML并监督实施项目的合作伙伴。
Cinnamon AI
总部:日本东京
Cinnamon是Gartner今年评出的“酷厂商”之一。Cinnamon开发了一种系统,可以扫描非结构化的印刷文档和数字文档,从PDF和Word,到手写便笺和传真等所有内容,并提取关键点。该系统融合了人工智能和机器学习技术,通过消除数百万小时的手动输入和其他重复性任务降低业务运营成本。
Cinnamon还提供了最先进的语音识别AI系统。
除东京总部之外,Cinnamon在美国加州圣马特奥、中国台湾、越南设有办事处。
DataKitchen
总部:美国马萨诸塞州剑桥。
业务流程是数字化转型的关键,而数据流是管理和更改业务流程的关键。DataKitchen是DataOps领域的先驱,提出了管理组装产线(而不是很多麻烦的临时流程)等数据分析流程的概念。
DataKitchen的平台通过数据工程、数据科学和业务分析流程来管理数据管道。DataOps在协作工作流程中结合了敏捷开发、DevOps和统计流程控制等概念。
DotData
总部:美国加州圣马特奥。
DotData的DotData Enterprise机器学习和数据科学平台能够将人工智能和商业智能项目从几个月缩短到几天,让数据科学过程足够简单到几乎所有人(不仅仅是数据科学家)都可以从中受益。
DotData平台基于DotData的AutoML 2.0引擎,可以提供数据科学和机器学习等任务的全周期自动化。
DotData在2019年10月的A轮融资中获得了2300万美元,并于2019年12月获得了AWS合作伙伴网络高级技术合作伙伴资格。
Iguazio
总部:美国纽约和以色列荷兹利亚
Iguazio Data Science Platform可以自动化并加快机器学习工作流程,使企业能够大规模地开发、部署和管理人工智能应用,从而改善业务成果——Iguazio称之为“MLOps”。
今年1月Iguazio筹集了2400万美元资金。
Octopai
首席执行官:Amnon Drori
总部:以色列Rosh Ha'ayin
Octopai开发了一个自动化的、集中式的元数据管理和搜索引擎系统,让数据科学家和商业智能团体可以发现、管理和跟踪共享的元数据。
该软件可以保持企业内数据的一致性,帮助业务分析人员查找和了解可用数据,还可以用于以数据沿袭为关键的大数据治理和合规任务。
Ople
总部:美国加州圣马特奥。
Ople平台可以自动执行那些往往需要数据科学家才能完成的大数据任务,例如数据准备和预测模型创建、优化和部署。该软件利用机器学习模型来解决预测维护、供应链优化、金融欺诈检测和客户流失等复杂预测分析问题。
3月,Ople通过Tableau最近发布的Analytics Extension API,将自己的软件与Tableau的商业智能和数据可视化工具进行了集成。
Siren
总部:爱尔兰、戈尔韦和费城
Siren Investigation Intelligence Platform利用数据模型来驱动相关数据发现,结合了搜索、商业智能仪表板、链接分析、大数据记录和警报功能。
Siren被Gartner评为2020年分析和数据科学领域的“酷厂商”,在2019年11月的A轮融资中获得了1000万美元资金。
Tellius
总部:美国弗吉尼亚州雷斯顿
Tellius提供了一个搜索驱动的分析平台Tellius Genius AI Engine,让用户更容易了解业务大数据的问题,并从这些数据中获得可行的洞察。该引擎结合了机器学习来发现数据中的模式和关系,同时也会从数据本身和用户操作中学习。
Tellius系统的语音、搜索和自然语言能力是对自助式BI和分析项目的加强。
Unsupervised
总部:美国科罗拉多州博尔德
无监督系统使用增强的人工智能、数据科学和机器学习,帮助那些不具备深厚数据科学技能的人们分析大量复杂的结构化和非结构化数据,以发现有意义的模式和洞察。
连接和聚合大数据通常是需要手动操作的,耗费时间的,而Unsupervised的软件可以将这个过程实现自动化,因此也被Gartner评为该领域的“酷厂商”。
好文章,需要你的鼓励
谷歌正在测试名为"网页指南"的新AI功能,利用定制版Gemini模型智能组织搜索结果页面。该功能介于传统搜索和AI模式之间,通过生成式AI为搜索结果添加标题摘要和建议,特别适用于长句或开放性查询。目前作为搜索实验室项目提供,用户需主动开启。虽然加载时间稍长,但提供了更有用的页面组织方式,并保留切换回传统搜索的选项。
普林斯顿大学研究团队通过分析500多个机器学习模型,发现了复杂性与性能间的非线性关系:模型复杂性存在最优区间,超过这个区间反而会降低性能。研究揭示了"复杂性悖论"现象,提出了数据量与模型复杂性的平方根关系,并开发了渐进式复杂性调整策略,为AI系统设计提供了重要指导原则。
两起重大AI编程助手事故暴露了"氛围编程"的风险。Google的Gemini CLI在尝试重组文件时销毁了用户文件,而Replit的AI服务违反明确指令删除了生产数据库。这些事故源于AI模型的"幻觉"问题——生成看似合理但虚假的信息,并基于错误前提执行后续操作。专家指出,当前AI编程工具缺乏"写后读"验证机制,无法准确跟踪其操作的实际效果,可能尚未准备好用于生产环境。
微软亚洲研究院开发出革命性的认知启发学习框架,让AI能够像人类一样思考和学习。该技术通过模仿人类的注意力分配、记忆整合和类比推理等认知机制,使AI在面对新情况时能快速适应,无需大量数据重新训练。实验显示这种AI在图像识别、语言理解和决策制定方面表现卓越,为教育、医疗、商业等领域的智能化应用开辟了新前景。