谷歌云(Google Cloud)近日分享了三家初创公司是如何利用谷歌的“数据云”,使用Google BigQuery、Cloud Storage以及Vertex AI等服务作为他们以数据为中心的业务的一大基础。
谷歌云副总裁、数据库和分析总经理Gerrit Kazmaier在一篇博客文章中,介绍了Ocient、SingleStore和Glean Technologies是如何利用谷歌云的大数据技术来创建全新的产品,从而将信息转化为客户的实时价值。
Kazmaier说:“数据是当今组织最有价值的资产之一,数据可以让企业做出令人难以置信的事情,比如为医院创造更好的健康全景,让人们能够与同事及时分享洞察,并且对于那些在数据云中构建产品和业务的初创公司来说,数据正越来越多成为一种基础构建块。”
Ocient是一家超大规模数据仓库和分析初创公司,让企业能够对数据进行大规模并行处理,从数万亿条数据记录中获取实时洞察。Ocient的数据仓库架构设计中,计算是与NVMe固态驱动器存储相邻的。
这实现了从大量数据集中连续摄取信息。此外,Ocient还采用了数据库内提取、交易和加载以及机器学习来帮助客户以极高的速度转换、加载然后分析那些经过处理的数据查询,并且性价比非常突出。
考虑到平台规模庞大,Ocient决定采用Google Cloud Storage来加载文件,利用Google Compute Engine运行分析工具,并使用谷歌的网络工具来确保高可扩展性、更好的安全性和更快速的分析。
Kazmaier说:“在短短三个月内,Ocient对谷歌云的使用量就增加了一倍多,用于支持企业在谷歌云上的转型工作负载。”
SingleStore是另一家快速发展中的初创公司,该公司也越来越依赖谷歌云。最近SingleStore在Google Cloud Marketplace上推出了他们的平台,提供了一项服务可以提供对大型数据集的低延迟访问。SingleStore通过将事务和分析引入一个单一的统一数据引擎(称为SingleStoreDB)来帮助开发人员简化应用开发。
Kazmaier解释说:“Singlestore通过集成谷歌云服务,实现了可扩展且高度可用的实施。除了通过在Google Cloud Marketplace上吸引更多客户来发展业务之外,SingleStore最近还宣布与谷歌云建立面市战略,使他们能够进一步面向全球客户提供他们的数据库解决方案。”
至于Glean,该公司正在使用谷歌云的数据服务来扩展一个强大的统一搜索工具,该工具旨在搜索和处理组织整个已部署应用集的查询。该工具可以理解行为、上下文、语言和关系,为和任何工作场所应用相关的查询提供即时的个性化答案。Glean透露,他们使用谷歌云服务组合(包括Cloud SQL、Google Kubernetes Engine、Vertex AI、Dataflow和BigQuery)构建了他们的搜索和知识发现工具。
Glean表示,他们借助谷歌服务变得更加敏捷并且可以更快地迭代,并让开发团队把更多时间集中在改进搜索工具的性能、答案相关性以及提高易用性上。
近日,Glean宣布与谷歌云建立正式合作伙伴关系,Glean的搜索工具将通过Google Cloud Marketplace提供。
好文章,需要你的鼓励
当前企业面临引入AI的机遇与挑战。管理层需要了解机器学习算法基础,包括线性回归、神经网络等核心技术。专家建议从小规模试点开始,优先选择高影响用例,投资数据治理,提升员工技能。对于影子IT现象,应将其视为机会而非问题,建立治理流程将有效工具正式化。成功的AI采用需要明确目标、跨部门协作、变革管理和持续学习社区建设。
这项由东京科学技术大学等机构联合发布的研究提出了UMoE架构,通过重新设计注意力机制,实现了注意力层和前馈网络层的专家参数共享。该方法在多个数据集上显著优于现有的MoE方法,同时保持了较低的计算开销,为大语言模型的高效扩展提供了新思路。
美国垃圾收集行业2024年创收690亿美元,近18万辆垃圾车每周运营六至七天,每日停靠超千次。设备故障成为行业最大隐性成本,每辆车年均故障费用超5000美元。AI技术通过实时监控传感器数据,能提前数周预测故障,优化零部件库存管理,减少重复维修。车队报告显示,预测性维护每辆车年节省高达2500美元,显著提升运营效率和服务可靠性。
小米团队开发的MiMo-7B模型证明了AI领域"小而精"路线的可行性。这个仅有70亿参数的模型通过创新的预训练数据处理、三阶段训练策略和强化学习优化,在数学推理和编程任务上超越了320亿参数的大模型,甚至在某些指标上击败OpenAI o1-mini。研究团队还开发了高效的训练基础设施,将训练速度提升2.29倍。该成果已完全开源,为AI民主化发展提供了新思路。