ZD至顶网软件频道消息:从一开始,谷歌云平台(Google Cloud Platform,GCP)的核心价值定位就是让企业享受到谷歌自己用来运行自身业务所用的相同基础设施和高级软件。
回顾历史,这也是Amazon Web Services最初的价值定位。由于亚马逊运行着一个遍及全球的交易业务,为什么不让企业客户一同参与其中呢?十年过去了,我们现在知道了这个想法的实现情况。
谷歌的秘密武器就是其计算基础设施的高度自动化,以及融入其自身业务的人工智能。作为消费者,我们看到了这些成果:我们在Google Maps上消耗流量数据,通过使用安卓手机拍下的大量照片看到背后的故事,当然,还有使用谷歌的搜索结果。作为IT人,我们讨论了谷歌NoOps对IT管理的愿景。
考虑到谷歌作为大众消费服务的传统,所以谷歌更多地是以面向消费者——而不是专注企业——这早已不足为怪了。
而且考虑到下一代NoOps是专注于谷歌的IT基础设施,所以Google Compute Cloud的早期企业参考大多都是不太可能实现的——而非有点希望的——也就不奇怪了。例如,可口可乐考虑GCP是因为它有可以针对全球营销活动进行扩展的基础设施,让消费者可以获得他们在2014年世界杯上的图片放到Happiness Flag上。
如果你观察已经发布了的机器学习API,这些仍然很大程度上反映了谷歌在消费级领域的传统。例如旨在目标中识别朋友、情绪或者表达的视觉功能,或者识别像埃菲尔铁塔这样的地标。
通过这一波发布,谷歌在消费者业务上的中心将发生变化——这是谷歌从一开始就强调的。谷歌意识到,机器学习作为一项业务,如果抱着“让开展的业务顺其自然发展”的心态,那么就不会实现成长。所以现在谷歌正在打造一个专注于机器学习的产品部门,涉足专业服务以帮助企业客户找出如何利用机器学习,并开始更多地从产品角度思考问题。
核心产品——谷歌云机器学习(Google Cloud Machine Learning)在经过了大量漏洞修复的测试期之后于近日刚刚开始全面供货。谷歌进入的这个市场,其他提供商像是Amazon和微软(还有像Databricks这样的利基公司)都已经提供了机器学习服务——IBM也刚刚宣布推出了一款产品。
现在还相当于机器学习的早期阶段,每家厂商的云服务几乎没有可比性。例如,作为谷歌云机器学习的“心脏”——TensorFlow是针对深度学习(模仿人类思维和决策),Amazon的机器学习服务解决像分类这样的不那么野心勃勃的任务。
除了面向数据科学家的谷歌云机器学习之外,谷歌还有大量机器学习云服务现在是面向开发者的,云翻译、语音、视觉和自然语言处理API。
一个早期结果就是还在测试中的Jobs API。这是一个谷歌内部需求催生的API,目标是通过更智能的、更多以数据的方式将职位与后选择进行匹配来完善招聘。这是谷歌和其他公司需要将机器学习更多地运用到更主流的企业级市场中的一种垂直应用。最终,对于更加垂直的机器学习应用的需求将至受限于我们的想象力。
虽然很多大学计划培育更多的数据工程师和数据科学家,但是这些还不足以让他们像SQL开发者那样普遍。
其他例子包括针对大批量任务——例如翻译数千个点电子邮件或者文档——的高级版Translate API,这对于那些需要大范围采用该技术的企业是很有用处的。针对视觉API来说,有新的以业务为中心的功能可以检测像企业标识这样的东西。
对消费者来说,机器学习已经存在于我们身边,当Amazon或者eBay向你显示下一个最优报价或者当Netflix提出项目建议的时候,其实你已经在使用机器学习了。谷歌在向企业售卖机器学习和人工智能中,显示了他们从零开始做这件事时就已经面对的挑战。
好文章,需要你的鼓励
CoreWeave发布AI对象存储服务,采用本地对象传输加速器(LOTA)技术,可在全球范围内高速传输对象数据,无出口费用或请求交易分层费用。该技术通过智能代理在每个GPU节点上加速数据传输,提供高达每GPU 7 GBps的吞吐量,可扩展至数十万个GPU。服务采用三层自动定价模式,为客户的AI工作负载降低超过75%的存储成本。
莫斯科高等经济学院研究员尼古拉·斯克里普科开发了IFEval-FC基准测试,专门评估大语言模型在函数调用中遵循格式指令的能力。研究发现,即使是GPT-5和Claude Opus 4.1等最先进模型,在处理看似简单的格式要求时准确率也不超过80%,揭示了AI在实际应用中的重要局限性。
谷歌DeepMind与核聚变初创公司CFS合作,运用先进AI模型帮助管理和改进即将发布的Sparc反应堆。DeepMind开发了名为Torax的专用软件来模拟等离子体,结合强化学习等AI技术寻找最佳核聚变控制方式。核聚变被视为清洁能源的圣杯,可提供几乎无限的零碳排放能源。谷歌已投资CFS并承诺购买其200兆瓦电力。
上海人工智能实验室联合多家机构推出MinerU2.5文档解析模型,仅用12亿参数就在文本、公式、表格识别等任务上全面超越GPT-4o等大型模型。该模型采用创新的两阶段解析策略,先进行全局布局分析再做局部精细识别,计算效率提升一个数量级。通过重新定义任务标准和构建高质量数据引擎,MinerU2.5能准确处理旋转表格、复杂公式、多语言文档等挑战性内容,为文档数字化提供了高效解决方案。