ZD至顶网软件频道消息:从一开始,谷歌云平台(Google Cloud Platform,GCP)的核心价值定位就是让企业享受到谷歌自己用来运行自身业务所用的相同基础设施和高级软件。
回顾历史,这也是Amazon Web Services最初的价值定位。由于亚马逊运行着一个遍及全球的交易业务,为什么不让企业客户一同参与其中呢?十年过去了,我们现在知道了这个想法的实现情况。
谷歌的秘密武器就是其计算基础设施的高度自动化,以及融入其自身业务的人工智能。作为消费者,我们看到了这些成果:我们在Google Maps上消耗流量数据,通过使用安卓手机拍下的大量照片看到背后的故事,当然,还有使用谷歌的搜索结果。作为IT人,我们讨论了谷歌NoOps对IT管理的愿景。
考虑到谷歌作为大众消费服务的传统,所以谷歌更多地是以面向消费者——而不是专注企业——这早已不足为怪了。
而且考虑到下一代NoOps是专注于谷歌的IT基础设施,所以Google Compute Cloud的早期企业参考大多都是不太可能实现的——而非有点希望的——也就不奇怪了。例如,可口可乐考虑GCP是因为它有可以针对全球营销活动进行扩展的基础设施,让消费者可以获得他们在2014年世界杯上的图片放到Happiness Flag上。
如果你观察已经发布了的机器学习API,这些仍然很大程度上反映了谷歌在消费级领域的传统。例如旨在目标中识别朋友、情绪或者表达的视觉功能,或者识别像埃菲尔铁塔这样的地标。
通过这一波发布,谷歌在消费者业务上的中心将发生变化——这是谷歌从一开始就强调的。谷歌意识到,机器学习作为一项业务,如果抱着“让开展的业务顺其自然发展”的心态,那么就不会实现成长。所以现在谷歌正在打造一个专注于机器学习的产品部门,涉足专业服务以帮助企业客户找出如何利用机器学习,并开始更多地从产品角度思考问题。
核心产品——谷歌云机器学习(Google Cloud Machine Learning)在经过了大量漏洞修复的测试期之后于近日刚刚开始全面供货。谷歌进入的这个市场,其他提供商像是Amazon和微软(还有像Databricks这样的利基公司)都已经提供了机器学习服务——IBM也刚刚宣布推出了一款产品。
现在还相当于机器学习的早期阶段,每家厂商的云服务几乎没有可比性。例如,作为谷歌云机器学习的“心脏”——TensorFlow是针对深度学习(模仿人类思维和决策),Amazon的机器学习服务解决像分类这样的不那么野心勃勃的任务。
除了面向数据科学家的谷歌云机器学习之外,谷歌还有大量机器学习云服务现在是面向开发者的,云翻译、语音、视觉和自然语言处理API。
一个早期结果就是还在测试中的Jobs API。这是一个谷歌内部需求催生的API,目标是通过更智能的、更多以数据的方式将职位与后选择进行匹配来完善招聘。这是谷歌和其他公司需要将机器学习更多地运用到更主流的企业级市场中的一种垂直应用。最终,对于更加垂直的机器学习应用的需求将至受限于我们的想象力。
虽然很多大学计划培育更多的数据工程师和数据科学家,但是这些还不足以让他们像SQL开发者那样普遍。
其他例子包括针对大批量任务——例如翻译数千个点电子邮件或者文档——的高级版Translate API,这对于那些需要大范围采用该技术的企业是很有用处的。针对视觉API来说,有新的以业务为中心的功能可以检测像企业标识这样的东西。
对消费者来说,机器学习已经存在于我们身边,当Amazon或者eBay向你显示下一个最优报价或者当Netflix提出项目建议的时候,其实你已经在使用机器学习了。谷歌在向企业售卖机器学习和人工智能中,显示了他们从零开始做这件事时就已经面对的挑战。
好文章,需要你的鼓励
邻里社交应用Nextdoor推出重新设计版本,新增本地新闻、实时警报和名为"Faves"的AI功能,用于发现本地商户和地点。该应用与3500家本地出版商合作提供新闻内容,通过Samdesk和Weather.com提供天气、交通、停电等实时警报。Faves功能利用15年邻里对话数据训练的大语言模型,为用户提供本地化AI推荐服务,帮助用户找到最佳餐厅、徒步地点等本地信息。
Skywork AI推出的第二代多模态推理模型R1V2,通过创新的混合强化学习方法,成功解决了AI"慢思考"策略在视觉推理中的挑战。该模型在保持强大推理能力的同时有效控制视觉幻觉,在多项权威测试中超越同类开源模型,某些指标甚至媲美商业产品,为开源AI发展树立了新标杆。
英国生物银行完成了世界上最大规模的全身成像项目,收集了10万名志愿者的超过10亿次扫描数据,用于研究人体衰老和疾病过程。该项目历时11年,每次扫描耗时5小时,投资6200万英镑。目前已有8万人的成像数据供全球研究人员使用,剩余数据将于年底前发布。项目已开发出能预测38种常见疾病的AI工具,并在心脏病、痴呆症和癌症诊断方面取得突破。
这项由北京大学等多所高校联合完成的研究,首次对OpenAI GPT-4o的图像生成能力进行了全面评估。研究团队设计了名为GPT-ImgEval的综合测试体系,从文本转图像、图像编辑和知识驱动创作三个维度评估GPT-4o,发现其在所有测试中都显著超越现有方法。研究还通过技术分析推断GPT-4o采用了自回归与扩散相结合的混合架构,并发现其生成图像仍可被现有检测工具有效识别,为AI图像生成领域提供了重要的评估基准和技术洞察。