ZDNet至顶网软件频道消息: 本周二,IBM公司公布了其沃森TK移动开发者挑战赛的三家优胜方,这意味着人丁稀少的沃森合作伙伴清单再添三位新成员。各合作方将共同致力于将沃森这一独特的智能化品牌引入自己的应用程序——此时距离蓝色巨人公布沃森开发者云项目已经过去七个月,所以IBM恐怕还要继续加快前进步伐才是。
在此次移动开发者挑战赛中胜出的厂商分别为GenieMD、Majestyk Apps以及Red Ant公司,三家企业将拥有访问沃森云的资格并在以此创建自有应用程序及业务的过程中获得IBM方面的支持。蓝色巨人还宣布至少有其它八家企业开始在沃森云中创建应用程序,其中一部分已经在对项目进行投资。根据IBM方面一位发言人的说法,全部其它22家移动应用挑战赛的参与者仍然有机会访问沃森云,本次比赛共收到超过2500款参评应用程序。
不过正如我之前在文章中提到,真正能让沃森如IBM所愿转化为价值上百万美元庞大业务的关键在于向全部开发商彻底开放相关API。单纯在应用程序处理过程中提供访问权限——也就是目前的作法——既不足以带来充足的资金收益(IBM无疑意识到了这个问题)、也无法真正为沃森带来令人眼前一亮的王牌应用创新思路。IBM公司宣称其有计划在未来彻底开放这套云平台,当然这段周期是越短越好。
谁知道呢:在合适的开发商眼中,利用IBM的技术平台来创建应用成果也许并不仅仅是一种宣传噱头。不过IBM方面的一位发言人在邮件中指出,“就目前而言,这套应用程序处理机制有助于确保用例始终与沃森的处理能力相匹配。随着其认知能力的不断提升——这一提升过程将不断加速——最终沃森将彻底摆脱这种使用方式限制。”
认知计算是一种大多数开发者之前很少接触过的迥异计算类型,不过沃森并不是惟一一种可以通过API加以利用的人工智能技术。AlchemyAPI目前正推出基于深层学习的文本分析与计算机视觉服务,而Expect实验室则专门为智能化建议提供API。二者都采取免费商业模式,并且向任何有意愿注册的用户大敞开放之门。如果一切进展顺利,可能会有更多开发商愿意加入到对沃森的实验性使用中来、并希望IBM能够尽量减少相关限制条款。
随着Structure大会的日益临近(本届大会将在六月十八到十九号两天于旧金山举行),我的脑海中冒出了一个新鲜的念头——在过去几年中到底有多少能够简化开发者工具访问流程的创新机制涌现出来,这类工具又实际融入了多少家企业的开发环境当中?开发者们的鼎力支持造就了Amazon Web Services、New Relic与Heroku——这些用户愿意为此支付账单,而且更重要的是,他们用自己的灵感推动了新功能与新型产品战略的出现。
正如其他始终密切关注人工智能领域的技术人士一样,我也希望沃森的API能够被交付到数百万开发者手中,更希望看到IBM由此迎来真实存在的业务运营成果。不过如果这一切在短时间内尚无法实现,我猜测来自新兴企业甚至是谷歌与微软的同类技术将抢先一步,并在开发者市场上引发巨大反响。因为无论IBM要花多长时间来打开沃森的开放大门,技术发展的浪潮是不会停歇的。
要了解更多关于IBM沃森云项目前景展望的消息,请观看下面这段由IBM沃森业务部门副总裁Stephen Gold与AlchemyAPI公司创始人Eliot Turner在本届Structure Data大会上带来的对话。
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。