至顶网软件频道消息:Box和IBM正在推出两项新的服务,利用Watson的智能构建自定义的Box Skills。
Box Skills于10月份首次推出了一个框架,将机器学习应用于Box云内容管理平台。目的是使用人工智能帮助客户从他们的Box内容中提取见解和附加价值。
IBM在产品发布时已经签约成为Box Skills的合作伙伴,现在该公司推出了一项新的服务,利用了Watson视觉识别(Watson Visual Recognition)和Watson自然语言理解(Watson Natural Language Understanding)功能。图像洞察技能分析图像数据,用分类器对其进行标记,并训练定制的视觉模型以获取见解。
基于自然语言理解的文档洞察功能可以自动地用相关概念和关键字来标记存储在Box中的文档,以便于这些内容更易于被搜索。
除了将Watson技术应用于Box Skills之外,IBM还表示其还将通过Box Platform API将Watson AI应用于Box服务的其他用例。例如,IBM表示它已经构建了一个处理上传到Box的文档的服务,利用这项服务可以更容易地将这些文档翻译成其他语言。
去年十月,Box使用来自IBM Watson的技术推出了一项音频智能功能、利用微软认知服务(Microsoft Cognitive Services)提供了一项视频智能功能并利用谷歌云平台(Google Cloud Platform)的技术提供了一项图像智能功能,这些都是预览版。Box还提供了Skills Kit,让企业能够构建他们自己的定制化技能。
好文章,需要你的鼓励
浙江大学研究团队开发了ContextGen,这是首个能够同时精确控制多个对象位置和外观的AI图像生成系统。该系统通过情境布局锚定和身份一致性注意力两大创新机制,解决了传统AI在多对象场景中位置控制不准确和身份保持困难的问题,并创建了业界首个10万样本的专业训练数据集,在多项测试中超越现有技术。
谷歌推出升级版图像生成模型Nano Banana Pro,基于最新Gemini 3语言模型构建。新模型支持更高分辨率(2K/4K)、准确文本渲染、网络搜索功能,并提供专业级图像控制能力,包括摄像角度、场景光照、景深等。虽然质量更高但成本也相应增加,1080p图像费用为0.139美元。模型已集成到Gemini应用、NotebookLM等多个谷歌AI工具中,并通过API向开发者开放。
上海交通大学研究团队开发的SR-Scientist系统实现了人工智能在科学发现领域的重大突破。该系统能够像真正的科学家一样,从实验数据中自主发现数学公式,通过工具驱动的数据分析和长期优化机制,在四个科学领域的测试中比现有方法提高了6%-35%的精确度。这标志着AI从被动工具转变为主动科学发现者的重要里程碑。