ZD至顶网软件频道消息:IBM的律师们去年成了忙碌的小蜜蜂,共为蓝色巨人的一众发明家成功申请了逾8000项专利。
IBM称旗下的发明家在2016年里平均每天被授权的专利达22项,全年共获8088项专利。其中2700项专利与人工智能、认知计算和云计算相关。
IBM首席执行官Ginny Rometty 在一份预先录制的发言里表示,“我们对我们的发明家在发现和科技方面作出的独特贡献深感骄傲,他们的贡献推动了企业和社会的进步及开启了认知业务的新时代。”
蓝色巨人IBM选了一些专利资料让读者一睹为快,包括2016年7月提交的专利 “用于公开域问答系统训练的机器学习模型”,该模型涉及到回答日常人类口语问题的机器学习。
其他更挑战智力的标题包括: “云计算环境中热点的主动识别“(涉及云计算系统寻找对用户产生重大影响的性能和资源瓶颈)和“网络计算环境的安全管理”。最后一项资料是关于通过更好的信息过滤减少网络钓鱼攻击的成功率的专利,其结果颇令人乐观。
笔者曾在IBM宣布 2015年专利成果时说过, “真的像Alexander Lukashenko在白俄罗斯连任总统选举时大获全胜一样平常。”
有趣的是,微软在专利申请10强里由第10位升至第8位——可能预示着微软将慢慢地回归自己曾在2009年的占据的第3位。英特尔从去年的第9上升到今年的第6,在过去12个月里共获得2700项专利。
IBM在预先录制的声明里表示,“虽然专利并不是创新的唯一指标,但对于IBM这样的公司而言,专利在如何创新、在哪里创新方面以及在这些市场的突破、增长和领导地位却是必不可少的基础。”毋容置言,大量专利的出现也将意味着全年无休的专利诉讼,白花花的银子将流入律师事务所的口袋。
好文章,需要你的鼓励
新加坡国立大学研究人员开发出名为AiSee的可穿戴辅助设备,利用Meta的Llama模型帮助视障人士"看见"周围世界。该设备采用耳机形态,配备摄像头作为AI伴侣处理视觉信息。通过集成大语言模型,设备从简单物体识别升级为对话助手,用户可进行追问。设备运行代理AI框架,使用量化技术将Llama模型压缩至10-30亿参数在安卓设备上高效运行,支持离线处理敏感文档,保护用户隐私。
阿里达摩院联合浙江大学推出VideoRefer套件,这是首个能够精确理解视频中特定物体的AI系统。该系统不仅能识别整体场景,更能针对用户指定的任何物体进行详细分析和跨时间追踪。研究团队构建了包含70万样本的高质量数据集VideoRefer-700K,并设计了全面的评估体系VideoRefer-Bench。实验显示该技术在专业视频理解任务中显著超越现有方法,在安防监控、自动驾驶、视频编辑等领域具有广阔应用前景。
OpenAI推出新AI模型GPT-5-Codex,能够在无用户协助下完成数小时的编程任务。该模型是GPT-5的改进版本,使用额外编码数据训练。测试显示,GPT-5-Codex可独立工作超过7小时,能自动发现并修复编码错误。在重构基准测试中得分51.3%,比GPT高出17%以上。模型可根据任务难度调整处理时间,简单请求处理速度显著提升。目前已在ChatGPT付费计划中提供。
Sa2VA是由UC默塞德等高校联合开发的突破性AI系统,首次实现图像视频的统一理解与精确分割。通过巧妙融合SAM-2视频分割技术和LLaVA多模态对话能力,Sa2VA能够同时进行自然对话和像素级物体标注。研究团队还构建了包含7万多个复杂视频表达式的Ref-SAV数据集,显著提升了AI在长文本描述和复杂场景下的表现。实验显示,Sa2VA在多个基准测试中达到业界领先水平,为视频编辑、医疗诊断、智能监控等领域带来新的应用可能性。