至顶网软件频道消息:2016年7月发生了一件奇怪的事情,软银(Softbank)以320亿美元的价格收购了强大的芯片设计商ARM。在对ARM的专利进行尽职调查时,这个通常会持续数周漫长而费力的过程,在短短几天内就会快速完成了。原因在于支持人工智能的软件相比人类来说可以轻松读取各种文档。软银董事长孙正义(左),ARM董事长Stuart Chambers(右)
Softbank和在收购期间代表ARM的Slaughter&May律师事务所使用相同的、基于AI的工具来搜索ARM和Softbank的专利组合。
Nigel Swycher说,这个搜索本来会花费数周时间,雇佣律师花费数千美元,但是他的创业公司Aistemos提供了一种专利查询工具。位于伦敦的Aistemos表示,它刚刚从包括英国风险投资公司Beringea在内的投资者们手中筹集了300万英镑(约合400万美元)。
像ARM和航空航天公司BAE Systems这样的公司正在越来越多地使用此类软件,不仅仅是为了减少专利律师费用,或者密切关注竞争对手,还要更广泛地寻找收购目标,甚至寻找许可机会。
最近,一家数字货币公司使用Aistemos找出谁在ATM现金转移领域持有专利。当这家公司向Swycher团队进行咨询的时候,很惊讶地发现它是持有此类专利的公司。“很多人持有他们自己都不知道的专利,”Swycher说。
Swycher认为,这个以人工智能为动力的软件可以在几秒钟内读取和分析数以千计的技术信息,打消关于现有哪些类型专利的困扰。
随着时间的推移,这也可能会打开一个现在还主要由专利律师来处理、规模数万亿美元的全球市场,覆盖到保险公司、工程师和市场营销专家。
最近由Aistemos委托撰写的一份报告表明,企业高管相信,如果专利所有权信息更容易获得的话,许可机会将增加6%。
Cipher关于自动驾驶技术的报告
Slaughter&May是专利诉讼领域一家领先的律师事务所,主要帮助企业在收购前做尽职调查。作为在Slaughter&May做了25年的合伙人,Swycher在2016年推出了Cipher工具。他回忆起“一生的伤疤”,在会议室里喝咖啡到凌晨3点,查询数千张纸的信息。
在所谓的数据室(或者说堆满专利文件的房间)中手动浏览文档不仅成本很高,而且有时候是徒劳的。Swycher回忆说,曾经他们在做一个规模十亿美元的交易,高管交易谈判的第60天问他的团队,被收购的公司是否实际拥有其业务的核心技术。
为了回答这个问题,一个由五人组成的团队花了两周的时间阅读专利文件并撰写报告,耗资约65000美元。终于到了交易谈判的第90天时,他们面临毁灭性的结果:同一项核心技术有四个其他专利持有者,其中一个在中国拥有独家许可。
这笔交易实际上已经停止了,但数万美元的咨询费用已经花出去了。
Aistemos创始人Nigel Swycher
Swycher说,这个过程很典型。“我的客户是做并购、许可、管理风险的人,而且我越来越感到沮丧的是,我们要做交易所需的信息并不存在。”
自2014年推出Cipher以来,Aistemos已经向包括ABB、Ocado和BAE Systems在内的约50家企业客户销售每年5万至10万美元的订阅。Swycher说,这种基于浏览器的工具(如FactSet)只回答了一个问题,即“谁在做什么?
在Cipher上一次搜索需要花费相当于10000美元的人工费用、两周时间。“一般我们的普通用户每年进行250次搜索,”他说,表明这一服务在使用大约六次后变得具有成本效益。
“知识产权正在某种程度上复苏。尽管这是一个存在了300年的资产类别,但最近才对如此多的公司来说变得非常重要。每天都有人提交新的知识产权,他们需要看看哪些是已经注册了的。”
好文章,需要你的鼓励
韩国科学技术院研究团队提出"分叉-合并解码"方法,无需额外训练即可改善音视频大语言模型的多模态理解能力。通过先独立处理音频和视频(分叉阶段),再融合结果(合并阶段),该方法有效缓解了模型过度依赖单一模态的问题,在AVQA、MUSIC-AVQA和AVHBench三个基准测试中均取得显著性能提升,特别是在需要平衡音视频理解的任务上表现突出。
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。