微软的研究人员近日发布了实验性人工智能模型SpreadsheetLLM的详细信息,这个模型是与Excel以及Google Sheets等电子表格配合使用的。
微软在7月12日发表在Arxiv.org上的一篇研究论文中讨论了该模型,模型旨在解决将AI应用于电子表格的挑战,电子表格在商业世界中被广泛使用,但事实证明电子表格很难被大型语言模型掌握。
据微软研究人员称,SpreadsheetLLM采用了一种新颖的方法将电子表格内容编码为大型语言模型更容易使用的新格式,因此为这些模型“推理电子表格内容”铺平了道路。
研究人员强调了对这个特定AI领域迫切的改进需求。电子表格用于各种任务,从简单的数据输入和分析到复杂的财务建模和决策,但现有的大型语言模型很难理解和推理电子表格的内容,问题在于电子表格中数据具有高度结构化的性质,此外还有复杂的公式和引用。
据报道,SpreadsheetLLM通过以更适合大型语言模型的方式对电子表格数据进行编码来解决这个问题,这样就可以更好地理解电子表格内容。
为此,研究人员制定了一种名为SheetCompressor的新型编码机制,它保留了数据的结构和关系,同时使大型语言模型可以访问它。SheetCompressor特别将数据压缩高达96%,这样大型语言模型就可以在其token限制内处理大型数据集。
研究人员还强调了另一个称为“结构锚提取”的功能,可以识别定义表结构的关键行和列。同时,“倒排索引翻译”是一种高效编码单元格内容和地址以最小化冗余的方法,而“数据格式感知聚合”则有助于对以相似格式的单元格进行分组,从而进一步最小化token的使用。
研究人员在实验中发现,SpreadsheetLLM在电子表格的表格检测测试中取得了一些令人印象深刻的结果,比现有方法改进12.3%。此外,它在电子表格问答任务上也取得了突出的成绩。
SpreadsheetLLM被应用于一系列知名的大型语言模型,包括GPT-3.5、GPT-4和Llama 2,测试表明,它显著增强了这些模型在电子表格理解任务方面的能力。例如,GPT-4的表格检测得分为78.9%。
研究人员表示,SpreadsheetLLM仍是一种实验性的模型,在更复杂的电子表格格式方面存在一些局限性,但他们也相信它具有很大的潜力,例如,他们说该模型可以应用于诸如自动化常规数据分析等任务,以根据电子表格内容生成见解和建议。通过帮助大型语言模型理解电子表格、回答有关电子表格的问题,甚至根据自然语言提示创建新的电子表格,它为AI辅助数据分析和决策的新可能性打开了一扇大门。
SpreadsheetLLM 还可以帮助人类工作者更容易使用电子表格,因为很多人难以掌握Excel等工具更复杂的功能。使用电子表格的挑战之一,就是需要学习复杂的公式来操作其中的数据,但SpreadsheetLLM可以帮助用户使用自然语言命令来操作这些数据。
最后,研究人员表示,SpreadsheetLLM可以帮助对一些与电子表格相关的、更繁琐的任务实施自动化,例如数据清理、格式化和聚合。
Constellation Research分析师Holger Mueller表示,这项研究意义重大,因为有许多业务都依赖于Excel电子表格。“微软必须走在前沿,通过AI让Excel电子表格更易于访问。口头访问电子表格具有巨大的价值,无论是对于创建还是分析Excel文件来说。”
Mueller表示,AI还有可能使电子表格的使用变得普及,让任何人都能轻松地使用电子表格。他预测说:“如果微软能够正确地做到这一点,那么不仅会确保Excel的未来,还会改变我们所知的工作方式的未来。”
目前,SpreadsheetLLM只是一个研究项目,微软还没有表示是否有计划将其转化为实际产品。但不难想象,这项研究可能会打造出某种“Copilot for Excel”。
好文章,需要你的鼓励
Allen AI研究所联合多家顶尖机构推出SAGE智能视频分析系统,首次实现类人化的"任意时长推理"能力。该系统能根据问题复杂程度灵活调整分析策略,配备六种智能工具进行协同分析,在处理10分钟以上视频时准确率提升8.2%。研究团队创建了包含1744个真实娱乐视频问题的SAGE-Bench评估平台,并采用创新的AI生成训练数据方法,为视频AI技术的实际应用开辟了新路径。
联想推出新一代NVMe存储解决方案DE6600系列,包含全闪存DE6600F和混合存储DE6600H两款型号。该系列产品延迟低于100微秒,支持多种连接协议,2U机架可容纳24块NVMe驱动器。容量可从367TB扩展至1.798PiB全闪存或7.741PiB混合配置,适用于AI、高性能计算、实时分析等场景,并配备双活控制器和XClarity统一管理平台。
中科院团队首次系统评估了AI视觉模型在文本压缩环境下的理解能力,发现虽然AI能准确识别压缩图像中的文字,但在理解深层含义、建立关联推理方面表现不佳。研究通过VTCBench测试系统揭示了AI存在"位置偏差"等问题,为视觉文本压缩技术的改进指明方向。