微软发布实验性SpreadsheetLLM模型帮助AI更好理解电子表格

微软的研究人员近日发布了实验性人工智能模型SpreadsheetLLM的详细信息，这个模型是与Excel以及Google Sheets等电子表格配合使用的。

微软在7月12日发表在Arxiv.org上的一篇研究论文中讨论了该模型，模型旨在解决将AI应用于电子表格的挑战，电子表格在商业世界中被广泛使用，但事实证明电子表格很难被大型语言模型掌握。

据微软研究人员称，SpreadsheetLLM采用了一种新颖的方法将电子表格内容编码为大型语言模型更容易使用的新格式，因此为这些模型“推理电子表格内容”铺平了道路。

研究人员强调了对这个特定AI领域迫切的改进需求。电子表格用于各种任务，从简单的数据输入和分析到复杂的财务建模和决策，但现有的大型语言模型很难理解和推理电子表格的内容，问题在于电子表格中数据具有高度结构化的性质，此外还有复杂的公式和引用。

据报道，SpreadsheetLLM通过以更适合大型语言模型的方式对电子表格数据进行编码来解决这个问题，这样就可以更好地理解电子表格内容。

为此，研究人员制定了一种名为SheetCompressor的新型编码机制，它保留了数据的结构和关系，同时使大型语言模型可以访问它。SheetCompressor特别将数据压缩高达96%，这样大型语言模型就可以在其token限制内处理大型数据集。

研究人员还强调了另一个称为“结构锚提取”的功能，可以识别定义表结构的关键行和列。同时，“倒排索引翻译”是一种高效编码单元格内容和地址以最小化冗余的方法，而“数据格式感知聚合”则有助于对以相似格式的单元格进行分组，从而进一步最小化token的使用。

研究人员在实验中发现，SpreadsheetLLM在电子表格的表格检测测试中取得了一些令人印象深刻的结果，比现有方法改进12.3%。此外，它在电子表格问答任务上也取得了突出的成绩。

SpreadsheetLLM被应用于一系列知名的大型语言模型，包括GPT-3.5、GPT-4和Llama 2，测试表明，它显著增强了这些模型在电子表格理解任务方面的能力。例如，GPT-4的表格检测得分为78.9%。

研究人员表示，SpreadsheetLLM仍是一种实验性的模型，在更复杂的电子表格格式方面存在一些局限性，但他们也相信它具有很大的潜力，例如，他们说该模型可以应用于诸如自动化常规数据分析等任务，以根据电子表格内容生成见解和建议。通过帮助大型语言模型理解电子表格、回答有关电子表格的问题，甚至根据自然语言提示创建新的电子表格，它为AI辅助数据分析和决策的新可能性打开了一扇大门。

SpreadsheetLLM 还可以帮助人类工作者更容易使用电子表格，因为很多人难以掌握Excel等工具更复杂的功能。使用电子表格的挑战之一，就是需要学习复杂的公式来操作其中的数据，但SpreadsheetLLM可以帮助用户使用自然语言命令来操作这些数据。

最后，研究人员表示，SpreadsheetLLM可以帮助对一些与电子表格相关的、更繁琐的任务实施自动化，例如数据清理、格式化和聚合。

Constellation Research分析师Holger Mueller表示，这项研究意义重大，因为有许多业务都依赖于Excel电子表格。“微软必须走在前沿，通过AI让Excel电子表格更易于访问。口头访问电子表格具有巨大的价值，无论是对于创建还是分析Excel文件来说。”

Mueller表示，AI还有可能使电子表格的使用变得普及，让任何人都能轻松地使用电子表格。他预测说：“如果微软能够正确地做到这一点，那么不仅会确保Excel的未来，还会改变我们所知的工作方式的未来。”

目前，SpreadsheetLLM只是一个研究项目，微软还没有表示是否有计划将其转化为实际产品。但不难想象，这项研究可能会打造出某种“Copilot for Excel”。

来源：至顶网软件与服务频道

0赞

好文章，需要你的鼓励

微软发布实验性SpreadsheetLLM模型 帮助AI更好理解电子表格

来源：至顶网软件与服务频道

2024

07/19

10:46

分享

点赞

数智时代，openGauss Summit 2025即将发布哪些技术创新破局

“算力+储能”深度融合：超智算发布分布式算力超级节点储能解决方案

联想推出DE6600系列：更智能的存储解决方案

创业公司如何在严格监管行业中实现生死攸关的创新

OpenAI发布GPT-5.2-Codex模型，软件工程自动化能力大幅提升

Waterfox浏览器宣布拒绝AI功能，瞄准Firefox忠实用户

TikTok美国业务出售交易将于下月完成

破局AI数据中心安全瓶颈：Fortinet联合NVIDIA引领隔离式加速新航向

智算中心进化论，科华数据如何做到“更懂”

更高负载、更快建设：2026年数据中心六大趋势

Snowflake数据库更新引发全球大规模服务中断

AI编程初创公司Lovable融资3.3亿美元，英伟达等科技巨头支持

性能狂飙70%！宝德 x 京东云AI存储一体机新品上市，重塑行业标杆

思科与英伟达扩大合作，助力企业加速应用AI技术

两位前谷歌软件工程师，用AI改写黑夜成像规则

德勤2025技术趋势报告，AI与企业未来的交汇

思科在Cisco Live阿姆斯特丹大会上展示简洁、安全和AI就绪的创新技术

区分“模型”和“应用”是对AI最大的误解

终端侧AI，如何从DeepSeek的连锁反应中受益？

Gartner发布2025年及未来中国企业实现AI价值的重要预测

专访DeepMind CEO：我们距离实现AGI只需5-10年

企业AI是确定性的长期主义

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

微软发布实验性SpreadsheetLLM模型帮助AI更好理解电子表格