微软发布实验性SpreadsheetLLM模型帮助AI更好理解电子表格

微软的研究人员近日发布了实验性人工智能模型SpreadsheetLLM的详细信息，这个模型是与Excel以及Google Sheets等电子表格配合使用的。

微软在7月12日发表在Arxiv.org上的一篇研究论文中讨论了该模型，模型旨在解决将AI应用于电子表格的挑战，电子表格在商业世界中被广泛使用，但事实证明电子表格很难被大型语言模型掌握。

据微软研究人员称，SpreadsheetLLM采用了一种新颖的方法将电子表格内容编码为大型语言模型更容易使用的新格式，因此为这些模型“推理电子表格内容”铺平了道路。

研究人员强调了对这个特定AI领域迫切的改进需求。电子表格用于各种任务，从简单的数据输入和分析到复杂的财务建模和决策，但现有的大型语言模型很难理解和推理电子表格的内容，问题在于电子表格中数据具有高度结构化的性质，此外还有复杂的公式和引用。

据报道，SpreadsheetLLM通过以更适合大型语言模型的方式对电子表格数据进行编码来解决这个问题，这样就可以更好地理解电子表格内容。

为此，研究人员制定了一种名为SheetCompressor的新型编码机制，它保留了数据的结构和关系，同时使大型语言模型可以访问它。SheetCompressor特别将数据压缩高达96%，这样大型语言模型就可以在其token限制内处理大型数据集。

研究人员还强调了另一个称为“结构锚提取”的功能，可以识别定义表结构的关键行和列。同时，“倒排索引翻译”是一种高效编码单元格内容和地址以最小化冗余的方法，而“数据格式感知聚合”则有助于对以相似格式的单元格进行分组，从而进一步最小化token的使用。

研究人员在实验中发现，SpreadsheetLLM在电子表格的表格检测测试中取得了一些令人印象深刻的结果，比现有方法改进12.3%。此外，它在电子表格问答任务上也取得了突出的成绩。

SpreadsheetLLM被应用于一系列知名的大型语言模型，包括GPT-3.5、GPT-4和Llama 2，测试表明，它显著增强了这些模型在电子表格理解任务方面的能力。例如，GPT-4的表格检测得分为78.9%。

研究人员表示，SpreadsheetLLM仍是一种实验性的模型，在更复杂的电子表格格式方面存在一些局限性，但他们也相信它具有很大的潜力，例如，他们说该模型可以应用于诸如自动化常规数据分析等任务，以根据电子表格内容生成见解和建议。通过帮助大型语言模型理解电子表格、回答有关电子表格的问题，甚至根据自然语言提示创建新的电子表格，它为AI辅助数据分析和决策的新可能性打开了一扇大门。

SpreadsheetLLM 还可以帮助人类工作者更容易使用电子表格，因为很多人难以掌握Excel等工具更复杂的功能。使用电子表格的挑战之一，就是需要学习复杂的公式来操作其中的数据，但SpreadsheetLLM可以帮助用户使用自然语言命令来操作这些数据。

最后，研究人员表示，SpreadsheetLLM可以帮助对一些与电子表格相关的、更繁琐的任务实施自动化，例如数据清理、格式化和聚合。

Constellation Research分析师Holger Mueller表示，这项研究意义重大，因为有许多业务都依赖于Excel电子表格。“微软必须走在前沿，通过AI让Excel电子表格更易于访问。口头访问电子表格具有巨大的价值，无论是对于创建还是分析Excel文件来说。”

Mueller表示，AI还有可能使电子表格的使用变得普及，让任何人都能轻松地使用电子表格。他预测说：“如果微软能够正确地做到这一点，那么不仅会确保Excel的未来，还会改变我们所知的工作方式的未来。”

目前，SpreadsheetLLM只是一个研究项目，微软还没有表示是否有计划将其转化为实际产品。但不难想象，这项研究可能会打造出某种“Copilot for Excel”。

来源：至顶网软件与服务频道

0赞

好文章，需要你的鼓励

微软发布实验性SpreadsheetLLM模型 帮助AI更好理解电子表格

来源：至顶网软件与服务频道

2024

07/19

10:46

分享

点赞

OpenAI在版权诉讼中疑因隐瞒证据遭遇重大危机

外科医生远程操控人形机器人，完成全球首例活猪手术

OpenAI发布ChatGPT Work：AI助手可连续工作数小时

欧盟向Meta施压：关闭自动播放和无限滚动，否则面临巨额罚款

世界模型的潜力与局限：它真的能模拟一切吗？

苹果起诉OpenAI：前员工利用系统漏洞窃取商业机密

如何利用开源AI智能体实现工作流程自动化

Cloudzy 云服务评测：VPS 性能与体验全面解析

这款PCIe插卡内置38核至强处理器与64GB内存，堪称完整服务器

是否该为企业招募数字员工？AI 智能体团队搭建全指南

AI赋能自主机器人：从工厂走向家庭的未来图景

数据中心能源需求威胁特朗普"美国制造"计划

性能狂飙70%！宝德 x 京东云AI存储一体机新品上市，重塑行业标杆

思科与英伟达扩大合作，助力企业加速应用AI技术

两位前谷歌软件工程师，用AI改写黑夜成像规则

德勤2025技术趋势报告，AI与企业未来的交汇

思科在Cisco Live阿姆斯特丹大会上展示简洁、安全和AI就绪的创新技术

区分“模型”和“应用”是对AI最大的误解

终端侧AI，如何从DeepSeek的连锁反应中受益？

Gartner发布2025年及未来中国企业实现AI价值的重要预测

专访DeepMind CEO：我们距离实现AGI只需5-10年

企业AI是确定性的长期主义

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

微软发布实验性SpreadsheetLLM模型帮助AI更好理解电子表格