微软的研究人员近日发布了实验性人工智能模型SpreadsheetLLM的详细信息,这个模型是与Excel以及Google Sheets等电子表格配合使用的。
微软在7月12日发表在Arxiv.org上的一篇研究论文中讨论了该模型,模型旨在解决将AI应用于电子表格的挑战,电子表格在商业世界中被广泛使用,但事实证明电子表格很难被大型语言模型掌握。
据微软研究人员称,SpreadsheetLLM采用了一种新颖的方法将电子表格内容编码为大型语言模型更容易使用的新格式,因此为这些模型“推理电子表格内容”铺平了道路。
研究人员强调了对这个特定AI领域迫切的改进需求。电子表格用于各种任务,从简单的数据输入和分析到复杂的财务建模和决策,但现有的大型语言模型很难理解和推理电子表格的内容,问题在于电子表格中数据具有高度结构化的性质,此外还有复杂的公式和引用。
据报道,SpreadsheetLLM通过以更适合大型语言模型的方式对电子表格数据进行编码来解决这个问题,这样就可以更好地理解电子表格内容。
为此,研究人员制定了一种名为SheetCompressor的新型编码机制,它保留了数据的结构和关系,同时使大型语言模型可以访问它。SheetCompressor特别将数据压缩高达96%,这样大型语言模型就可以在其token限制内处理大型数据集。
研究人员还强调了另一个称为“结构锚提取”的功能,可以识别定义表结构的关键行和列。同时,“倒排索引翻译”是一种高效编码单元格内容和地址以最小化冗余的方法,而“数据格式感知聚合”则有助于对以相似格式的单元格进行分组,从而进一步最小化token的使用。
研究人员在实验中发现,SpreadsheetLLM在电子表格的表格检测测试中取得了一些令人印象深刻的结果,比现有方法改进12.3%。此外,它在电子表格问答任务上也取得了突出的成绩。
SpreadsheetLLM被应用于一系列知名的大型语言模型,包括GPT-3.5、GPT-4和Llama 2,测试表明,它显著增强了这些模型在电子表格理解任务方面的能力。例如,GPT-4的表格检测得分为78.9%。
研究人员表示,SpreadsheetLLM仍是一种实验性的模型,在更复杂的电子表格格式方面存在一些局限性,但他们也相信它具有很大的潜力,例如,他们说该模型可以应用于诸如自动化常规数据分析等任务,以根据电子表格内容生成见解和建议。通过帮助大型语言模型理解电子表格、回答有关电子表格的问题,甚至根据自然语言提示创建新的电子表格,它为AI辅助数据分析和决策的新可能性打开了一扇大门。
SpreadsheetLLM 还可以帮助人类工作者更容易使用电子表格,因为很多人难以掌握Excel等工具更复杂的功能。使用电子表格的挑战之一,就是需要学习复杂的公式来操作其中的数据,但SpreadsheetLLM可以帮助用户使用自然语言命令来操作这些数据。
最后,研究人员表示,SpreadsheetLLM可以帮助对一些与电子表格相关的、更繁琐的任务实施自动化,例如数据清理、格式化和聚合。
Constellation Research分析师Holger Mueller表示,这项研究意义重大,因为有许多业务都依赖于Excel电子表格。“微软必须走在前沿,通过AI让Excel电子表格更易于访问。口头访问电子表格具有巨大的价值,无论是对于创建还是分析Excel文件来说。”
Mueller表示,AI还有可能使电子表格的使用变得普及,让任何人都能轻松地使用电子表格。他预测说:“如果微软能够正确地做到这一点,那么不仅会确保Excel的未来,还会改变我们所知的工作方式的未来。”
目前,SpreadsheetLLM只是一个研究项目,微软还没有表示是否有计划将其转化为实际产品。但不难想象,这项研究可能会打造出某种“Copilot for Excel”。
好文章,需要你的鼓励
微软推出 Copilot+ PC 标准,要求配备高性能 NPU,引发 AI PC 市场格局变化。英伟达虽在数据中心 AI 领域占主导,但在 PC 端面临挑战。文章分析了英伟达的 AI PC 策略、NPU 与 GPU 的竞争关系,以及未来 GPU 可能在 Copilot+ 功能中发挥作用的前景。
专家预测,随着人工智能技术的迅速发展和广泛应用,2025 年可能成为 AI 泡沫破裂的关键一年。尽管 AI 仍有望在多模态模型和自动机器学习等领域取得突破,但技术瓶颈、投资回报率下降、监管趋严以及环境和伦理问题等因素可能导致 AI 热潮降温。未来 AI 发展将更注重平衡和可持续性。
Google 推出名为 Titans 的新型 AI 架构,是 Transformer 的直接进化版。Titans 引入了神经长期记忆、短期记忆和基于惊喜的学习系统,使 AI 更接近人类思维方式。这一突破性技术有望彻底改变 AI 范式,推动机器智能向人类认知迈进一大步。
主动型 AI 是人工智能的下一次进化,它不仅能生成内容,还能自主决策和追求目标。这种 AI 可以设定自己的目标,制定策略并根据情况调整方法,实现真正的自主性。它将彻底改变机器与世界的互动方式,为人机协作开启新的可能性,但也带来了透明度和伦理等挑战。