微软的研究人员近日发布了实验性人工智能模型SpreadsheetLLM的详细信息,这个模型是与Excel以及Google Sheets等电子表格配合使用的。
微软在7月12日发表在Arxiv.org上的一篇研究论文中讨论了该模型,模型旨在解决将AI应用于电子表格的挑战,电子表格在商业世界中被广泛使用,但事实证明电子表格很难被大型语言模型掌握。
据微软研究人员称,SpreadsheetLLM采用了一种新颖的方法将电子表格内容编码为大型语言模型更容易使用的新格式,因此为这些模型“推理电子表格内容”铺平了道路。
研究人员强调了对这个特定AI领域迫切的改进需求。电子表格用于各种任务,从简单的数据输入和分析到复杂的财务建模和决策,但现有的大型语言模型很难理解和推理电子表格的内容,问题在于电子表格中数据具有高度结构化的性质,此外还有复杂的公式和引用。
据报道,SpreadsheetLLM通过以更适合大型语言模型的方式对电子表格数据进行编码来解决这个问题,这样就可以更好地理解电子表格内容。
为此,研究人员制定了一种名为SheetCompressor的新型编码机制,它保留了数据的结构和关系,同时使大型语言模型可以访问它。SheetCompressor特别将数据压缩高达96%,这样大型语言模型就可以在其token限制内处理大型数据集。
研究人员还强调了另一个称为“结构锚提取”的功能,可以识别定义表结构的关键行和列。同时,“倒排索引翻译”是一种高效编码单元格内容和地址以最小化冗余的方法,而“数据格式感知聚合”则有助于对以相似格式的单元格进行分组,从而进一步最小化token的使用。
研究人员在实验中发现,SpreadsheetLLM在电子表格的表格检测测试中取得了一些令人印象深刻的结果,比现有方法改进12.3%。此外,它在电子表格问答任务上也取得了突出的成绩。
SpreadsheetLLM被应用于一系列知名的大型语言模型,包括GPT-3.5、GPT-4和Llama 2,测试表明,它显著增强了这些模型在电子表格理解任务方面的能力。例如,GPT-4的表格检测得分为78.9%。
研究人员表示,SpreadsheetLLM仍是一种实验性的模型,在更复杂的电子表格格式方面存在一些局限性,但他们也相信它具有很大的潜力,例如,他们说该模型可以应用于诸如自动化常规数据分析等任务,以根据电子表格内容生成见解和建议。通过帮助大型语言模型理解电子表格、回答有关电子表格的问题,甚至根据自然语言提示创建新的电子表格,它为AI辅助数据分析和决策的新可能性打开了一扇大门。
SpreadsheetLLM 还可以帮助人类工作者更容易使用电子表格,因为很多人难以掌握Excel等工具更复杂的功能。使用电子表格的挑战之一,就是需要学习复杂的公式来操作其中的数据,但SpreadsheetLLM可以帮助用户使用自然语言命令来操作这些数据。
最后,研究人员表示,SpreadsheetLLM可以帮助对一些与电子表格相关的、更繁琐的任务实施自动化,例如数据清理、格式化和聚合。
Constellation Research分析师Holger Mueller表示,这项研究意义重大,因为有许多业务都依赖于Excel电子表格。“微软必须走在前沿,通过AI让Excel电子表格更易于访问。口头访问电子表格具有巨大的价值,无论是对于创建还是分析Excel文件来说。”
Mueller表示,AI还有可能使电子表格的使用变得普及,让任何人都能轻松地使用电子表格。他预测说:“如果微软能够正确地做到这一点,那么不仅会确保Excel的未来,还会改变我们所知的工作方式的未来。”
目前,SpreadsheetLLM只是一个研究项目,微软还没有表示是否有计划将其转化为实际产品。但不难想象,这项研究可能会打造出某种“Copilot for Excel”。
好文章,需要你的鼓励
许多CIO在实施AI战略时因良好初衷反而导致失败。专家指出,仅为AI而做AI会浪费资金且无实际成果,应先评估业务价值。CIO常见错误包括:让风险规避型利益相关者施加过度限制、仅依赖现成AI工具而不深度整合、在人员和流程问题未解决时强推技术转型。成功的关键是确保AI解决方案真正节省时间并带来业务价值,需要有权威的负责人推动决策,同时不惧怕小规模试错,快速迭代改进。
谷歌研究院开发出一种革命性的人工智能技术,通过学习人类眼动轨迹来提升视觉问答能力。该技术像训练侦探一样教会AI关注图像中的关键区域,准确率提升3-10%。研究发表于CVPR 2024,在教育、医疗、无人驾驶等领域具有广阔应用前景,为AI向人类智慧靠近开辟了新路径。
Kahoot是一个基于游戏的学习平台,涵盖科学、历史、地理、英语和数学等领域。该平台于2023年推出AI功能,AI生成器可从主题、文档、网站或视频链接即时创建互动学习体验,帮助教师减少备课时间,让学习更具吸引力和个性化。平台支持50种语言,拥有120亿用户,还提供翻译工具和AI驱动的学习推荐功能。
英国卡迪夫大学研究团队通过脑电图技术发现,当人们体验虚假听觉(即"听到"实际不存在的语音)时,大脑的神经活动模式与听到真实声音时几乎相同。研究揭示了大脑会根据语言经验和上下文自动"填补"缺失的语音片段,这一发现对理解听觉障碍、改进助听设备以及开发更智能的语音识别系统具有重要意义。