头图

微软研发"超级大脑":Excel智商提高25.6%!

前言

图片
微软

就在7月16日,一项来自微软的最新研究引发了广泛关注——SPREADSHEETLLM。这个专为Excel等电子表格应用而生的AI大脑,号称能让Excel更加智能化。据悉,它不仅性能大幅提升,词元使用量也显著降低。那么,这个"超级大脑"到底有何过人之处?它又将如何重塑我们使用Excel的方式?让我们一探究竟。

SPREADSHEETLLM的核心创新

图片
新模型SPREADSHEETLLM

SPREADSHEETLLM的奥秘,主要在于它的编码框架SheetCompressor。这个由结构锚点压缩、反向索引转换和数据格式感知聚合三大模块组成的框架,是其性能飞跃的关键。结构锚点压缩技术巧妙地识别并提取电子表格的关键结构信息,生成精简版的"骨架"表格,大幅减少了需处理的数据量。

反向索引转换则采用优化的JSON格式,将具有相同文本的单元格地址合并,显著提高了词元利用率。而数据格式感知聚合通过提取并聚类具有相似格式的数值单元格,简化了模型对数据分布的理解。

SPREADSHEETLLM的性能提升

得益于这些创新,SPREADSHEETLLM在各项指标上都交出了亮眼的成绩单。实验显示,它将电子表格问答的准确率提高了22%,整体性能较普通方法高出25.6%。更令人惊喜的是,它仅用了4%的词元就达成了如此表现,这意味着模型可以更高效地理解和处理复杂的电子表格。

在GPT-4的情境学习设置中,SPREADSHEETLLM同样表现出色。微调后的模型在电子表格表格检测和问答任务上的F1值和准确度,分别提高了79%和6%,充分证明了其强大的泛化能力。

SPREADSHEETLLM的工作原理

图片
SPREADSHEETLLM框架图

首先,SheetCompressor的三大模块各司其职,通力合作。结构锚点压缩负责提纯表格的关键结构;反向索引转换优化词元使用;数据格式感知聚合简化数值数据的理解。它们环环相扣,逐步提炼并优化电子表格的表示。数据在这个流程中的演变颇为有趣。

原始的杂乱无章的电子表格,经过一系列"修剪"和"打包",最终呈现为简洁明了的形式,方便SPREADSHEETLLM高效地"理解"和处理。值得一提的是,微软还提出了Chain of Spreadsheet(CoS)框架,以拓展SPREADSHEETLLM的应用场景。它先识别与任务查询相关的表格内容,再分解任务生成准确回答。实验表明,CoS大大提高了复杂电子表格的处理效率和回答的精准度。

总结

SPREADSHEETLLM的创新编码框架和出色的性能表现,为Excel带来了更加强大的系统,能更好的协助用户快速办公,在技术方面来说可谓是大突破。

厚德云是一款专业的AI算力云平台,为用户提供稳定、可靠、易用、省钱的 GPU 算力解决方案。海量 GPU 算力资源租用,就在厚德云。


厚德云
6 声望7 粉丝

厚德云是一个专业的 GPU 算力云平台,专注于为人工智能从业者提供高效、便捷、灵活的 GPU 算力资源租用服务。我们旨在帮助客户加速人工智能的研发和应用进程,实现业务的快速发展。