1
头图

搭载ChatGPT之后的表格插件又有哪些新的改变——Function calling增强

摘要:本文由葡萄城技术团队于博客园原创并首发。转载请注明出处:葡萄城官网,葡萄城为开发者提供专业的开发工具、解决方案和服务,赋能开发者。

《大火的ChatGPT与SpreadJS结合会有哪些意想不到的效果》一文中提到ChatGPT插件的一个明显的问题,那就是“返回的结果格式可能插件也无法进行分析使用,从而是使得后续的操作无法继续执行”。造成这个问题原因与ChatGPT的技术原理有一定的关系。

模型预言的限制:ChatGPT是基于语言模型的,其性能受模型训练和数据集的限制。对于复杂的问题可能并不能准确返回结果,同时返回的结果格式可能插件也无法分析使用。

但随着6月13日发布Chat Completions API 的function calling能力,这个问题得到了很好的解决。此次更新带来了新的模型,更大的内容,更低的价格,而Function calling更是带来了革命性的互动方式。

通过Function calling,OpenAI model可以根据你对系统中functions的描述来生成外部系统可以直接使用的结构化的JSON参数,这样GPT就可以更好的和外部系统结合。

以前文中“建议的数据透视表”为例,对于提供的表格数据,text-davinci-003 model会返回建议的文本内容:

"text": "\n\n行:销售人员\n列:品牌\n值:销售额\n\n通过这样设置可以分析出每个销售人员销售的不同品牌的总销售额。"

虽然有换行等符号可以解析所需要的行列值,但是稳定性十分不确定,程序很难直接使用。

通过使用Function calling,数据透视表的建立就会变得非常简单。还是以OpenAI官方提供的nodejs支持为例。

  1. 在对话中加入functions描述

    let messages = [
     {"role": "user", "content": "最后的JSON数据第一行是数据字段,创建有分析意义的数据透视表\\n" + JSON.stringify(data)}  ]
      let functions = [{
      "name": "pivot_talbe_analyze",.  "description": "对数据创建数据透视表,返回数据透视表结果",.  "parameters": {
      "type": "object",
     "properties": {
      "rowFieldName": {
      "type": "string",
     "description": "行字段名称"
      },  "columnFieldName": {
      "type": "string",
      "description": "列段名称"
      },
      "dataFieldName": {
      "type": "string",
      "description": "值字段名称"
      },
      },
      },
      "required": ["rowFieldName", "dataFieldName"]
      }]
      
      var response = openai.createChatCompletion({
      "model": "gpt-3.5-turbo-0613",
      "messages": messages,
      "functions": functions,
      "functions_call": {"name": "pivot_talbe_analyze"}
      });

一次对话可以有多个function描述,每个function描述包含名称,描述,方法参数(描述规则是JSON Schema),以及那些parameter是必选的。

对于选择区域创建数据透视表,需要提供行、列、值三个维度的字段名称,因此需要rowFieldName、columnFieldName和dataFieldName三个paramenter。

另外,可以通过function_call设置选择function的模式,当functions字段不为空时默认为“auto”,示例中指定了function pivot_talbe_analyze。

完成调用直接返回了function name 和parameters中的三个参数:

{name: 'pivot_talbe_analyze', arguments: '{\\n "rowFieldName": "销售人员",\\n "columnFieldName": "品牌",\\n "dataFieldName": "销售额"\\n}'}
  1. 使用GPT返回结果并创建透视表

通过返回的function name 和parameters可以直接调用系统中的对应方法创建的透视表了。

let args = JSON.parse(completion.data.choices[0].message.function_call.arguments)

let pivotTable = sheet.pivotTables.add("PivotTable", "Table1", 2, 7, GC.Spread.Pivot.PivotTableLayoutType.outline, GC.Spread.Pivot.PivotTableThemes.medium2);

pivotTable.add(args.rowFieldName, args.rowFieldName, GC.Spread.Pivot.PivotTableFieldType.rowField);

if(args.columnFieldName)

pivotTable.add(args.columnFieldName, args.columnFieldName, GC.Spread.Pivot.PivotTableFieldType.columnField);

pivotTable.add(args.dataFieldName, "求和项:" + args.dataFieldName, GC.Spread.Pivot.PivotTableFieldType.valueField, GC.Pivot.SubtotalType.sum);

获取SpreadJS透视表结果如下:


let ptRange = pivotTable.getRange().content;

let ptData = sheet.getArray(ptRange.row, ptRange.col, ptRange.rowCount, ptRange.colCount);
  1. 给GPT反馈公式调用结果
messages.push(completion.data.choices[0].message)

messages.push({"role": "function", "name": "pivot_talbe_analyze", "content": JSON.stringify({pivotTable: ptData})})

response = openai.createChatCompletion({

"model": "gpt-3.5-turbo-0613",

"messages": messages,

"functions": functions,

function_call: "none"

});

response.then(function(completion){

let desc = completion.data.choices[0].message.content;

GC.Spread.Sheets.Designer.showMessageBox(desc, "分析结果", GC.Spread.Sheets.Designer.MessageBoxIcon.info)

});

将历史和获取到的透视表信息添加到messages中,这里message rule多了function类型,content就是调用function的返回结果。

调用时function_call设置none,不要使用function calling, GPT根据上下文返回了如下信息:

{role: 'assistant', content: '以下是创建的数据透视表:\n\n\`\`\`\n[\n ["求和项:销售额", "品牌", null, null…\n]\n\`\`\`\n\n该数据透视表按照销售人员和品牌对销售额进行了汇总,可以更方便地进行数据分析和比较。'}

接下来可以发送新的请求让GPT对数据做进一步的分析处理,当然对于一些系统操作,我们做到步骤2就可以了。

总结一下,通过Function calling,自身系统和openai model互动更加简便,耦合的更加紧密,系统通过互动的方式向ChatGPT model发起请求,model可以智能选择需要调用的系统function,进一步提升了系统的创造性。

不过还是需要提醒,对于调用系统数据更新删除的方法,还是要做好确认再去执行。

扩展链接:

随笔-当ChatGPT遇见SpreadJS

POI打开Excel文件遇到out of memory的解决实践


葡萄城技术团队
2.7k 声望28.4k 粉丝

葡萄城创建于1980年,是专业的软件开发技术和低代码平台提供商。以“赋能开发者”为使命,葡萄城致力于通过各类软件开发工具和服务,创新开发模式,提升开发效率,推动软件产业发展,为“数字中国”建设提速。