随着互联网服务的不断深化,产品营销的形式从传统文本、长图文,增加到短视频、直播等新媒介形态,展现形式愈加丰富的同时,也为营销宣传内容合规审核带来了诸多难题。
- 如何解决与日俱增的审核量与合规审核人员有限之间的矛盾?
- 如何提升审核效率,满足业务部门快速发布需求?
- 对于音视频、直播,如何对这些新媒介形式实现高效高质量的审核?
基于上述挑战,蚂蚁数科推出了全栈式智能内容合规审核平台产品。该产品基于AI智能技术及专业内容审核规则沉淀,向金融、互联网、政企、传媒等行业客户提供一站式智能内容合规审核解决方案,可助力机构有效降低营销合规风险。
此前,蚂蚁集团基于内部解语花平台与博时基金共建的基金内容合规智能审核系统荣获第八届证券期货科学技术奖优秀奖和2021年度深圳市金融创新奖三等奖。该审核系统具备高度自主知识产权,处于国内外领先水平。
一、产品能力
合规专家人力有限,越来越无力支撑海量内容的人工审核,且人工风险排查存在排查标准不统一,风险挖掘不深入,评审结果无沉淀等一系列问题。
蚂蚁智能审核产品基于人工智能技术及专家经验的解读和沉淀,提供了一站式的营销合规风险管控解决方案,将监管要求进行数字化转译,通过程序化手段实现快速的机审策略配置;同时提供了统一审核服务接入,支持文本、图片、语音、视频、直播、文件等全媒体格式的营销宣传内容识别,结构化内容特征,进行规则推理,完成风险决策和处置。
多媒体内容识别
支持全媒体格式处理,适用于企业级推销产品或服务的文字、图片、音频、视频、直播或其他内容展示形式,以实现针对用户可感知的应用页面、营销宣传、金融产品信息、销售行为过程等内容的全媒体格式的智能审核。
智能内容审核
合规专家会将自己的审核经验总结成规则或违规风险点,基于特定审核场景,融合各类算法模型构建复杂且精准的策略体系,打造感知引擎-认知引擎-决策引擎为核心的多媒介金融风险精细化审核引擎,达成以机器审核代替人工审核的目标。
二、技术内幕
1.多媒体内容识别
在内容审核的过程中,针对不同的内容往往需要采用不同的处理方式来达到审核的目的。日常遇到的内容包括营销广告、产品页面文案、启动屏、IM、电销、直播、超链接、氛围图、弹窗、信息流、PUSH、短信、邮件等各种面向消费者的信息展示形式,这些内容大多以各种素材类似一张图片/一段音频/一段视频等方式承载。内容处理中心服务于审核前的内容预处理环节,即从这些素材中提取出需要审核的信息,进行内容转换、抽取、压缩等。
1.1基础能力建设:
- 文件处理:提供文件内容抽取、文件类型转换、文件生成图片等多种文件处理功能。
- 图片处理:提供图片压缩、智能切割、图像增强、降噪处理等多种图像处理能力。
- 音视频处理:提供音视频转码,视频抽帧,音频文件提取,语音ASR、增强、降噪等多种能力。
1.2 复杂处理流程编排: 为了应对灵活多变的内容处理流程,内容处理中心支持自定义内容处理流程编排,针对不同场景通过自定义脚本的方式实现内容处理节点的灵活编排。譬如为了满足复杂监管要求,当视频中语音涉及产品业绩介绍时,视频页面应当播放业绩展示板,通过自定义脚本的方式实现视频抽音频后,识别其中关键内容,再抽取对应时间图片,进行联合送审。
2.智能内容审核及规则编排
为识别更复杂且隐蔽的金融风险问题,提升合规风险识别的准确率和召回率,我们建设了感知&认知&决策三层漏斗式处理引擎。同时建立统一算法能力接入平台,实现原子算法能力业务无感插拔。最后在调用节点的输入输出之间加入了工程能力介入,如灰度图等,以增强算法模型的识别能力。
与天生具备自然属性的概念不同,监管合规概念是由社会活动的演进而出现,再由相关监管部门进行定义与规范的,专家会将自己的审核经验总结成规则或违规风险点,机审则需要对这些规则进行算法实现,规则生产配置的过程其实就是将一项项专家经验转换成机审能力的过程。在这个过程中,规则数量大,需要覆盖的场景多,为每条规则研发一个脚本工作量大,后期维护成本高昂。
同时在研发规则脚本时,发现很多规则是有相似的处理逻辑的,且具备一定顺序性,由此提炼原子能力,设计出一套规则的编排方案,快速实现业务规则,同时在规则发生调整时可快速切换组合方式,同时可以基于简单的配置化,做到业务的快速接入和使用。
3.模型迭代优化
审核中算法模型的优化迭代更新依赖大量的标注样本。在内容合规领域,没有成熟、直接可用的样本集,强依赖合规专家经验的持续输入,然而合规专家打标的人力成本和时间成本都非常高昂,因此如何降低打标成本是内容合规领域的重中之重。围绕着这个问题,我们采用了小样本学习、主动学习、噪声学习等技术,在打标环节筛选高质量的样本,节省专家时间的同时使算法模型达到业务要求的精度,提高人在回路体系的效率。
以小样本学习为例,我们使用大规模预训练语言模型,使用NLP的prompt(模板填充)模式,结合半监督学习,充分利用未打标样本,能够在样本量减少一半的情况下,模型效果保持不变。在特定任务中,样本量能减少到原先的1/5。在这套框架下,“人”、“数据”、“模型”三者是互相提升的,数据在整个回路里从未标注变成强标注,人从对审核规则有初步理解变成审核方面的专家,模型从无监督到强监督。
三、落地案例
博时基金-蚂蚁智能审核样板间 丨通过AI技术,实现基金产品销售素材智能化审核服务
蚂蚁智能审核产品一直以来致力于为用户提供智能内容合规审核能力,与行业共建合规规则库,持续优化更新。在基金产品宣传材料方面,博时基金引入了蚂蚁集团智能合规审核服务,构建博时基金内容管理与智能审核平台。 智能审核能力提升了合规审核效率,降低合规风险,大幅优化了业务-合规审核流程。内容管理平台提供营销素材存储、管理、复用、共享服务,助力不同素材需求方快速获取审核通过的定稿素材,提升营销品宣效率。
博时基金与蚂蚁共建的智能审核系统还具备以下两大特点:
技术创新点:基于深度神经网络框架,运用大规模预训练、多模态识别、人在回路算法等技术构建了国内领先的金融合规模型集群,将合规专家经验转化为智能审核能力,解决了复杂语境下的准确率和审核效率问题。
业务创新点:围绕内容生命周期,部署全流程的合规管理应用场景,并创造性实现了人机结合应用界面,创新实现视频直播类智能合规审核,从“0到1”的突破。
目前蚂蚁集团智能合规内容审核产品已开始向基金、保险、银行等金融机构推广落地。
四、未来展望
目前,智能审核产品已经广泛应用在包括蚂蚁保、蚂蚁基金、网商银行、博时基金等多家机构,持续帮助机构定位与洞察合规业务风险,提升业务协同效率。同时蚂蚁智能审核产品现已向金融机构提供商业化服务,期待与更多机构共建行业合规规则库,开展合规领域大模型的构建和应用实践,进一步提升智能化水平。
后续我们会持续分享蚂蚁集团智能合规内容审核能力演进过程中的落地与思考,欢迎大家提出任何意见与建议。
如有兴趣,可以联系:gengliu.gl@antgroup.com
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。