本文作者:林锦成
全文约4300字,阅读约需10分钟~
为抓住AI大模型技术变革的机遇,通过AI辅助内部业务,提升华为内部各业务领域的作业效率和质量,项目组组织训战让各业务领域懂AI用AI。我参加了上周(6月20日至22日)的第六期训战(for HR领域),收获非常大,必须分享给大家。
最近,国内首部以航母为题材的电视剧《海天雄鹰》在央视一套隆重播出,作为一名军事爱好者,我利用闲暇时间观看了几集,可谓感触良多。
《海天雄鹰》讲述了三代试飞员为了实现“航母成军”的使命而不懈奋斗的故事。这部剧是对我国航母发展历程的一次回顾,也是对这些英雄飞行员的崇高致敬。
一、AI成军
为啥提到《海天雄鹰》这部电视剧呢?其实你会发现,它与当前华为AI赋能内部业务变革事业有着惊人的相似之处。
华为AI就是航母,内部业务就是舰载机,而我们就是试飞员。
而AI本身并不会形成战斗力,需要结合业务场景才能形成战斗力。那如何让AI成军?
我们这些训战的IT雄鹰和那些舰载机试飞员承担同样的使命和担当。比如,怎么样找到AI合适的业务落脚点,如何使用AI最大化发挥价值等等。
那么在TO B场景下,如何识别哪些业务场景值得用AI重做一遍,如何懂AI(AI有哪些能力,局限性在哪里?),怎么用好、管理好AI,就是横亘在大家(业务人员和IT人员,也就是未来的业务分析师和AI训练师等角色)面前的三座大山,容易走到两个极端:
- 认为AI无所不能
- 认为AI一无是处。
为了克服以上这些挑战,抓住AI大模型技术变革的机遇,通过AI辅助内部业务,提升华为内部各领域(研发、财经、营销服、采供制、HR、行政、审计等)的作业效率和质量,我们于2024年6月20日至22日启动了一次AI辅助内部业务变革项目训战第六期(forHR领域)。本人有幸参加了本次训战,并想和大家分享本次训战的一些宝贵的知识和深入的思考。
“待到AI成军日,回首昔日训战时。
忆往昔峥嵘岁月,望今朝使命担当。”
二、缘起先锋计划
历时三天,课程安排相当紧凑、知识密度相当高、非常烧脑的AI辅助内部业务变革项目训战(for HR领域)圆满落幕。
这三天的课程里,我们学到了:
1、AI的前世今生
从统计学到决策式AI再到生成式AI,AI的发展史就是人类驯养机器智能的过程,也是机器和人类斗智斗勇的过程。
2、“AI改变世界,谁来改变AI”--李飞飞
我们认识了生成式AI家庭成员(prompt/RAG/微调/预训练等)各自的杀手锏和适用场景,就像动画片里的七个葫芦娃,各有各的绝技。并且通过演练环节,体验了大型语言模型 (Large Language Model,LLM) 各种策略(prompt/RAG/微调/预训练)的最佳实践和效果。(李飞飞,女,1976年出生于中国北京,美国国家工程院院士、美国国家医学院院士、美国艺术与科学院院士,美国斯坦福大学首位红杉讲席教授)
3、华为AI实践总结和场景识别
核心聚焦在了How(怎么做)的层面,包含了:
如何挖掘场景?
a.四位一体:应用场景 + 数据、算力、算法
b.海量、重复、复杂的业务场景
c.从人(赋能人)事(使能业务) + AI来使用大模型提升生产力
华为AI的三层五阶八步
结合了Top-down和Bottom-up的场景识别方法论
特别强调的是AI是一把手工程,要有组织准备,战略先行......
4、华为AI运营
AI开发交付和运营双轮驱动
AI运营方法三步走 ......
各位老师和助教从理论到实践,有理论知识,有实战演练,手把手地教我们,让我们对LLM不再只是概念上的认识,也有一定的直观感受。
三、收获:AI普惠化
1.本次训战帮我们系统地进行“扫盲”。
我们学习了AI领域里的很多专业术语:似然、正则化、梯度下降、多头注意力机制等等,终于可在AI界的同学们面前竖起腰板了,统一语言了。
2.在AIGC时代,做意图识别的成本降低了很多。
AI可以通过用户的对话内容,识别用户意图,实现表单的自动填充。例如:“一周后,想出去玩两天,我想请假下”,即可创建一个如下的请假单:
如果是使用传统AI,需要使用关键词匹配(明天)+ 调用API (生成明天的日期) + 各种语料喂出来的意图识别机器人,效果不理想的情况下,还要再调整语料,真的是相当复杂繁琐。
而在AIGC时代,只要一个prompt就可以了,是不是So Easy?
所以我经常把一些简单的工作交给AI机器人做,如:图片转文字,列表的去重等。图片
3.“知识不够用外挂,(推理)能力不足用微调”。
这里的知识不够包含了:
不够新鲜(知识更新频繁场景)
不够专业(领域专业化知识)
不够合规(数据隐私保护)
不够可信(回答需要验证追溯)
能力不足指模型发现的规律还不能覆盖当前的问题,例如小学生只学会了加法,你非得让他做乘法题,那这时候就需要通过微调,让他去学习下乘法规律,再让他来做题。
四、思考:先融入后颠覆
1.“让子弹飞一会儿,让韭菜长长,再来收割”。
关于当前的AI项目是否一定要取得立竿见影的效果,课上老师也分享了自己的观点,我深以为然。
如果严格地按照一系列标准进行筛选,我估计符合的业务场景已寥寥无几。因此,何不结合Top-down和Bottom-up两条腿走路的方法,不一定要追求价值量最高的大场景,可以先将一些数字化系统中的小功能点先融入AI,通过量变形成最终的质变。现在的联合作战阵型,依托强大的平台资源能力,再加上2-3个人的作战小分队,使得Bottom-up的可能性大大增加,等城墙口攻破之后,再安排上“范里弗特弹药量”饱和攻击,这也是一种路径。
其实,很多互联网企业在起步阶段并没有明确的商业模式,而是在发展的过程中逐步找到了商业模式,例如谷歌、淘宝,刚开始都是免费的,直到发现了互联网广告,才形成了商业模式。
2.“Not Only AI, More than AI”
这个观点和NOSQL数据库发展轨迹颇为相似。NOSQL数据库刚出现时,有很多人误以为它将取代关系型数据库。然而,随着时间的推移,人们才发现NOSQL只是关系型数据库的一种补充, 也就是NOSQL后面的解释:Not Only SQL。和所有新技术刚兴起的时候,很多人都以为AI就是个银弹,无所不能,天下无敌,最终落地的时候,又走向另一个极端,认为AI也不过如此,这是对AI认识的两个极端。
其实我想说的是AI的本质就是概率论,正如“让上帝的归上帝,凯撒的归凯撒”,我们应该找到AI的优势和适用场景,扬长避短,不能非要让AI去做一些不擅长的事情,技术也是有代价的,包括成本(所以有所谓的“穷则prompt, 富则微调”)。
关于规则引擎和AI的边界问题,我的个人观点是:遵循简单实用主义原则。规则引擎能解决的事情,用规则引擎解决,除非规则引擎解决得不好,用规则引擎 + AI,这种属于改良型或组合性创新;如果还解决不了问题的话,再来思考如何完全颠覆以前的一切作业流程,毕竟升维来实现颠覆性创新难度还比较大。
五、畅想:AI走进工作,融入生活
到了AIGC时代,各大互联网公司变得越来越智能了,当然偶尔也会出现智障的情况。
01业界洞察:互联网场景洞察
平时我们各种洞察时,可能会提到如下的一些场景:
1.浏览器里汇率查询,能粗略识别到你是不是想看看人民币和美元的汇率,顺便带出一个多选框,可以进一步选择源币种到目标币种的汇率转化。
2.谷歌已经实现了在搜索机票价格的同时,可以让你完成下单订票的操作,如下图:
之前在学习AI的过程中,很多人对AI的未来进行了畅想,印象比较深刻的是美工和前端工程师可能要转行了。
为啥呢?因为未来再也不需要那么复杂的交互和界面,只需要一个入口(不管是语音还是对话框),通过AI识别用户意图,一站式地快速帮用户把任务完成,而不是在一个个的孤岛系统中跳来跳去,然后还需要通过好多次的交互才能到达用户想到达的地方。以电商系统为例,当前电商系统基本上都要经过搜索或首页、列表、详情页,然后还要经过下单、支付等动作,才能最终完成一次网购。
那么未来是不是只需要一个入口,通过聊天框或语音输入:最近想去徒步,没合适的鞋子,帮我买双鞋。系统自动帮我们找到历史记录,给我们推荐鞋子,然后我们确认后,自动识别人脸,完成支付。真正做到一步到位,极简体验。
在AIGC的过程中,还可以看到很多AIRC(AI推荐内容)的影子,这两个真是亲兄弟呀。
02小方框,大世界
其实我一直在思考:HR系统未来的交互方式是什么样的?畅想归畅想,还是得学学“硅谷钢铁侠”马斯克的精神:心动不如行动。那么怎么才能实现呢?(工程师的优势就发挥出来了,自己想到的idea, 可以自己先尝试做出个MVP,而不是空对空地在畅想。)
于是我们通过业余时间搞一个考勤大秘:用考勤大秘(Mate) 来进行一下POC(Proof of Concept,为观点提供证据),这就是“用AI把自己的应用重做了一遍”。
经过分析,其实我们的数字化作业系统不外乎在做如下几件事情:
- 政策查询
- 信息查询(查工作日历、班次、薪酬等)
- 数字化作业(提交电子流、完成各种审批)
- 数字化运营(制作各种图表)
- ......
当前大部分的业务系统接入AI, 基本上只是部分环节接入AI,或者用AI改造,特别是复杂的作业场景,但没法完成端到端的流程改造。
我们这个POC只是考勤业务的一个雏形,相当于是一个毛坯房,但“麻雀虽小,五脏俱全”,后续的作业场景还可以不断地进行迭代演进。
部分展示图如下:
政策查询和个人信息查询
意图识别和数字化作业
最后,我想说华为AI航母才刚开始启航,AI成军系列刚开始拉开序幕,后续还会有许许多多的故事,期待大家一起来续写。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。