原创 黄佩林 Datawhale
Datawhale原创
作者:黄佩林,Datawhale意向成员
大家好,我是 HeteroCat。你也可以叫我 jason 或者小林。
最近也是在毕业准备找工作,所以决定写一篇我的不算精彩的 AI 成长故事,将自己的成长跟大家分享出来让大家认识真正的我。
同时也算是对过去的自己做一个总结,对学生时代的自己说一声再见。
我的故事不算精彩,感兴趣的话且听我娓娓道来。
01
AI 与我相遇的起源
我与 AI 的相遇于一本书,没错就是一本书,而且这本书的名字就叫《人工智能》。
那是一个高二的暑假,因为那时候我爸在广州工作,所以我来到广州找我爸玩一玩,来到广州后有一次我们去了这边的书店买了几本书,这其中就包括这一本李开复老师的《人工智能》,那时候的我第一次接触人工智能这个概念,非常好奇。
现在对这本书最深的印象就是里面介绍的图片风格化的一个软件,可以将我们上传的图片进行图片风格的变化,有点类似于现在的 AI 生图的风格特效,那个软件我当时玩了很久。
《人工智能》这本书是我的AI启蒙书籍,李开复老师也算是我的AI启蒙老师,带我走进了 AI世界。
从这本书开始我开始去专门买一些 AI、科技相关的书籍,去阅读和持续的学习。
有腾讯研究院出版的,有写谷歌的,有经典的《黑客与画家》等等。
最近还看了李开复老师的另一本书《AI 未来进行式》,也同样收获良多。
02
从字节青训营到 kaggle
再到 datawhale
后来我考上了大学,在填志愿之前我其实一直是把计算机科学当做我的第一志愿的,但是和家人沟通后我把计算机放到了第二,把数学填在第一个。
我当时的想法是我应该在本科阶段打好数学基础,然后再考一个计算机的研究生,多好呀,现在想想真的是太天真了。
是的,我顺利成为了一名数学专业的本科生,在经历了大一大二的挣扎之后,我开始规划我的未来,结合自己的专业和未来发展,我觉得我应该走数据方向,去做一些数据处理,数据分析等等。
于是我加入了第四届字节跳动青训营的大数据基础班,也是从这里开始我慢慢培养起写博客的习惯。
在经过一段时间的学习之后我开始找一些数据比赛,于是我找到了 kaggle 在上面找到一个最基础的《泰坦尼克号》进行入手。
刚接触题目的我当然无所适从,于是我到B站上面找教程,刚好找到一个讲解《泰坦尼克号》这个项目的,刚好这个视频是 datawhale 的一个项目,于是顺藤摸瓜我在 GitHub 上面找到了这个项目,找到了 datawhale,关注了 datawhale,又刚好 datawhale 在做组队学习的报名,刚好这个项目就在这次的学习内容中,于是我参加了这次组队学习的活动,一切就是这么刚巧。
后续我还参加了其他的一些组队学习,拿到了奖项,慢慢的我从一个小白变成了优秀学习者,当上了助教,受邀去演讲(当时觉得自己能力不够还要沉淀所以拒绝了),到现在的意向成员(未来向正式成员努力)。
一路走来在 datawhale 里我不但收获了知识,还认识了很多优秀的朋友增长了见识,同时也让我认识到自己的不足和差距,向他们学习看齐,成为催促我前进的动力。
最近 datawhale 在 GitHub 上进入全球前100名,在这里也祝愿 datawhale 越来越好,欢迎大家加入。
Datawhale Github链接:
https://github.com/datawhalec...
03
我的第一份 AI 工作:提示词工程师实习
到大三大四开始找实习,其实一开始我也没有找 AI 相关的岗位,而是按我之前的规划找了一些数据岗位,我先后是在广东某研究院做了一个国民经济数据匹配的实习项目。
第一个实习是远程实习,在学校用 Python 完成了整个工作,还是很有收获的毕竟自己一个人独立完成了一个工作任务,成就感满满,后面因为一些个人原因我就离开了。
在后面秋招里我也顺利找到了我心仪的 offer,同时也是我的第一份 AI 工作,在广州一个 AI 医疗科技公司,做的就是提示词工程师的实习,有转正机会。
我们做的是用 GPT 生成一份医疗说明书的一个工作,我需要做的是对前面的提示词做一些补齐、补充完整和优化,并且配合产品经理做功能测试以及一些杂活。说实话虽然干的活比较杂比较乱,但是我还是干得很开心的,因为这是我喜欢的东西我并不觉得乏味,那段时间我基本是第一个到公司的,每天都充满热情。
后面产品上线了,我被安排去做了一段时间的 API 开发就是偏后端的工作了,说实话刚开始的时候还能很吃力的,因为我是数据分析数据处理出身,我没有干过开发,什么看需求文档啊,技术文档啊,对接需求啊等等,但是后面慢慢的开发的速度也慢慢提高了,流程也慢慢熟悉。
总的来说,在上家公司还是开心的,有免费的午餐,高清 4k 屏的电脑,我最喜欢的其实是公司饮水区的玫瑰花茶。
但是最后我们部门因为业绩压力没有继续做这块 AI 的业务,同时另一边我家里一直催我去考公,所以我就没有继续呆在那里了。
04
我的一些AI尝试和成果
在过去的一年里到现在我也没闲着,一直在尝试各种新出的 AI 应用 AI 功能,大家也都清楚自从 ChatGPT 引爆生成式 AI 浪潮之后,基本上每天都有新东西,每个月都有新动向。当然我也是其中之一一个追风的人,下面就介绍一下我做的一些小尝试和小收获。
Hugging llm
在去年 3,4 月份的时候,机缘巧合之下加入了 hugging llm 项目,当时是在群里看到长琴哥在招募,我自告奋勇就上去了,并且给他看了我之前 2 月份写的博客文章,然后就顺利加入了。
后面还在 datawhale 安排了组队学习等等,后面加入了一些学员的作品,我们的项目就非常丰富完整了,然后在今年 2 月份我们的项目出版成书蝴蝶书《 ChatGPT 原理与应用开发》
这是我们的项目地址:
https://github.com/datawhalec...
这个是我的部分:
https://github.com/datawhalec...商业应用——LLM是星辰大海.md
文字游戏
这是一个用 streamlit 构建大模型对话的文字游戏的页面,左边输入你的 key,就可以对话。上面有一些游戏规则,就是一段 prompt,把他复杂过来就可以进行与大模型交互的文字游戏。说来惭愧这其实是一个笔试题,我认为我做出来了,但好像没有达到他们的要求,所以我并没有通过。不过我认为这个一个有趣的项目,我打算去学一下 streamlit 的部署等等,然后再放几个游戏的 prompt 进行去,这样子我觉得会比较完整,也可以当作一个自己的小项目慢慢去提高自己的开发能力。
AI生图
关于 AI 生图我做了蛮多尝试的,主要就是两个,一是参加了一个 AIGC 生图比赛拿了个三等奖然后我就把我的获奖作品做成了一个系列,具体可以看看我的另一篇文章(https://juejin.cn/post/730006...),我就不赘述了。
二是我的毕业论文用遗传算法优化我们的生图提示词,这个也可以看看我的这个文章(https://juejin.cn/post/735870...),感兴趣的可以看看具体的实践流程。
另外关于 AI 生图我还想说的是目前我对 sd 的了解还比较浅,我知道这是目前商用生图的主力军。
但是我的电脑真的很烂,配置不够,我不想再摧残他了,但是我依然我比较高的兴趣,所以未来一定会去尝试,等我换电脑一定去搞搞 sd 玩玩,应该也会写一篇博客,期待。
AI音乐
如果你对 AI 音乐有了解,你应该知道 suno ai 平台,是的没错他真的可以生成你想要的音乐,而且非常好听。
从去年被我发现之后我就尝试在上面进行创作,在去年 12 月份到一月左右我非常喜欢在上面进行音乐创作并且发布出来,甚至一些我还制作了视频。
中间因为现实一些考试啊等等事情淡忘了也没有进行创作,前几天上号突破发现我有一首歌播放量竟然有 18w,点赞也有近 1k。
而且我的账户里还莫名其妙多了 500 积分,我之前就说过我想做 AI 音乐 MV。
如果你对 AI 音乐创作感兴趣欢迎与我沟通,这 18w 的播放量给了我信心,我希望能有一两个朋友一起玩一玩,互相交流。
证书
除了做项目搞论文,我还参加了很多活动以及考了很多生成式 AI 相关的证书。这里我就不赘述了,放出来给大家看看就好了。
亚马逊云科技-生成式 AI 精英-技能开发证书
Coursera 上面范德堡大学的 prompt engineering 专项课程证书
科大讯飞的 prompt 工程师证书
百度的 agent 智能体开发证书
百度的 prompt 证书
百度的大模型应用创新挑战赛-最佳创意奖证书
05
我对AI的态度和看法
我对 AI 的态度一直是非常乐观的,我相信的是奥特曼的降临派理论。
随着时间的推移,人们开始更深入地了解 AI 的工作原理、能力和局限性。
他们开始将 AI 视为一种工具,而不仅仅是一种科幻的威胁。
逐渐,人们开始接受 AI 作为日常生活中不可或缺的一部分。
他们更加重视 AI 在改善生活、提高效率和解决问题方面的作用。
所以未来还有很多的事情可以做,我们仍然能看到机会。
06
自我推荐
如果你对我的AI音乐感兴趣或者只是想和我交个朋友,也可以与我交流~(vx h19830512935)
如果你是 hr,是猎头或者你们公司有 AI 方面的业务,需要一个像我这样的人,你们觉得我合适的话,欢迎联系我(珠三角最好)。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。