SF
不惑
不惑
注册登录
关注博客
注册登录
主页
关于
RSS
老婆问我:“什么是大模型的 Prompt?”
不惑
3 月 31 日
阅读 2 分钟
219
我:Prompt 确实有点像咒语,但更准确地说,它是人类和 AI 沟通的“指令说明书”。比如你问 元宝:“写一首关于秋天的诗”,这句话本身就是 Prompt。模型会解析你的指令,理解你想要什么,再生成对应的内容。如果换成另一个 Prompt:“用冷笑话的风格解释量子物理”,模型输出的内容就会完全不同。
老婆问我:“大模型的 Token 究竟是个啥?”
不惑
3 月 31 日
阅读 2 分钟
269
我:所谓 Token,Token,分而治之。 “Token 就是模型眼中的‘最小语言单位’。” 它既不是一个完整的字,也不一定是一个完整的词,而是介于两者之间的东西。比如:
老婆问我:“大模型的参数到底是什么东西?”
不惑
3 月 31 日
阅读 2 分钟
144
我:所谓参数,参数,参天之数。其实参数本身就是一个数值,可能其中一个是3.123456789,另一个是-0.0009527。以DeepSpeed-R1最大版本为例,它有671B个参数(B代表十亿)。你可以把这些参数想象成一张巨大的网格,每个网格中都存储着一个数值。一个大模型通常包含几千亿个参数,这些参数占据了模型体积的90%以上。
大厂最爱问的MVCC,到底是个啥?
不惑
3 月 31 日
阅读 7 分钟
195
多版本并发控制(MVCC)是一种用于提高数据库并发性能的技术,尤其在处理高并发读写操作时极为有效。MVCC通过维护数据的多个版本来避免读写冲突,使得读操作无需阻塞写操作,写操作也不会影响读操作。下面,我们具体讲解MySQL中InnoDB存储引擎对MVCC的实现原理。