AIGC9: 火山引擎AI创新巡展

file
上图是一个参加技术大会的程序员，使用豆包文生图得到。

背景

随着计算机硬件发展、互联网普及、深度学习技术突破以及大数据的积累，人工智能在 21 世纪迎来快速发展。

2012 年深度学习技术在图像识别领域取得突破，

2017 年 Google 提出 Transformer 架构，奠定大模型预训练算法基础。

2022 年 OpenAI 推出的 ChatGPT 更是引发了全球对人工智能的高度关注。

开始前

14点开始，我是13点到的。

地点在深圳鹏瑞酒店2楼，到了之后门口有指路的。直接走进去，连上两层电梯。

门口安检进去，然后扫描签到，拿一张参会嘉宾卡。

file

会议室前面有4个展台。简单拍了一下，也体验了一把。

分别是：
豆包APP：我玩过很久了，体验比国内其它的AI应用要好。

file
HiAgent：快速定制智能体，录入提示词，知识库，选择模型，可以直接使用api调用。

file
海绵音乐：可以创作歌词，选择音色和风格创造音乐。

file
猫箱：一张图，对应的智能体会跟你聊天。

file
然后是一个摩天轮，上面是豆包上的各种模型。

file
然后是按照大纲听了各位老总的讲解。

谭待 -豆包模型能力演讲

首先感谢谭总。

我简单叙述和思考一下。

豆包大模型一天使用的token数量13000亿，图片处理5000万张，语音处理85小时。
说明增长很快。

豆包大模型家族包含了13太保：

1 通用模型pro
2 通用模型lite
3 角色扮演模型
4 FunctionCall模型
5 向量化模型
6 视频生成模型
7 文生图模型
8 图生图模型
9 同声传译模型
10 音乐模型
11 语音识别模型
12 语音合成模型
13 声音复刻模型

通用模型pro的能力增长很快，在数学，专业知识，综合能力，大马，指令上进化很快。

TPM: 每分钟token数量。

豆包大模型的初始并发很牛逼， 80W的 TPM。

可以轻松满足写作，智能座舱，文献翻译等场景。

升级了上下文窗口容量，达到了256K 。即25.6万个字符，一般的对话智能分析完全没问题。

文生视频模型效果很震撼，但是豆包上没入口。

文生视频可以应用再电商营销，动画教育，城市文旅，剧本创作上；

file

然后是一个非常漂亮的美女展示了即梦和剪映使用豆包视频模型。

然后效果非常震撼，

让高适唱现代歌曲。

让古代画家跟你一起画画

学习纠错

数字人（音色克隆，智能翻译）让你的在另外一个世界说话，而且会说很多国家的话。

还有一些比如智能抠图，营销话术生成，批量编辑图片，创造奇妙的视频。

创建好脚本，设置好视觉效果，即可生成视频，然后进行剪辑。

这个可以去试试，创作很方便。

file

豆包音乐模型很牛逼，输入提示词语，可以生成歌词，选择旋律，我晚上用这个创作歌曲哄我儿子睡觉，效果很好。

同声传译用来开跨国会议挺好的，可以实现实时翻译，音色精准，还可以复刻自己的声音。

然后介绍了火山引擎作为云计算平台上面的一些产品。

file

吴迪企业AI转型

开篇总结的很好。

好用，低成本，容易落地是AI大模型落地要保证。

然后答案是豆包，摆出了论据，当前使用量大。

家族13太保。

有标杆的企业实践。

文生图模型升级了，可以进行复杂图文匹配，急速出图，对中文也理解透彻。

语音合成场景应用丰富。

视频生成是最炫的。

音乐生成很动人。

然后主推火山方舟，高性能，安全，效果好，性价比高，容易落地。

并发支持体系介绍，TPM , RPM 的指标高于竞品。

云计算底层算力强，调度算法优秀。

Context上下文缓存也作为亮点，

然后是安全的介绍：身份认证，环境隔离，数据保密，信息无痕，操作可审计；日志全面而丰富。

然后是扩展性：支持的知识库容量更大，处理速度更快，召回率更高；

file

叶柳酷开AI实践

OTT 是 “Over The Top” 的缩写，指的是互联网公司越过运营商，发展基于开放互联网的各种视频及数据服务业务。它运营在用户已获得的网络之上，不需要网络运营商额外的商业或技术支撑。

酷开是一个在OTT领域很牛逼的公司。

AI解决了大屏行业的问题：运营成本高，内容推荐智能，操作复杂；

通过智能海报，智能识别得到了大量的素材。提高了材料的质量和效率，并且自动打标签。

智能短视频借助AI ：

输入，视频理解，视频生成，输出，应用整个流程加速了推广和覆盖用户的质量和效率。

智能推荐：借助豆包提高了用户粘性和忠诚度。

这里感觉比较牛逼，放一个图，后面也可以复刻一下，智能推荐很重要，增加用户粘性的核武器。

file

智能管家可以识别各种方言，用到了实时翻译模型。

AI故事和绘本，使用了豆包的生文生图模型。

基于用户的数据创建了专属壁纸。

借助AI ，酷开在智能内容，新闻资讯，语音会话，外语练习，推荐算法这块推出了很多牛逼的功能和产品。

然后预言后面会是AI告诉发展的30年。

file

彭立人仙剑AI实践

SFT : 监督式微调（Supervised Fine-Tuning）：这是一种机器学习技术，特别是在自然语言处理领域，用于优化预训练的语言模型以适应特定的任务或数据集。在游戏领域的应用场景如下：
游戏中的智能 NPC：通过 SFT 技术对语言模型进行微调，可以让游戏中的 NPC 具有更智能的对话能力。例如，NPC 可以根据玩家的提问和游戏情境，给出更准确、更合理的回答，增加游戏的沉浸感和趣味性。
游戏剧情生成：利用 SFT 技术，可以根据游戏的设定和玩家的行为，自动生成游戏剧情。例如，在一些角色扮演游戏中，根据玩家的选择和角色的属性，生成不同的剧情分支和任务，让每个玩家都能体验到独特的游戏故事。
游戏攻略和提示系统：基于 SFT 的语言模型可以分析游戏数据和玩家行为，为玩家提供个性化的游戏攻略和提示。例如，根据玩家在游戏中的困难点和弱点，提供相应的策略和建议，帮助玩家更好地完成游戏。

在意图识别，情绪识别豆包的AI服务降低了他们成本，比自建的成本要低很多。

一百万token/8毛钱

MRR （平均倒数排名）， Hit Rate3 （排名前三）豆包的向量模型数据表现比较好，向量数据库方面，vikingdb性能高于milvus

成本低于milvus.

然后也说了一些不足的地方。在代码审查和文本纠错上，豆包的模型准确率不高。

file

张鑫 HIAgent平台

大模型上面架设好用的应用。

提示词+向量搜索；

列举了大模型落地的10个坑点。

扣子上有很多沉淀下来的Agent可以参考和使用。

是低代码+AI的组合。

就是提供了一个设计AI Agent的平台，提供了一些指导方法论，帮助各行业快速设计和落地自己的Agent.

file

罗浩 AI全栈云

大模型的应用需要云基础设施。

核心需求是算力，即GPU ，NPU等

资源管理，高性能，稳定性。

AI全栈云支撑了字节的爆款应用。

感觉就是字节有自己的云计算服务，叫火山引擎，有各种资源，性价比高，快来买吧。

对AI应用有全生命周期的观测和自愈。

然后有标杆企业的经典案例。

file

小结

通过参加这次巡展。直观上，知道了几款AI的产品，并且下载下来使用了，体验不错。

然后依托于豆包的13个模型，各方都有真实的AI实践，以及展示。

为豆包大模型的使用埋下了影子。

可以探究一下当前服务的企业和产品，有哪些场景是可以跟豆包的13太保结合的，结合路径是怎样的。

原创不易，关注诚可贵，转发价更高！转载请注明出处，让我们互通有无，共同进步，欢迎沟通交流。

AIGC9: 火山引擎AI创新巡展

背景

开始前

谭待 -豆包模型能力演讲

吴迪企业AI转型

叶柳酷开AI实践

彭立人仙剑AI实践

张鑫 HIAgent平台

罗浩 AI全栈云

小结

李福春

引用和评论

AIGC: 10 AI转文服务器的搭建过程记录

在Java程序中监听mysql的binlog

Jerry和您聊聊Chrome开发者工具

Bitmap 和布隆过滤器傻傻分不清？你这不应该啊

Just for fun——迅速写完快速排序

Spring 实现 3 种异步流式接口，干掉接口超时烦恼

💢线上高延迟请求排查

AIGC9: 火山引擎AI创新巡展

背景

开始前

谭待 -豆包模型能力演讲

吴迪 企业AI转型

叶柳 酷开AI实践

彭立人 仙剑AI实践

张鑫 HIAgent平台

罗浩 AI全栈云

小结

李福春

引用和评论

AIGC: 10 AI转文服务器的搭建过程记录

在Java程序中监听mysql的binlog

Jerry和您聊聊Chrome开发者工具

Bitmap 和 布隆过滤器傻傻分不清？你这不应该啊

Just for fun——迅速写完快速排序

Spring 实现 3 种异步流式接口，干掉接口超时烦恼

💢线上高延迟请求排查

吴迪企业AI转型

叶柳酷开AI实践

彭立人仙剑AI实践

Bitmap 和布隆过滤器傻傻分不清？你这不应该啊