上图是一个参加技术大会的程序员,使用豆包文生图得到。
背景
随着计算机硬件发展、互联网普及、深度学习技术突破以及大数据的积累,人工智能在 21 世纪迎来快速发展。
2012 年深度学习技术在图像识别领域取得突破,
2017 年 Google 提出 Transformer 架构,奠定大模型预训练算法基础。
2022 年 OpenAI 推出的 ChatGPT 更是引发了全球对人工智能的高度关注。
开始前
14点开始,我是13点到的。
地点在深圳鹏瑞酒店2楼,到了之后门口有指路的。直接走进去,连上两层电梯。
门口安检进去,然后扫描签到,拿一张参会嘉宾卡。
会议室前面有4个展台。简单拍了一下,也体验了一把。
分别是:
豆包APP: 我玩过很久了,体验比国内其它的AI应用要好。
HiAgent:快速定制智能体,录入提示词,知识库,选择模型,可以直接使用api调用。
海绵音乐:可以创作歌词,选择音色和风格创造音乐。
猫箱:一张图,对应的智能体会跟你聊天。
然后是一个摩天轮,上面是豆包上的各种模型。
然后是按照大纲听了各位老总的讲解。
谭待 -豆包模型能力演讲
首先感谢谭总。
我简单叙述和思考一下。
豆包大模型一天使用的token数量13000亿,图片处理5000万张,语音处理85小时。
说明增长很快。
豆包大模型家族包含了13太保:
1 通用模型pro
2 通用模型lite
3 角色扮演模型
4 FunctionCall模型
5 向量化模型
6 视频生成模型
7 文生图模型
8 图生图模型
9 同声传译模型
10 音乐模型
11 语音识别模型
12 语音合成模型
13 声音复刻模型
通用模型pro的能力增长很快,在数学,专业知识,综合能力,大马,指令上进化很快。
TPM: 每分钟token数量。
豆包大模型的初始并发很牛逼, 80W的 TPM。
可以轻松满足 写作,智能座舱,文献翻译等场景。
升级了上下文窗口容量,达到了256K 。 即25.6万个字符,一般的对话智能分析完全没问题。
文生视频模型效果很震撼,但是豆包上没入口。
文生视频可以应用再 电商营销,动画教育,城市文旅,剧本创作上;
然后是一个非常漂亮的美女展示了 即梦和剪映使用豆包视频模型。
然后效果非常震撼,
让高适唱现代歌曲。
让古代画家跟你一起画画
学习纠错
数字人(音色克隆,智能翻译) 让你的在另外一个世界说话,而且会说很多国家的话。
还有一些比如智能抠图,营销话术生成,批量编辑图片,创造奇妙的视频。
创建好脚本,设置好视觉效果,即可生成视频,然后进行剪辑。
这个可以去试试,创作很方便。
豆包音乐模型很牛逼,输入提示词语,可以生成歌词,选择旋律,我晚上用这个创作歌曲哄我儿子睡觉,效果很好。
同声传译用来开跨国会议挺好的,可以实现实时翻译,音色精准,还可以复刻自己的声音。
然后介绍了火山引擎作为云计算平台上面的一些产品。
吴迪 企业AI转型
开篇总结的很好。
好用,低成本,容易落地 是AI大模型落地要保证。
然后答案是豆包,摆出了论据, 当前使用量大。
家族13太保。
有标杆的企业实践。
文生图模型升级了,可以进行复杂图文匹配,急速出图,对中文也理解透彻。
语音合成场景应用丰富。
视频生成是最炫的。
音乐生成很动人。
然后主推火山方舟, 高性能,安全,效果好,性价比高,容易落地 。
并发支持体系介绍,TPM , RPM 的指标高于竞品。
云计算底层算力强,调度算法优秀。
Context上下文缓存也作为亮点,
然后是安全的介绍: 身份认证,环境隔离,数据保密,信息无痕,操作可审计;日志全面而丰富。
然后是扩展性: 支持的知识库容量更大,处理速度更快,召回率更高;
叶柳 酷开AI实践
OTT 是 “Over The Top” 的缩写,指的是互联网公司越过运营商,发展基于开放互联网的各种视频及数据服务业务。它运营在用户已获得的网络之上,不需要网络运营商额外的商业或技术支撑。
酷开是一个在OTT领域很牛逼的公司。
AI解决了大屏行业的问题: 运营成本高,内容推荐智能,操作复杂;
通过智能海报,智能识别得到了大量的素材。 提高了材料的质量和效率,并且自动打标签。
智能短视频借助AI :
输入,视频理解,视频生成,输出,应用整个流程 加速了推广和覆盖用户的质量和效率。
智能推荐: 借助豆包提高了用户粘性和忠诚度。
这里感觉比较牛逼,放一个图,后面也可以复刻一下,智能推荐很重要,增加用户粘性的核武器。
智能管家可以识别各种方言,用到了实时翻译模型。
AI故事和绘本,使用了豆包的生文生图模型。
基于用户的数据创建了专属壁纸。
借助AI , 酷开在智能内容,新闻资讯,语音会话,外语练习,推荐算法这块推出了很多牛逼的功能和产品。
然后预言后面会是AI告诉发展的30年。
彭立人 仙剑AI实践
SFT : 监督式微调(Supervised Fine-Tuning):这是一种机器学习技术,特别是在自然语言处理领域,用于优化预训练的语言模型以适应特定的任务或数据集。在游戏领域的应用场景如下:
游戏中的智能 NPC:通过 SFT 技术对语言模型进行微调,可以让游戏中的 NPC 具有更智能的对话能力。例如,NPC 可以根据玩家的提问和游戏情境,给出更准确、更合理的回答,增加游戏的沉浸感和趣味性。
游戏剧情生成:利用 SFT 技术,可以根据游戏的设定和玩家的行为,自动生成游戏剧情。例如,在一些角色扮演游戏中,根据玩家的选择和角色的属性,生成不同的剧情分支和任务,让每个玩家都能体验到独特的游戏故事。
游戏攻略和提示系统:基于 SFT 的语言模型可以分析游戏数据和玩家行为,为玩家提供个性化的游戏攻略和提示。例如,根据玩家在游戏中的困难点和弱点,提供相应的策略和建议,帮助玩家更好地完成游戏。
在意图识别,情绪识别 豆包的AI服务降低了他们成本,比自建的成本要低很多。
一百万token/8毛钱
MRR (平均倒数排名), Hit Rate3 (排名前三) 豆包的向量模型数据表现比较好,向量数据库方面,vikingdb性能高于milvus
成本低于milvus.
然后也说了一些不足的地方。 在代码审查和文本纠错上,豆包的模型准确率不高。
张鑫 HIAgent平台
大模型上面架设好用的应用。
提示词+向量搜索 ;
列举了大模型落地的10个坑点。
扣子上有很多沉淀下来的Agent可以参考和使用。
是低代码+AI的组合。
就是提供了一个设计AI Agent的平台,提供了一些指导方法论,帮助各行业快速设计和落地自己的Agent.
罗浩 AI全栈云
大模型的应用需要云基础设施。
核心需求是算力,即GPU ,NPU等
资源管理,高性能,稳定性。
AI全栈云支撑了字节的爆款应用。
感觉就是字节有自己的云计算服务,叫火山引擎,有各种资源,性价比高,快来买吧。
对AI应用有全生命周期的观测和自愈。
然后有标杆企业的经典案例。
小结
通过参加这次巡展。 直观上,知道了几款AI的产品,并且下载下来使用了,体验不错。
然后依托于豆包的13个模型,各方都有真实的AI实践,以及展示。
为豆包大模型的使用埋下了影子。
可以探究一下当前服务的企业和产品,有哪些场景是可以跟豆包的13太保结合的,结合路径是怎样的。
原创不易,关注诚可贵,转发价更高!转载请注明出处,让我们互通有无,共同进步,欢迎沟通交流。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。