SF
IDP技术干货
IDP技术干货
注册登录
关注博客
注册登录
主页
关于
RSS
轻松理解 Transformers (3): Feed-Forward Layer部分
Baihai_IDP
2023-11-06
阅读 6 分钟
2k
编者按:随着人工智能技术的不断发展Transformer架构已经成为了当今最为热门的话题之一。前馈层作为Transformer架构中的重要组成部分,其作用和特点备受关注。本文通过浅显易懂的语言和生活中的例子,帮助读者逐步理解Transformers中的前馈层。本文是Transformers系列的第三篇。作者的观点是:前馈层在Transformer架构中...
轻松理解 Transformers(2):Attention部分
Baihai_IDP
2023-10-30
阅读 9 分钟
833
编者按:随着人工智能技术的不断发展,Transformers 模型架构已成为自然语言处理领域的重要基石。然而,许多人对其内部工作机制仍然感到困惑。本文通过浅显易懂的语言和生活中的例子,帮助读者逐步理解 Transformers 中最核心的 Attention 机制。本文是Transformers系列的第二篇。作者的核心观点是:Attention 机制是 Tr...
Embeddig技术与应用 (1) :Embedding技术发展概述及Word2Vec
Baihai_IDP
2023-09-25
阅读 6 分钟
1.8k
编者按:嵌入(Embedding)是机器学习中一种将高维稀疏向量转换为低维稠密向量的技术。其通常用于处理自然语言、图像等高维离散数据。嵌入能够有效地解决维度灾难问题,减少存储和计算成本,同时提高模型的表达能力。我们还可以通过得到的嵌入向量进行语义相似度计算、推荐系统、分类任务等多种应用。嵌入还可以用于处理非...
大语言模型评估全解:评估流程、评估方法及常见问题
Baihai_IDP
2023-07-17
阅读 12 分钟
1.6k
编者按:随着对大语言模型(LLM)评估领域的深入研究,我们更加清楚地认识到全面理解评估过程中的问题对于有效评估LLM至关重要。本文探讨了机器学习模型评估中出现的常见问题,并深入研究了LLM对模型评估领域带来的重大挑战。在评估方法方面,我们将其划分为直接评估指标、基于辅助模型的评估和基于模型的评估。本文还强...
AI近十年盘点:纵览AI发展历程,探寻AI未来走向
Baihai_IDP
2023-06-25
阅读 10 分钟
1.5k
编者按:当我们回顾过去十年的人工智能发展历程时,可以看到一场现在还正在进行的变革,对我们的工作方式、商业运营模式和人际交往行为都产生了深远的影响。从2013年的AlexNet到变分自编码器,再到最近的生成式大模型,人工智能技术不断出现的突破性进展推动着整个领域的蓬勃发展。本文将为您深度解读这些关键性技术突破...
如何评估大型语言模型(LLM)?
Baihai_IDP
2023-06-19
阅读 4 分钟
2.4k
编者按:近期几乎每隔一段时间,就有新的大语言模型发布,但是当下仍然没有一个通用的标准来评估这些大型语言模型的质量,我们急需一个可靠的、综合的LLM评估框架。本文说明了为什么我们需要一个全面的大模型评估框架,并介绍了市面上这些现有的评估框架,同时指出这些框架存在的问题,最后说明如何评估大型语言模型(LL...
想要更好地理解大模型架构?从计算参数量快速入手
Baihai_IDP
2023-06-12
阅读 10 分钟
1.2k
编者按:要理解一种新的机器学习架构(以及其他任何新技术),最有效的方法就是从头开始实现它。然而,还有一种更简单的方法——计算参数数量。通过计算参数数量,读者可以更好地理解模型架构,并检查其解决方案中是否存在未被发现的错误。该文章提供了精确的Transformers模型的参数量计算公式和不太准确的简略公式版本,...
All in AI,现在开始算不算太晚?
Baihai_IDP
2023-05-08
阅读 6 分钟
972
编者按:目前大模型近乎可以帮助人类处理方方面面的事情,如对话、写文章、写代码等等。在大模型“狂飙”趋势下,想要从事AI领域的小伙伴可能会犹疑:现在进入AI领域会不会已经太晚了?本文作者结合自身转型经历和对AI市场的研判,阐述了进入人工智能领域从来都不会太晚,There's no time like the present。本文还详述了...
IDPChat:探索基于LLaMA和Stable Diffusion的「开源」中文多模态AI大模型
Baihai_IDP
2023-04-17
阅读 2 分钟
1.4k
中文多模态模型 IDPChat 和大家见面了。随着GPT4、文心一言等的发布,预训练大模型正式开启由单模态向多模态模型演进。多模态的特性为语言模型带来更加丰富的应用场景。我们认为,未来的AI应用将主要以大模型为核心基石。而在大模型的领域,基于基础模型(Foundation model)构建领域或企业自有的大模型,会是近中期的重...
万字详解AI开发中的数据预处理(清洗)
Baihai_IDP
2023-03-27
阅读 9 分钟
1.8k
编者按:在现实生活中,大多数数据都需要进行清洗和预处理,以便在使用数据时达到最佳效果。机器学习流程只能处理数字,因此需要找到一种方法将非数字特征转化为数字表示。本文还介绍了三种缺失值类型:完全缺失、随机缺失和非随机缺失,并教授如何使用Python来检测和处理缺失值。通过阅读本文,我相信你将了解什么是数...
大语言模型(LLMs)和新兴机器学习技术栈
Baihai_IDP
2023-03-20
阅读 4 分钟
2.5k
编者按:过去,NLP开发人员依赖于文本分类、命名实体识别和命名实体消歧等技术栈来优化NLP任务。然而,随着大语言模型(LLM)的快速发展,新的技术栈开始出现,以支持和加速这些大型语言模型的实现和应用。让我们一起跟随Langchain的开发者,共同探讨LLM及NLP技术栈正在发生的变化,以及这一系列变化对开发者的意义。以下...
解析机器学习中的数据漂移问题
Baihai_IDP
2023-02-06
阅读 9 分钟
1.8k
编者按:当模型在生产中呈现的输入与训练期间提供的分布不对应时,通常会发生数据漂移。Vatsal P.的这篇文章,介绍了如何通过漂移指标直观了解数据漂移程度,并n通过一个使用合成数据的例子来展示如何利用Python计算数据随时间的漂移指标。以下是译文,Enjoy!
AIGC神器CLIP:技术详解及应用示例
Baihai_IDP
2023-01-15
阅读 9 分钟
5.7k
编者按:上一期,我们介绍了Diffusion模型的发展历程、核心原理及其对AIGC发展的推动作用。本期,我们将共同走进另一项AI重要突破——CLIP,著名的DALLE和Stable Diffusion均采用了CLIP哦。
AI 2022:浪潮奔涌,百舸争流
Baihai_IDP
2022-12-26
阅读 3 分钟
1.2k
编者按:2022年已接近尾声,但技术的发展永不落幕。许多人说,2022是生成式AI的一年。这一年里,我们见证了Stable Diffusion和DALL-E2等AI图像编辑/绘画工具的爆发,也目睹了ChatGPT狂热席卷全球。但AI技术和产业的发展,远不仅仅是聚光灯下的生成式AI / AIGC 可以全权代表的。我们为大家精选了三篇相对全面客观的深度回...
Transformer:让ChatGPT站在肩膀上的巨人?
Baihai_IDP
2022-12-19
阅读 5 分钟
2.5k
编者按:ChatGPT以近乎狂热之势席卷了全网。在沉浸于“ChatGPT潮”的同时,让我们也来深入了解一下它和基石技术 - 大模型 Transformer吧。Dale Markowitz的这篇文章为我们深入浅出地介绍了Transformer的重要性、创新性、应用领域等。以下是译文,Enjoy!
超参数优化完整指南
Baihai_IDP
2022-12-12
阅读 6 分钟
2.6k
编者按:今天为大家带来的一份超全的超参数调优指南,可谓一文在手,超参数调优无敌手。本文主要介绍了超参数调优的基本概念、常用方法和算法,以及超参数调优的工具推荐。小编温馨提示,全文阅读预计需要20-30分钟,可以先收藏哦!话不多说,开启超参数调优之旅吧,Enjoy!
理解DALL·E 2, Stable Diffusion和 Midjourney工作原理
Baihai_IDP
2022-12-05
阅读 4 分钟
4.2k
编者按:随着AIGC的兴起,各位小伙伴们对文生图工具DALL-E 2、Stable Diffusion和Midjourney一定并不陌生。本期IDP Inspiration,小白将和大家一同走进这三者背后的技术原理,一探究竟。以下是译文,Enjoy!
联通DataOps和MLOps:将机器学习推理作为新的数据源
Baihai_IDP
2022-11-30
阅读 4 分钟
1.4k
编者按:随着大数据和AI的关注重点转向工程化和能效,DataOps和MLOps逐渐兴起。DataOps侧重于提高数据分析质量、缩短数据交付周期,MLOps侧重于快速交付AI模型。数据是AI开发生产的重要元素,在数据驱动的AI时代,割裂的DataOps和MLOps是否依然能满足企业数据挖掘和AI应用的需求? 带着这个疑问,IDP和大家一起跟随资深AI...
常用AI/机器学习模型可解释技术与工具
Baihai_IDP
2022-11-30
阅读 6 分钟
2.1k
编者按:随着AI模型日益复杂,模型可解释的重要性和挑战日益凸显。通过模型可解释,可以指导特征工程的优化、检测偏差、增强模型使用者对模型的可信度。Anaconda资深数据科学家Sophia Yang总结了8种模型可解释常用技术和工具,对其主要特征进行了概述。以下是译文,Enjoy!
走进一款新的文生图模型 - Nvidia eDiff-I
Baihai_IDP
2022-11-29
阅读 4 分钟
2.7k
编者按:AIGC(AI生成内容)目前正处于爆发前夜。在前几期的IDP Inspirtation,我们曾经介绍过大语言模型GPT-3,图像编辑模型Imagic和Runway Erase and Replace。本期,让我们跟随Victor Dey一起走进Nvidia的文生图模型eDiff-I,并一起探讨生成式AI的现状挑战和未来前景。以下是译文,Enjoy!
一文详解AI模型部署策略
Baihai_IDP
2022-11-22
阅读 4 分钟
2.7k
编者按:模型部署是AI开发生产流程中的重要步骤。对于许多组织而言,选择最佳的模型部署策略以扩展到生产级系统,都是一项复杂且具有挑战的工作。今天IDP将和大家一同,跟随Yashawi Nayak,全面了解模型部署策略。“这篇文章是为那些想了解ML模型如何在生产中部署以及在部署这些模型时可以使用什么策略的人准备的。本文将...
一文读懂数据科学 Notebook
Baihai_IDP
2022-09-03
阅读 3 分钟
2.2k
【编者按:本文主要介绍什么是 Notebook,Notebook 在数据科学领域的应用的重要性与优势,以及数据科学家/算法团队在选择 Notebook 时需考虑哪些关键因素。同时,基于 Notebook 的筛选考量维度,对常见的 Notebook 进初步对比分析,为数据科学家、算法工程师提供参考。】
Notebook在复现数据科学研究成果中的丝滑使用
Baihai_IDP
2022-06-13
阅读 3 分钟
1.8k
IDP中提供自研notebook交互式编程环境,它非常适合做数据分析与代码展示,主要功能包括:智能开发、自适配环境、一键运行、一键连接数据源、各种其他平台工具集成、可视化工作流管理等等。
如何成为更好的AI专业人员?请查收这7条实战经验
Baihai_IDP
2022-04-12
阅读 4 分钟
1.5k
在从事机器学习、人工智能和开发工作近六年后,我列出了我多年来从成功和失败的项目中总结的七条经验教训。最核心的一点是,尽管学习了无数的模型和技术,一名高效、专业的数据科学家和算法工程师要学会尽可能避免复杂性。毕竟真正驱动商业价值的是对紧迫问题的有效解决,而非盲目追求最先进的技术。
这场汇聚行业顶级大咖的 Meetup,有哪些不容错过的干货?| IDP Meetup 01 亮点回顾
Baihai_IDP
2022-03-10
阅读 4 分钟
1.6k
2022 年 3 月 5 日,首次 IDP Meetup 成功举办。此次 IDP Meetup 以“AI 开发生产平台及其共荣生态”为主题,6 位业界顶级大咖汇聚一堂,与关注、热爱 AI 和基础技术的极客们共创了一场精彩的知识盛宴。
AI冬奥 | 未来已来?走进元宇宙入口-虚拟数字人
Baihai_IDP
2022-02-14
阅读 4 分钟
1.9k
2022年2月4日,冬奥会正式开幕。在开幕式及冬奥会赛事进程中,人工智能、5G、AR、裸眼3D和云等多种硬科技大显神通。其中,作为元宇宙场景入口和连接纽带的虚拟数字人技术尤为引人注目。本次冬奥会的手语主播和气象主播均为虚拟数字人。
使用CodeMirror打造数据科学家使用的IDE(一)
Baihai_IDP
2022-01-24
阅读 4 分钟
3.3k
CodeMirror是一个用 JavaScript 实现的通用文本编辑器,它专门用于代码编辑,内置多种开发语言模式和插件,支持代码高亮、自动补全、查找、快捷键等。
AI开发平台系列2:集成式机器学习平台对比分析
Baihai_IDP
2022-01-20
阅读 4 分钟
4.1k
【编者按:在上一期中,我们介绍了算法开发平台的发展背景和驱动力,算法开发平台的主要分类——集成式机器学习平台和AI基础软件平台,以及算法开发平台的核心价值。在本期的分享中,我们将上期所提到的云厂商集成式机器学习平台进行功能和技术的具体分析和对比】
AI开发平台系列1:AI开发平台“家族”概览
Baihai_IDP
2022-01-14
阅读 4 分钟
3.6k
【编者按:AI技术蓬勃发展,已逐渐渗透进国民经济的各行各业。但企业在AI技术的应用仍面临数据、算法、技术等方面的挑战,需专业AI开发与计算工具帮助企业降低AI应用门槛,加速创新。在此趋势下,AI开发平台纷纷涌现。白海科技将通过系列文章,梳理典型AI开发平台,并对其技术与功能进行对比分析,为广大企业与行业伙伴...