头图

这张图片介绍了 Foundation Models,Large Language Models(大语言模型),ChatGPT 和 Generative AI 这几个概念的包含关系和辨析。

Foundation Models 是一种基于海量数据集上训练的神经网络,可应用于许多不同类型的任务。

Foundation Models 训练时的目标是自监督学习(Self-Supervised Learning),自监督学习使得模型在没有标签的情况下,也能够通过预测自身生成的数据来进行训练。

这种结合使得 Foundation Models 具备了在广泛领域中获取知识的能力。

而大语言模型,属于 Foundation Models 的一种,只不过这种模型训练的数据,是纯粹的 Text 罢了。

ChatGPT,则是目前大语言模型里最吸引眼球,也是我每天日常工作和生活使用最多的 LLM.

Generative AI,是基于 Foundation Models 的一种应用,能够根据用户 Prompt 来创建新的输出,这些输出可以是文本、图像、声音、视频等格式。

Generative AI 使用的 Foundation Models 的一个演化方向就是多模态模型(Multi-Modal Models)。多模态模型能够处理多种形式的数据,例如将文本转换为图像,或者能够查看图像和视频,并用文本描述它们的内容。

生成式AI的核心思想是让机器学习到数据的分布,然后利用学到的模型生成新的数据样本。这与传统的监督学习不同,后者通常依赖于有标签的数据集。生成式AI旨在拓展计算机系统的创造力和创新性,使其能够产生更具创造性和复杂性的输出。

例子1:图像生成

生成式对抗网络(Generative Adversarial Networks,简称GANs)是生成式AI领域的一个杰出代表。GANs由一个生成器和一个判别器组成,二者通过对抗学习的方式相互提升。生成器试图生成真实样本,而判别器则努力区分真实样本和生成样本。通过这种竞争关系,生成器逐渐提升生成样本的质量,最终达到可以以假乱真的水平。GANs在图像生成领域取得了巨大成功,可以生成逼真的照片、艺术品等。

例子2:自然语言处理

另一个生成式AI的应用是自然语言生成(NLG)。通过循环神经网络(Recurrent Neural Networks,简称RNNs)或变压器(Transformer)等模型,生成式AI可以学习语言的结构和语法规则,并生成符合语言风格的文本。这种技术可以应用于自动摘要、对话系统、文章创作等领域。

例子3:音乐创作

生成式AI还可用于音乐创作。通过学习大量的音乐作品,生成式模型可以理解音乐的结构、旋律和和声规律。然后,它可以生成新的音乐片段,甚至可以模仿特定风格或艺术家的音乐创作风格。

生成式AI的发展使得计算机系统在创造性和创新性方面取得了显著的进展。然而,这也引发了一系列的伦理和法律问题,如知识产权、虚假信息生成等。因此,在推动生成式AI技术的同时,我们也需要认真考虑并解决相关的社会和伦理问题。


注销
1k 声望1.6k 粉丝

invalid