本月的论文包括语言模型、扩散模型、音乐生成、多模态等主题。1、MusicLM: Generating Music From TextPage[链接]By Andrea Agostinelli, Timeo I. Denk, et al.扩散模型和自回归离散模型都在生成音乐/音频显示出令人印象深刻的性能。与最近使用连续扩散模型的其他生成音频工作不同,MusicLM 是一种完全自回归和完全离散...
随着NLP(自然语言处理)的最新进展,OpenAI的GPT-3已经成为市场上最强大的语言模型之一。2022年1月25日,OpenAI公布了一个embedding endpoint(Neelakantan et al., 2022)。该神经网络模型将文本和代码转换为向量表示,将它们嵌入到高维空间中。这些模型可以捕获文本的语义相似性,并且在某些用例中似乎实现了最先进的性能。