预训练、微调和上下文学习

2023-06-14
阅读 3 分钟
2.5k
最近语言模型在自然语言理解和生成方面取得了显著进展。这些模型通过预训练、微调和上下文学习的组合来学习。在本文中将深入研究这三种主要方法,了解它们之间的差异,并探讨它们如何有助于语言模型的学习过程。

量子机器学习Variational Quantum Classifier (VQC)简介

2023-06-13
阅读 6 分钟
904
变分量子分类器(Variational Quantum Classifier,简称VQC)是一种利用量子计算技术进行分类任务的机器学习算法。它属于量子机器学习算法家族,旨在利用量子计算机的计算能力,潜在地提升经典机器学习方法的性能。

Segment-Anything的一些相关论文总结

2023-06-12
阅读 3 分钟
1.1k
图像级监督的弱监督语义分割(WSSS)由于其标注成本较像素级标注低而受到越来越多的关注。大多数现有方法依赖于类激活图(Class Activation Maps, CAM)来生成像素级的伪标签进行监督训练。但是CAM经常会遇到部分激活——激活最具辨别性的部分而不是整个对象区域,以及错误激活——不必要地激活对象周围的背景。这篇论文引入了一...
封面图

时间序列预测的20个基本概念总结

2023-06-11
阅读 5 分钟
1.8k
1、时间序列时间序列是一组按时间顺序排列的数据点比如:每小时的气压每年的医院急诊按分钟计算的股票价格2、时间序列的组成部分时间序列数据有三个主要组成部分。趋势季节性残差或白噪声3、趋势在时间序列中记录的长期缓慢变化/方向。4、季节性季节性是在固定时间内发生的时间序列中的循环模式。下面的时间序列显示了季...

使用NLPAUG 进行文本数据的扩充增强

2023-06-10
阅读 8 分钟
1.6k
在机器学习中,训练数据集的质量在很大程度上决定了模型的有效性。我们往往没有足够的多样化数据,这影响了模型的准确性。这时数据增强技术就派上了用场。
封面图

谷歌发布一个免费的生成式人工智能课程

2023-06-09
阅读 2 分钟
955
在过去几周,我们看到的都是AI将如何改变生活,无论是ChatGPT的文本生成,还是SD,Midjourney 的图像生成,这些AI的特点就是都是生成式的AI。而几天前,谷歌推出了一个生成式人工智能学习课程,课程涵盖了生成式人工智能入门、大型语言模型、图像生成等主题。

CAM, Grad-CAM, Grad-CAM++可视化CNN方式的代码实现和对比

2023-06-08
阅读 5 分钟
1.6k
当使用神经网络时,我们可以通过它的准确性来评估模型的性能,但是当涉及到计算机视觉问题时,不仅要有最好的准确性,还要有可解释性和对哪些特征/数据点有助于做出决策的理解。模型专注于正确的特征比模型的准确性更重要。
封面图

JupyterLab 4.0 发布了

2023-06-07
阅读 2 分钟
1.1k
JupyterLab 是 Jupyter Notebook 的下一代版本,它提供了更强大的功能和更灵活的用户界面,6月6日,官方发布了JupyterLab 4.0的说明,并且说该版本是下一个主要的版本。

使用Optuna进行PyTorch模型的超参数调优

2023-06-06
阅读 4 分钟
1k
Optuna是一个开源的超参数优化框架,Optuna与框架无关,可以在任何机器学习或深度学习框架中使用它。本文将以表格数据为例,使用Optuna对PyTorch模型进行超参数调优。
封面图

Python中的Time和DateTime

2023-06-05
阅读 3 分钟
814
Python在处理与时间相关的操作时有两个重要模块:time和datetime。在本文中,我们介绍这两个模块并为每个场景提供带有代码和输出的说明性示例。

设置和使用DragGAN:搭建非官方的演示版

2023-06-04
阅读 1 分钟
1.3k
DragGAN的官方版还没有发布,但是已经有非官方版的实现了,我们看看如何使用。DragGAN不仅让GAN重新回到竞争轨道上,而且为GAN图像处理开辟了新的可能性。正式版本将于本月发布。但是现在已经可以在一个非官方的演示中试用这个新工具了

七篇深入理解机器学习和深度学习的读物推荐

2023-06-03
阅读 5 分钟
946
在这篇文章中将介绍7篇机器学习和深度学习的论文或者图书出版物,这些内容都论文极大地影响了我对该领域的理解,如果你想深入了解机器学习的内容,哪么推荐阅读。
封面图

QLoRa:在消费级GPU上微调大型语言模型

2023-06-02
阅读 4 分钟
2.5k
大多数大型语言模型(LLM)都无法在消费者硬件上进行微调。例如,650亿个参数模型需要超过780 Gb的GPU内存。这相当于10个A100 80gb的gpu。就算我们使用云服务器,花费的开销也不是所有人都能够承担的。

这8个NumPy函数可以解决90%的常见问题

2023-06-01
阅读 5 分钟
926
NumPy是一个用于科学计算和数据分析的Python库,也是机器学习的支柱。可以说NumPy奠定了Python在机器学习中的地位。NumPy提供了一个强大的多维数组对象,以及广泛的数学函数,可以对大型数据集进行有效的操作。这里的“大”是指数百万行。

DHVT:在小数据集上降低VIT与卷积神经网络之间差距,解决从零开始训练的问题

2023-05-31
阅读 3 分钟
903
在信道方面,引入了MLP中的动态特征聚合模块和多头注意力模块中全新的“head token”设计,帮助重新校准信道表示,并使不同的信道组表示相互交互。

基于GMM的一维时序数据平滑算法

2023-05-30
阅读 18 分钟
874
假设我们想要在音频记录中检测一个特定的人的声音,并获得每个声音片段的时间边界。例如,给定一小时的流,管道预测前10分钟是前景(我们感兴趣的人说话),然后接下来的20分钟是背景(其他人或没有人说话),然后接下来的20分钟是前景段,最后10分钟属于背景段。
封面图

数据偏度介绍和处理方法

2023-05-29
阅读 3 分钟
1.5k
偏度(skewness)是用来衡量概率分布或数据集中不对称程度的统计量。它描述了数据分布的尾部(tail)在平均值的哪一侧更重或更长。偏度可以帮助我们了解数据的偏斜性质,即数据相对于平均值的分布情况。
封面图

深入了解平均精度(mAP):通过精确率-召回率曲线评估目标检测性能

2023-05-28
阅读 5 分钟
2.4k
平均精度(Average Precision,mAP)是一种常用的用于评估目标检测模型性能的指标。在目标检测任务中,模型需要识别图像中的不同目标,并返回它们的边界框(bounding box)和类别。mAP用于综合考虑模型在不同类别上的准确度和召回率。

Scikit-LLM:将大语言模型整合进Sklearn的工作流

2023-05-27
阅读 5 分钟
1.1k
我们以前介绍过Pandas和ChaGPT整合,这样可以不了解Pandas的情况下对DataFrame进行操作。现在又有人开源了Scikit-LLM,它结合了强大的语言模型,如ChatGPT和scikit-learn。但这个并不是让我们自动化scikit-learn,而是将scikit-learn和语言模型进行整合,scikit-learn也可以处理文本数据了。
封面图

PyTorch-Forecasting一个新的时间序列预测库

2023-05-26
阅读 2 分钟
1.1k
时间序列预测在金融、天气预报、销售预测和需求预测等各个领域发挥着至关重要的作用。PyTorch- forecasting是一个建立在PyTorch之上的开源Python包,专门用于简化和增强时间序列的工作。在本文中我们介绍PyTorch-Forecasting的特性和功能,并进行示例代码演示。
封面图

Meta 开源语音 AI 模型支持 1,100 多种语言

2023-05-25
阅读 2 分钟
674
自从ChatGPT火爆以来,各种通用的大型模型层出不穷,GPT4、SAM等等,本周一Meta 又开源了新的语音模型MMS,这个模型号称支持4000多种语言,并且发布了支持1100种语言的预训练模型权重,最主要的是这个模型不仅支持ASR,还支持TTS,也就是说不仅可以语音转文字,还可以文字转语音。
封面图

Jupyter Notebook 10个提升体验的高级技巧

2023-05-24
阅读 4 分钟
906
Jupyter 笔记本是数据科学家和分析师用于交互式计算、数据可视化和协作的工具。Jupyter 笔记本的基本功能大家都已经很熟悉了,但还有一些鲜为人知的技巧可以大大提高生产力和效率。在这篇文章中,我将介绍10个可以提升体验的高级技巧。
封面图

升级到PyTorch 2.0的技巧总结

2023-05-23
阅读 13 分钟
1.5k
PyTorch 2.0 发布也有一段时间了,大家是不是已经开始用了呢? PyTorch 2.0 通过引入 torch.compile,可以显着提高训练和推理速度。 与 eagerly 模式相反,编译 API 将模型转换为中间计算图(FX graph),然后以某种方式将其编译为低级计算内核,这样可以提高运行速度。
封面图

计算GMAC和GFLOPS

2023-05-22
阅读 4 分钟
1.6k
GMAC 代表“Giga Multiply-Add Operations per Second”(每秒千兆乘法累加运算),是用于衡量深度学习模型计算效率的指标。它表示每秒在模型中执行的乘法累加运算的数量,以每秒十亿 (giga) 表示。
封面图

NSFW 图片分类

2023-05-21
阅读 8 分钟
1.4k
NSFW指的是 不适宜工作场所("Not Safe (or Suitable) For Work;")。在本文中,将介绍如何创建一个检测NSFW图像的图像分类模型。

常用的视频帧提取工具和方法总结

2023-05-20
阅读 3 分钟
2.5k
视频理解任务最基础也是最主要的预处理任务是图像帧的提取。因为在视频理解任务中,视频可以看作是由一系列连续的图像帧组成的。因此,要对视频进行理解和分析,首先需要从视频中提取出每一帧的图像。
封面图

使用大语言模型集成工具 LangChain 创建自己的论文汇总和查询工具

2023-05-19
阅读 5 分钟
2.3k
Langchain可以帮助开发人员构建由大型语言模型(llm)支持的应用程序。它提供一个框架将LLM与其他数据源(如互联网或个人文件)连接起来。这允许开发人员将多个命令链接在一起,以创建更复杂的应用程序。包括最近比较火爆的AutoGPT等都是使用了Langchain框架进行开发的。所以本文将介绍如何使用LangChain来创建我们自己的论...
封面图

LoRA:大模型的低秩自适应微调模型

2023-05-18
阅读 2 分钟
1.8k
对于大型模型来说,重新训练所有模型参数的全微调变得不可行。比如GPT-3 175B,模型包含175B个参数吗,无论是微调训练和模型部署,都是不可能的事。所以Microsoft 提出了低秩自适应(Low-Rank Adaptation, LoRA),它冻结了预先训练好的模型权重,并将可训练的秩的分解矩阵注入到Transformer体系结构的每一层,从而大大减...

Github Copilot Chat的规则泄露,详细分析这31条规则

2023-05-17
阅读 4 分钟
946
GitHub Copilot 是一款由 GitHub 和 OpenAI 共同开发的人工智能编程助手。它是一种基于机器学习的代码自动完成工具,旨在帮助开发人员更高效地编写代码。
封面图

LayerNorm 在 Transformers 中对注意力的作用研究

2023-05-16
阅读 1 分钟
964
LayerNorm 一直是 Transformer 架构的重要组成部分。如果问大多人为什么要 LayerNorm,一般的回答是:使用 LayerNorm 来归一化前向传播的激活和反向传播的梯度。
封面图