用强化学习玩《超级马里奥》

2022-12-01
阅读 4 分钟
1.5k
Pytorch的一个强化的学习教程( Train a Mario-playing RL Agent)使用超级玛丽游戏来学习双Q网络(强化学习的一种类型),官网的文章只有代码, 所以本文将配合官网网站的教程详细介绍它是如何工作的,以及如何将它们应用到这个例子中。
封面图

MSE = Bias² + Variance?什么是“好的”统计估计器

2022-11-30
阅读 3 分钟
957
本文的目的并不是要证明这个公式,而是将他作为一个入口,让你了解统计学家如何以及为什么这样构建公式,以及我们如何判断是什么使某些估算器比其他估算器更好。
封面图

使用PyTorch实现简单的AlphaZero的算法(3):神经网络架构和自学习

2022-11-29
阅读 5 分钟
959
从我们之前的文章中,介绍了蒙特卡洛树搜索 (MCTS) 的工作原理以及如何使用它来获得给定棋盘状态的输出策略。我们也理解神经网络在 MCTS 中的两个主要作用;通过神经网络的策略输出来指导探索,并使用其价值输出代替传统的蒙特卡洛rollout算法。

10个实用的数据可视化的图表总结

2022-11-28
阅读 7 分钟
1.9k
可视化是一种方便的观察数据的方式,可以一目了然地了解数据块。我们经常使用柱状图、直方图、饼图、箱图、热图、散点图、线状图等。这些典型的图对于数据可视化是必不可少的。除了这些被广泛使用的图表外,还有许多很好的却很少被使用的可视化方法,这些图有助于完成我们的工作,下面我们看看有那些图可以进行。
封面图

BT - Unet:生物医学图像分割的自监督学习框架

2022-11-27
阅读 2 分钟
1.8k
BT-Unet采用Barlow twin方法对U-Net模型的编码器进行无监督的预训练减少冗余信息,以学习数据表示。之后,对完整网络进行微调以执行实际的分割。

使用Python进行交易策略和投资组合分析

2022-11-26
阅读 6 分钟
1.8k
我们将在本文中衡量交易策略的表现。并将开发一个简单的动量交易策略,它将使用四种资产类别:债券、股票和房地产。这些资产类别的相关性很低,这使得它们成为了极佳的风险平衡选择。
封面图

使用HuggingFace实现 DiffEdit论文的掩码引导语义图像编辑

2022-11-25
阅读 18 分钟
1.2k
在本文中,我们将实现Meta AI和Sorbonne Universite的研究人员最近发表的一篇名为DIFFEDIT的论文。对于那些熟悉稳定扩散过程或者想了解DiffEdit是如何工作的人来说,这篇文章将对你有所帮助。

自回归滞后模型进行多变量时间序列预测

2022-11-24
阅读 4 分钟
3k
一种常见的方法是将该变量其视为单变量时间序列。这样就有很多方法可以用来模拟这些系列。比如 ARIMA、指数平滑或 Facebook 的 Prophet,还有自回归的机器学习方法也可以使用。

从头开始进行CUDA编程:流和事件

2022-11-23
阅读 17 分钟
1.1k
前两篇文章我们介绍了如何使用GPU编程执行简单的任务,比如令人难以理解的并行任务、使用共享内存归并(reduce)和设备函数。为了提高我们的并行处理能力,本文介绍CUDA事件和如何使用它们。但是在深入研究之前,我们将首先讨论CUDA流。

2022年11月10篇论文推荐

2022-11-22
阅读 7 分钟
1.2k
随着最大的人工智能研究会议(NeurIPS 2022)即将到来,我们进入了2022年的最后阶段。让我们回顾一下人工智能世界最近发生了什么。在介绍推荐论文之前,先说一个很有意思的项目:img-to-music:想象图像听起来是什么样的模型! [链接]。有兴趣的可以看看。下面我们开始介绍10篇推荐的论文。这里将涵盖强化学习(RL)、扩散模型...

特征选择技术总结

2022-11-21
阅读 8 分钟
1.7k
在本文中,我们将回顾特性选择技术并回答为什么它很重要以及如何使用python实现它。本文还可以帮助你解答以下的面试问题:什么是特征选择?说出特性选择的一些好处你知道哪些特征选择技巧?区分单变量、双变量和多变量分析。我们能用PCA来进行特征选择吗?前向特征选择和后向特征选择的区别是什么?什么是特征选择,为什么它...
封面图

使用马尔可夫链构建文本生成器

2022-11-19
阅读 6 分钟
1.3k
本文中将介绍一个流行的机器学习项目——文本生成器,你将了解如何构建文本生成器,并了解如何实现马尔可夫链以实现更快的预测模型。文本生成器简介文本生成在各个行业都很受欢迎,特别是在移动、应用和数据科学领域。甚至新闻界也使用文本生成来辅助写作过程。在日常生活中都会接触到一些文本生成技术,文本补全、搜索建...
封面图

Stable Diffusion的入门介绍和使用教程

2022-11-18
阅读 10 分钟
18.3k
Stable Diffusion是一个文本到图像的潜在扩散模型,由CompVis、Stability AI和LAION的研究人员和工程师创建。它使用来自LAION-5B数据库子集的512x512图像进行训练。使用这个模型,可以生成包括人脸在内的任何图像,因为有开源的预训练模型,所以我们也可以在自己的机器上运行它,如下图所示。

TwoModalBERT进行角色分类

2022-11-17
阅读 3 分钟
966
你是否遇到过数据集中有多个文本特性的情况?例如,根据消息的上下文正确地对消息进行分类,即理解前面的消息。比如说我们有下面的数据集,需要对其进行分类。

经典CNN设计演变的关键总结:从VGGNet到EfficientNet

2022-11-16
阅读 6 分钟
1k
一般来说,分类问题是计算机视觉模型的基础,它可以延申解决更复杂的视觉问题,例如:目标检测的任务包括检测边界框并对其中的对象进行分类。而分割的任务则是对图像中的每个像素进行分类。
封面图

PyTorch常用5个抽样函数

2022-11-15
阅读 2 分钟
771
PyTorch是一个开源的深度学习框架,它提供了一个用于高级特性的Python包。在本文中,我们将介绍PyTorch中的常见抽样函数。抽样是一个统计过程,它从总体中提取一个子集,通过子集来研究整个总体。

时间序列分析中的自相关

2022-11-14
阅读 3 分钟
2k
什么是自相关以及为什么它在时间序列分析中是有用的。在时间序列分析中,我们经常通过对过去的理解来预测未来。为了使这个过程成功,我们必须彻底了解我们的时间序列,找到这个时间序列中包含的信息。自相关就是其中一种分析的方法,他可以检测时间系列中的某些特征,为我们的数据选择最优的预测模型。在这篇简短的文章...
封面图

从头开始进行CUDA编程:线程间协作的常见技术

2022-11-13
阅读 12 分钟
667
在前一篇文章中,我们介绍了如何使用 GPU 运行的并行算法。这些并行任务是那些完全相互独立的任务,这点与我们一般认识的编程方式有很大的不同,虽然我们可以从并行中受益,但是这种奇葩的并行运行方式对于我们来说肯定感到非常的复杂。所以在本篇文章的Numba代码中,我们将介绍一些允许线程在计算中协作的常见技术。

使用LIME解释CNN

2022-11-12
阅读 4 分钟
891
我们已经介绍过很多解析机器学习模型的方法,例如如pdp、LIME和SHAP,但是这些方法都是用在表格数据的,他们能不能用在神经网络模型呢?今天我们来LIME解释CNN。
封面图

论文推荐:基于深度对抗学习的超声图像乳腺肿瘤分割与分类

2022-11-11
阅读 2 分钟
784
该论文提出了一种基于深度对抗学习的超声图像乳腺肿瘤分割分类方法(cGAN+AC+CAW),论文虽然是2019年提出的,但是他提出了使用GAN进行分割的方法在当时来说却是一个非常新奇的想法,该论文基本上把所有当时能够整合的技术全部进行了集成,并且还取得了很好的效果,所以是非常值得我们一读的,此外论文还提出了具有典型...
封面图

图嵌入概述:节点、边和图嵌入方法及Python实现

2022-11-10
阅读 5 分钟
1.5k
近年来基于图的机器学习有了很大的发展。基于图的方法在数据科学中的许多常见问题中都有应用,例如链接预测、社群发现、节点分类等。根据如何组织问题和所拥有的数据,有许多解决问题的方法。本文将提供一个基于图的嵌入算法的高层次的概述。最后还将介绍如何用Python库(如node2vec)来在图上生成各种嵌入。

使用PyTorch实现简单的AlphaZero的算法(2):理解和实现蒙特卡洛树搜索

2022-11-09
阅读 5 分钟
1k
本篇文章将实现AlphaZero的核心搜索算法:蒙特卡洛树搜索蒙特卡洛树搜索(MCTS)你可能熟悉术语蒙特卡洛[1],这是一类算法,反复进行随机抽样以获得某个结果。例如上图,在单位正方形中选择随机点,计算圆内有多少个点,可以用来估计pi/4的值本文中我们将详细介绍MCTS的所有步骤。但首先我们从更广泛的理解层面来说,在游...

使用PyTorch实现简单的AlphaZero的算法(1):背景和介绍

2022-11-08
阅读 5 分钟
1.1k
在本文中,我们将在PyTorch中为Chain Reaction[2]游戏从头开始实现DeepMind的AlphaZero[1]。为了使AlphaZero的学习过程更有效,我们还将使用一个相对较新的改进,称为“Playout Cap Randomization”[3],以及来自[4]的一些其他技术。在训练过程中,将使用并行处理来并行模拟多个游戏,还将通过一些相关的研究论文讨论Alpha...

论文推荐:基于GE-MRI的多任务学习

2022-11-07
阅读 3 分钟
941
该论文是18年发布的,提出了一种基于Deep U-Net的多任务学习框架,用于GE-MRI左心房分割,该框架同时执行心房分割和消融前后分类。虽然论文已经很老了,但是改论文提出的多任务和后处理方法到现在还是可以参考的。
封面图

PyTorch实现非极大值抑制(NMS)

2022-11-06
阅读 6 分钟
1.4k
NMS即non maximum suppression即非极大抑制,顾名思义就是抑制不是极大值的元素,搜索局部的极大值。在最近几年常见的物体检测算法(包括rcnn、sppnet、fast-rcnn、faster-rcnn等)中,最终都会从一张图片中找出很多个可能是物体的矩形框,然后为每个矩形框为做类别分类概率。本文来通过Pytorch实现NMS算法。
封面图

11个常见的分类特征的编码技术

2022-11-05
阅读 6 分钟
3.3k
最流行且常用的编码方法是One Hot Enoding。一个具有n个观测值和d个不同值的单一变量被转换成具有n个观测值的d个二元变量,每个二元变量使用一位(0,1)进行标识。
封面图

从头开始进行CUDA编程:Numba并行编程的基本概念

2022-11-04
阅读 11 分钟
3.4k
GPU(图形处理单元)最初是为计算机图形开发的,但是现在它们几乎在所有需要高计算吞吐量的领域无处不在。这一发展是由GPGPU(通用GPU)接口的开发实现的,它允许我们使用GPU进行通用计算编程。这些接口中最常见的是CUDA,其次是OpenCL和最近刚出现的HIP。
封面图

时间序列分解:将时间序列分解成基本的构建块

2022-11-03
阅读 3 分钟
1.3k
大多数时间序列可以分解为不同的组件,在本文中,我将讨论这些不同的组件是什么,如何获取它们以及如何使用 Python 进行时间序列分解。时间序列组成时间序列是(主要)三个组成部分的组合:趋势、季节性和残差/剩余部分。让我们简单的解释这三个组成部分趋势:这是该序列的整体运动。它可能会持续增加、也可能持续减少,...
封面图

U-Net在2022年相关研究的论文推荐

2022-11-02
阅读 3 分钟
1.6k
UNet 可以算是 FCN 的一种变体,是最常用、最简单的一种分割模型,简单、高效、易懂、容易构建,且可以从小数据集中训练。2015 年,UNet 在论文 U-Net: Convolutional Networks for Biomedical Image Segmentation 中被提出 。
封面图

Keras可视化神经网络架构的4种方法

2022-11-01
阅读 5 分钟
1.2k
我们在使用卷积神经网络或递归神经网络或其他变体时,通常都希望对模型的架构可以进行可视化的查看,因为这样我们可以 在定义和训练多个模型时,比较不同的层以及它们放置的顺序对结果的影响。还有可以更好地理解模型结构、激活函数、模型参数形状(神经元数量)等
封面图