SF
deephub
deephub
注册登录
关注博客
注册登录
主页
关于
RSS
图像数据的特征工程
deephub
2022-12-08
阅读 6 分钟
1.1k
一提到特征工程,我们立即想到是表格数据。但是我们也可以得到图像数据的特征,提取图像中最重要的方面。这样做可以更容易地找到数据和目标变量之间的映射。
7个有用的Pandas显示选项
deephub
2022-12-07
阅读 4 分钟
851
Pandas是一个在数据科学中常用的功能强大的Python库。它可以从各种来源加载和操作数据集。当使用Pandas时,默认选项就已经适合大多数人了。但是在某些情况下,我们可能希望更改所显示内容的格式。所以就需要使用Pandas的一些定制功能来帮助我们自定义内容的显示方式。
为机器学习模型设置最佳阈值:0.5是二元分类的最佳阈值吗
deephub
2022-12-06
阅读 7 分钟
1.3k
对于二元分类,分类器输出一个实值分数,然后通过对该值进行阈值的区分产生二元的相应。例如,逻辑回归输出一个概率(一个介于0.0和1.0之间的值);得分等于或高于0.5的观察结果产生正输出(许多其他模型默认使用0.5阈值)。
支持向量机核技巧:10个常用的核函数总结
deephub
2022-12-05
阅读 7 分钟
1.4k
支持向量机是一种监督学习技术,主要用于分类,也可用于回归。它的关键概念是算法搜索最佳的可用于基于标记数据(训练数据)对新数据点进行分类的超平面。
在本地PC运行 Stable Diffusion 2.0
deephub
2022-12-04
阅读 3 分钟
1.6k
Stable Diffusion 2.0在前几天已经发布了,新版本在上一个版本的基础上进行了许多改进。OpenCLIP中新的深度检测和更好的文本到图像模型是主要的改进之一。
多元时间序列特征工程的指南
deephub
2022-12-03
阅读 7 分钟
1.8k
使用Python根据汇总统计信息添加新特性,本文将告诉你如何计算几个时间序列中的滚动统计信息。将这些信息添加到解释变量中通常会获得更好的预测性能。
从头开始进行CUDA编程:原子指令和互斥锁
deephub
2022-12-02
阅读 17 分钟
1.1k
在前三部分中我们介绍了CUDA开发的大部分基础知识,例如启动内核来执行并行任务、利用共享内存来执行快速归并、将可重用逻辑封装为设备函数以及如何使用事件和流来组织和控制内核执行。
用强化学习玩《超级马里奥》
deephub
2022-12-01
阅读 4 分钟
1.7k
Pytorch的一个强化的学习教程( Train a Mario-playing RL Agent)使用超级玛丽游戏来学习双Q网络(强化学习的一种类型),官网的文章只有代码, 所以本文将配合官网网站的教程详细介绍它是如何工作的,以及如何将它们应用到这个例子中。
MSE = Bias² + Variance?什么是“好的”统计估计器
deephub
2022-11-30
阅读 3 分钟
1.1k
本文的目的并不是要证明这个公式,而是将他作为一个入口,让你了解统计学家如何以及为什么这样构建公式,以及我们如何判断是什么使某些估算器比其他估算器更好。
使用PyTorch实现简单的AlphaZero的算法(3):神经网络架构和自学习
deephub
2022-11-29
阅读 5 分钟
1.1k
从我们之前的文章中,介绍了蒙特卡洛树搜索 (MCTS) 的工作原理以及如何使用它来获得给定棋盘状态的输出策略。我们也理解神经网络在 MCTS 中的两个主要作用;通过神经网络的策略输出来指导探索,并使用其价值输出代替传统的蒙特卡洛rollout算法。
10个实用的数据可视化的图表总结
deephub
2022-11-28
阅读 7 分钟
2k
可视化是一种方便的观察数据的方式,可以一目了然地了解数据块。我们经常使用柱状图、直方图、饼图、箱图、热图、散点图、线状图等。这些典型的图对于数据可视化是必不可少的。除了这些被广泛使用的图表外,还有许多很好的却很少被使用的可视化方法,这些图有助于完成我们的工作,下面我们看看有那些图可以进行。
BT - Unet:生物医学图像分割的自监督学习框架
deephub
2022-11-27
阅读 2 分钟
1.9k
BT-Unet采用Barlow twin方法对U-Net模型的编码器进行无监督的预训练减少冗余信息,以学习数据表示。之后,对完整网络进行微调以执行实际的分割。
使用Python进行交易策略和投资组合分析
deephub
2022-11-26
阅读 6 分钟
1.9k
我们将在本文中衡量交易策略的表现。并将开发一个简单的动量交易策略,它将使用四种资产类别:债券、股票和房地产。这些资产类别的相关性很低,这使得它们成为了极佳的风险平衡选择。
使用HuggingFace实现 DiffEdit论文的掩码引导语义图像编辑
deephub
2022-11-25
阅读 18 分钟
1.3k
在本文中,我们将实现Meta AI和Sorbonne Universite的研究人员最近发表的一篇名为DIFFEDIT的论文。对于那些熟悉稳定扩散过程或者想了解DiffEdit是如何工作的人来说,这篇文章将对你有所帮助。
自回归滞后模型进行多变量时间序列预测
deephub
2022-11-24
阅读 4 分钟
3.2k
一种常见的方法是将该变量其视为单变量时间序列。这样就有很多方法可以用来模拟这些系列。比如 ARIMA、指数平滑或 Facebook 的 Prophet,还有自回归的机器学习方法也可以使用。
从头开始进行CUDA编程:流和事件
deephub
2022-11-23
阅读 17 分钟
1.2k
前两篇文章我们介绍了如何使用GPU编程执行简单的任务,比如令人难以理解的并行任务、使用共享内存归并(reduce)和设备函数。为了提高我们的并行处理能力,本文介绍CUDA事件和如何使用它们。但是在深入研究之前,我们将首先讨论CUDA流。
2022年11月10篇论文推荐
deephub
2022-11-22
阅读 7 分钟
1.4k
随着最大的人工智能研究会议(NeurIPS 2022)即将到来,我们进入了2022年的最后阶段。让我们回顾一下人工智能世界最近发生了什么。在介绍推荐论文之前,先说一个很有意思的项目:img-to-music:想象图像听起来是什么样的模型! [链接]。有兴趣的可以看看。下面我们开始介绍10篇推荐的论文。这里将涵盖强化学习(RL)、扩散模型...
特征选择技术总结
deephub
2022-11-21
阅读 8 分钟
1.8k
在本文中,我们将回顾特性选择技术并回答为什么它很重要以及如何使用python实现它。本文还可以帮助你解答以下的面试问题:什么是特征选择?说出特性选择的一些好处你知道哪些特征选择技巧?区分单变量、双变量和多变量分析。我们能用PCA来进行特征选择吗?前向特征选择和后向特征选择的区别是什么?什么是特征选择,为什么它...
使用马尔可夫链构建文本生成器
deephub
2022-11-19
阅读 6 分钟
1.4k
本文中将介绍一个流行的机器学习项目——文本生成器,你将了解如何构建文本生成器,并了解如何实现马尔可夫链以实现更快的预测模型。文本生成器简介文本生成在各个行业都很受欢迎,特别是在移动、应用和数据科学领域。甚至新闻界也使用文本生成来辅助写作过程。在日常生活中都会接触到一些文本生成技术,文本补全、搜索建...
Stable Diffusion的入门介绍和使用教程
deephub
2022-11-18
阅读 10 分钟
19.1k
Stable Diffusion是一个文本到图像的潜在扩散模型,由CompVis、Stability AI和LAION的研究人员和工程师创建。它使用来自LAION-5B数据库子集的512x512图像进行训练。使用这个模型,可以生成包括人脸在内的任何图像,因为有开源的预训练模型,所以我们也可以在自己的机器上运行它,如下图所示。
TwoModalBERT进行角色分类
deephub
2022-11-17
阅读 3 分钟
1k
你是否遇到过数据集中有多个文本特性的情况?例如,根据消息的上下文正确地对消息进行分类,即理解前面的消息。比如说我们有下面的数据集,需要对其进行分类。
经典CNN设计演变的关键总结:从VGGNet到EfficientNet
deephub
2022-11-16
阅读 6 分钟
1.1k
一般来说,分类问题是计算机视觉模型的基础,它可以延申解决更复杂的视觉问题,例如:目标检测的任务包括检测边界框并对其中的对象进行分类。而分割的任务则是对图像中的每个像素进行分类。
PyTorch常用5个抽样函数
deephub
2022-11-15
阅读 2 分钟
871
PyTorch是一个开源的深度学习框架,它提供了一个用于高级特性的Python包。在本文中,我们将介绍PyTorch中的常见抽样函数。抽样是一个统计过程,它从总体中提取一个子集,通过子集来研究整个总体。
时间序列分析中的自相关
deephub
2022-11-14
阅读 3 分钟
2.2k
什么是自相关以及为什么它在时间序列分析中是有用的。在时间序列分析中,我们经常通过对过去的理解来预测未来。为了使这个过程成功,我们必须彻底了解我们的时间序列,找到这个时间序列中包含的信息。自相关就是其中一种分析的方法,他可以检测时间系列中的某些特征,为我们的数据选择最优的预测模型。在这篇简短的文章...
从头开始进行CUDA编程:线程间协作的常见技术
deephub
2022-11-13
阅读 12 分钟
741
在前一篇文章中,我们介绍了如何使用 GPU 运行的并行算法。这些并行任务是那些完全相互独立的任务,这点与我们一般认识的编程方式有很大的不同,虽然我们可以从并行中受益,但是这种奇葩的并行运行方式对于我们来说肯定感到非常的复杂。所以在本篇文章的Numba代码中,我们将介绍一些允许线程在计算中协作的常见技术。
使用LIME解释CNN
deephub
2022-11-12
阅读 4 分钟
990
我们已经介绍过很多解析机器学习模型的方法,例如如pdp、LIME和SHAP,但是这些方法都是用在表格数据的,他们能不能用在神经网络模型呢?今天我们来LIME解释CNN。
论文推荐:基于深度对抗学习的超声图像乳腺肿瘤分割与分类
deephub
2022-11-11
阅读 2 分钟
903
该论文提出了一种基于深度对抗学习的超声图像乳腺肿瘤分割分类方法(cGAN+AC+CAW),论文虽然是2019年提出的,但是他提出了使用GAN进行分割的方法在当时来说却是一个非常新奇的想法,该论文基本上把所有当时能够整合的技术全部进行了集成,并且还取得了很好的效果,所以是非常值得我们一读的,此外论文还提出了具有典型...
图嵌入概述:节点、边和图嵌入方法及Python实现
deephub
2022-11-10
阅读 5 分钟
1.6k
近年来基于图的机器学习有了很大的发展。基于图的方法在数据科学中的许多常见问题中都有应用,例如链接预测、社群发现、节点分类等。根据如何组织问题和所拥有的数据,有许多解决问题的方法。本文将提供一个基于图的嵌入算法的高层次的概述。最后还将介绍如何用Python库(如node2vec)来在图上生成各种嵌入。
使用PyTorch实现简单的AlphaZero的算法(2):理解和实现蒙特卡洛树搜索
deephub
2022-11-09
阅读 5 分钟
1.1k
本篇文章将实现AlphaZero的核心搜索算法:蒙特卡洛树搜索蒙特卡洛树搜索(MCTS)你可能熟悉术语蒙特卡洛[1],这是一类算法,反复进行随机抽样以获得某个结果。例如上图,在单位正方形中选择随机点,计算圆内有多少个点,可以用来估计pi/4的值本文中我们将详细介绍MCTS的所有步骤。但首先我们从更广泛的理解层面来说,在游...
使用PyTorch实现简单的AlphaZero的算法(1):背景和介绍
deephub
2022-11-08
阅读 5 分钟
1.2k
在本文中,我们将在PyTorch中为Chain Reaction[2]游戏从头开始实现DeepMind的AlphaZero[1]。为了使AlphaZero的学习过程更有效,我们还将使用一个相对较新的改进,称为“Playout Cap Randomization”[3],以及来自[4]的一些其他技术。在训练过程中,将使用并行处理来并行模拟多个游戏,还将通过一些相关的研究论文讨论Alpha...
上一页
1
…
More
25
26
27
(current)
28
29
…
More
下一页
上一页
27
(current)
下一页