SF
deephub
deephub
注册登录
关注博客
注册登录
主页
关于
RSS
使用Unit Scaling进行FP16 和 FP8 训练
deephub
2023-03-31
阅读 5 分钟
1.3k
随着支持fp8的硬件的发展,在不影响效率的前提下,进一步降低精度也成为了可能。但是这些较小的、低精度的格式在实践中并不总是易于使用。对于FP8来说则更加困难。因为这些较小的格式通常将用户限制在更窄的可表示值范围内。为了解决这个问题,Graphcore Research开发了一种新方法,我们称之为Unit Scaling。
时间序列特征提取的Python和Pandas代码示例
deephub
2023-03-30
阅读 4 分钟
1.7k
时间序列分析是理解和预测各个行业(如金融、经济、医疗保健等)趋势的强大工具。特征提取是这一过程中的关键步骤,它涉及将原始数据转换为有意义的特征,可用于训练模型进行预测和分析。在本文中,我们将探索使用Python和Pandas的时间序列特征提取技术。
扩散模型的Prompt指南:如何编写一个明确提示
deephub
2023-03-29
阅读 9 分钟
2.3k
Prompt(提示)是扩散模型生成图像的内容来源,构建好的提示是每一个Stable Diffusion用户需要解决的第一步。本文总结所有关于提示的内容,这样可以让你生成更准确,更好的图像
使用Pytorch实现对比学习SimCLR 进行自监督预训练
deephub
2023-03-28
阅读 8 分钟
1.5k
SimCLR(Simple Framework for Contrastive Learning of Representations)是一种学习图像表示的自监督技术。 与传统的监督学习方法不同,SimCLR 不依赖标记数据来学习有用的表示。 它利用对比学习框架来学习一组有用的特征,这些特征可以从未标记的图像中捕获高级语义信息。
高斯混合模型 GMM 的详细解释
deephub
2023-03-27
阅读 8 分钟
2.7k
高斯混合模型(后面本文中将使用他的缩写 GMM)听起来很复杂,其实他的工作原理和 KMeans 非常相似,你甚至可以认为它是 KMeans 的概率版本。 这种概率特征使 GMM 可以应用于 KMeans 无法解决的许多复杂问题。
使用树状图可视化聚类
deephub
2023-03-26
阅读 4 分钟
1.9k
一般情况下,我们都是使用散点图进行聚类可视化,但是某些的聚类算法可视化时散点图并不理想,所以在这篇文章中,我们介绍如何使用树状图(Dendrograms)对我们的聚类结果进行可视化。
Half-UNet:用于医学图像分割的简化U-Net架构
deephub
2023-03-25
阅读 3 分钟
1.6k
Half-UNet简化了编码器和解码器,还使用了Ghost模块(GhostNet)。并重新设计的体系结构,把通道数进行统一。论文动机编码器的不同类型的架构图,编码器(A-C)的结构分别来源于U-Net的编码器、解码器和全的Unet结构。下面是上图的一些结果指标将U-Net 的编码器和解码器都视为编码器。通过设计单个解码器来聚合 C1 到 C16 的...
10个Pandas的另类数据处理技巧
deephub
2023-03-24
阅读 7 分钟
789
本文所整理的技巧与以前整理过10个Pandas的常用技巧不同,你可能并不会经常的使用它,但是有时候当你遇到一些非常棘手的问题时,这些技巧可以帮你快速解决一些不常见的问题。
Huggingface微调BART的代码示例:WMT16数据集训练新的标记进行翻译
deephub
2023-03-23
阅读 5 分钟
1.5k
BART模型是用来预训练seq-to-seq模型的降噪自动编码器(autoencoder)。它是一个序列到序列的模型,具有对损坏文本的双向编码器和一个从左到右的自回归解码器,所以它可以完美的执行翻译任务。
DDPG强化学习的PyTorch代码实现和逐步讲解
deephub
2023-03-22
阅读 14 分钟
2.2k
深度确定性策略梯度(Deep Deterministic Policy Gradient, DDPG)是受Deep Q-Network启发的无模型、非策略深度强化算法,是基于使用策略梯度的Actor-Critic,本文将使用pytorch对其进行完整的实现和讲解
NLP / LLMs中的Temperature 是什么?
deephub
2023-03-21
阅读 3 分钟
2.5k
大型语言模型能够根据给定的上下文或提示生成新文本,由于神经网络等深度学习技术的进步,这些模型越来越受欢迎。可用于控制生成语言模型行为的关键参数之一是Temperature 参数。在本文中,我们将讨论语言生成模型中Temperature 参数的作用,以及它如何影响生成文本的质量。
Pandas 2.0 简单介绍和速度评测
deephub
2023-03-20
阅读 3 分钟
1.2k
Pandas是机器学习中最常用的一个库了,我们基本上每天都会使用它。而pandas使用了一个“NumPy”作为后端,这个我们也都是知道的,但是最近 Pandas 2.0 的RC版已经最近发布了。这个版本主要包括bug修复、性能改进和增加Apache Arrow后端。当涉及到使用DF时,Arrow比Numpy提供了更多的优势。
2023年3月的10篇论文推荐
deephub
2023-03-19
阅读 6 分钟
1.1k
三月有很多的重大产品发布,包括刚刚发布的GPT4,还有Meta刚发布就被泄露的LLaMA,midjourney V5,还有ChatGPT的API(非常便宜)等等。
CLIP:语言-图像表示之间的桥梁
deephub
2023-03-18
阅读 3 分钟
1.4k
最近GPT4的火爆覆盖了一个新闻:midjourney v5发布,DALLE2,midjourney都可以从文本中生成图像,这种模型要求人工智能同时理解语言和图像数据。
GPT-4 和ChatGPT API的定价分析
deephub
2023-03-17
阅读 2 分钟
1.4k
OpenAI发布了他们的ChatGPT新机器学习模型GPT-4。GPT-4是GPT-3的一大进步,GPT-3是当前ChatGPT免费版本(GPT 3.5 Turbo)所运行的模型的基础,今天我们也来凑个热点,研究一下它们的定价
处理缺失值的三个层级的方法总结
deephub
2023-03-16
阅读 8 分钟
1.1k
缺失值是现实数据集中的常见问题,处理缺失值是数据预处理的关键步骤。缺失值可能由于各种原因而发生,例如数据的结构和质量、数据输入错误、传输过程中的数据丢失或不完整的数据收集。这些缺失的值可能会影响机器学习模型的准确性和可靠性,因为它们可能会引入偏差并扭曲结果,有些模型甚至在在缺少值的情况下根本无法...
SDG,ADAM,LookAhead,Lion等优化器的对比介绍
deephub
2023-03-15
阅读 5 分钟
1.7k
本文将介绍了最先进的深度学习优化方法,帮助神经网络训练得更快,表现得更好。有很多个不同形式的优化器,这里我们只找最基础、最常用、最有效和最新的来介绍。
集成时间序列模型提高预测精度
deephub
2023-03-14
阅读 6 分钟
730
集成各种弱学习器可以提高预测精度,但是如果我们的模型已经很强大了,集成学习往往也能够起到锦上添花的作用。流行的机器学习库scikit-learn提供了一个StackingRegressor,可以用于时间序列任务。但是StackingRegressor有一个局限性;它只接受其他scikit-learn模型类和api。所以像ARIMA这样在scikit-learn中不可用的模型...
图神经网络的数学原理总结
deephub
2023-03-13
阅读 11 分钟
946
图深度学习(Graph Deep Learning) 多年来一直在加速发展。许多现实生活问题使GDL成为万能工具:在社交媒体、药物发现、芯片植入、预测、生物信息学等方面都显示出了很大的前景。
少样本学习综述:技术、算法和模型
deephub
2023-03-12
阅读 3 分钟
948
有时这种数据在现实世界中是无法获得的。以医疗保健为例,我们可能没有足够的x光扫描来检查一种新的疾病。但是通过少样本学习可以让模型只从几个例子中学习到知识!
PlotNeuralNet + ChatGPT创建专业的神经网络的可视化图形
deephub
2023-03-11
阅读 5 分钟
1.4k
但是他的最大问题是需要我们手动的编写网络的结构,这是一个很麻烦的事情,这时 ChatGPT 就出来了,它可以帮我们生成LaTeX代码。在本文中,我将介绍如何安装和使用PlotNeuralNet,展示一些可视化示例,以及如何使用ChatGPT为我们生成LaTeX代码!
使用ControlNet 控制 Stable Diffusion
deephub
2023-03-10
阅读 6 分钟
2.4k
ControlNet是一种通过添加额外条件来控制扩散模型的神经网络结构。它提供了一种增强稳定扩散的方法,在文本到图像生成过程中使用条件输入,如涂鸦、边缘映射、分割映射、pose关键点等。可以让生成的图像将更接近输入图像,这比传统的图像到图像生成方法有了很大的改进。
Python中函数参数传递方法*args, **kwargs,还有其他
deephub
2023-03-09
阅读 6 分钟
1.6k
本文将讨论Python的函数参数。我们将了解args和kwargs,/和的都是什么,虽然这个问题是一个基本的python问题,但是在我们写代码时会经常遇到,比如timm中就大量使用了这样的参数传递方式。
Python图像处理:频域滤波降噪和图像增强
deephub
2023-03-08
阅读 9 分钟
1.1k
图像处理已经成为我们日常生活中不可或缺的一部分,涉及到社交媒体和医学成像等各个领域。通过数码相机或卫星照片和医学扫描等其他来源获得的图像可能需要预处理以消除或增强噪声。频域滤波是一种可行的解决方案,它可以在增强图像锐化的同时消除噪声。
结合基于规则和机器学习的方法构建强大的混合系统
deephub
2023-03-07
阅读 5 分钟
1.3k
经过这些年的发展,我们都确信ML即使不能表现得更好,至少也可以在几乎所有地方与前ML时代的解决方案相匹配。比如说一些规则约束,我们都会想到能否把它们替换为基于树的ml模型。但是世界并不总是黑白分明的,虽然机器学习在解决问题上肯定有自己的位置,但它并不总是最好的解决方案。基于规则的系统甚至可以胜过机器学...
DetectGPT:使用概率曲率的零样本机器生成文本检测
deephub
2023-03-06
阅读 3 分钟
825
DetectGPT的目的是确定一段文本是否由特定的llm生成,例如GPT-3。为了对段落 x 进行分类,DetectGPT 首先使用通用的预训练模型(例如 T5)对段落 ~xi 生成较小的扰动。然后DetectGPT将原始样本x的对数概率与每个扰动样本~xi进行比较。如果平均对数比高,则样本可能来自源模型。
带加权的贝叶斯自举法 Weighted Bayesian Bootstrap
deephub
2023-03-05
阅读 5 分钟
1.3k
贝叶斯自举法(Bayesian bootstrap)是一种统计学方法,用于在缺乏先验知识的情况下对一个参数的分布进行估计。这种方法是基于贝叶斯统计学的思想,它使用贝叶斯公式来计算参数的后验分布。
梯度提升算法决策过程的逐步可视化
deephub
2023-03-04
阅读 6 分钟
1.4k
梯度提升算法是最常用的集成机器学习技术之一,该模型使用弱决策树序列来构建强学习器。这也是XGBoost和LightGBM模型的理论基础,所以在这篇文章中,我们将从头开始构建一个梯度增强模型并将其可视化。
论文推荐:ScoreGrad,基于能量模型的时间序列预测
deephub
2023-03-03
阅读 4 分钟
974
能量模型(Energy-based model)是一种以自监督方式执行的生成式模型,近年来受到了很多关注。本文将介绍ScoreGrad:基于连续能量生成模型的多变量概率时间序列预测。如果你对时间序列预测感兴趣,推荐继续阅读本文。
XGBoost和LightGBM时间序列预测对比
deephub
2023-03-02
阅读 9 分钟
1.2k
XGBoost和LightGBM都是目前非常流行的基于决策树的机器学习模型,它们都有着高效的性能表现,但是在某些情况下,它们也有着不同的特点。
上一页
1
…
More
18
19
20
(current)
21
22
…
More
下一页
上一页
20
(current)
下一页