SF
deephub
deephub
注册登录
关注博客
注册登录
主页
关于
RSS
基于图的 Affinity Propagation 聚类计算公式详解和代码示例
deephub
2022-07-01
阅读 4 分钟
1.2k
Affinity Propagation Clustering(简称AP算法)是2007提出的,当时发表在Science上《single-exemplar-based》。特别适合高维、多类数据快速聚类,相比传统的聚类算法,该算法算是比较新的,从聚类性能和效率方面都有大幅度的提升。
零样本和少样本学习
deephub
2022-06-30
阅读 4 分钟
1.5k
在本篇文章中,我们将讨论机器学习和深度学习的不同领域中的一个热门话题:零样本和少样本学习(Zero and Few Shot learning),它们在自然语言处理到计算机视觉中都有不同的应用场景。
一个简单但是能上分的特征标准化方法
deephub
2022-06-29
阅读 2 分钟
900
这里介绍的方法叫Robust Scaling,正如它的名字一样能够获得更健壮的特征缩放结果。与StandardScaler缩放不同,异常值根本不包括在Robust Scaling计算中。因此在包含异常值的数据集中,更有可能缩放到更接近正态分布。
基于趋势和季节性的时间序列预测
deephub
2022-06-28
阅读 9 分钟
2.4k
本文主要介绍时间序列预测并描述任何时间序列的两种主要模式(趋势和季节性)。并基于这些模式对时间序列进行分解。最后使用一个被称为Holt-Winters季节方法的预测模型,来预测有趋势和/或季节成分的时间序列数据。
100+数据科学面试问题和答案总结 - 机器学习和深度学习
deephub
2022-06-27
阅读 10 分钟
857
机器学习是一门多学科交叉专业,涵盖概率论知识,统计学知识,近似理论知识和复杂算法知识,使用计算机作为工具并致力于真实实时的模拟人类学习方式,并将现有内容进行知识结构划分来有效提高学习效率。
100+数据科学面试问题和答案总结 - 基础知识和数据分析
deephub
2022-06-26
阅读 10 分钟
852
来自Amazon,google,Meta, Microsoft等的面试问题,问题很多所以对问题进行了分类整理,本文包含基础知识和数据分析相关问题
如何比较两个或多个分布:从可视化到统计检验的方法总结
deephub
2022-06-24
阅读 11 分钟
3.1k
比较一个变量在不同组中的分布是数据科学中的一个常见问题。当我们想要评估一项策略(用户体验功能、广告活动、药物等)的因果效应时,因果推断的黄金标准便是随机对照试验,也就是所谓的A /B测试。在实践中,我们为研究选择一个样本,并将其随机分为对照组(control group)和实验组(treatment group)比较两组之间的结...
评估和选择最佳学习模型的一些指标总结
deephub
2022-06-23
阅读 7 分钟
759
在评估模型时,虽然准确性是训练阶段模型评估和应用模型调整的重要指标,但它并不是模型评估的最佳指标,我们可以使用几个评估指标来评估我们的模型。
位置编码(PE)是如何在Transformers中发挥作用的
deephub
2022-06-22
阅读 3 分钟
977
Transformers不像LSTM具有处理序列排序的内置机制,它将序列中的每个单词视为彼此独立。所以使用位置编码来保留有关句子中单词顺序的信息。
主动学习(Active Learning) 概述、策略和不确定性度量
deephub
2022-06-21
阅读 4 分钟
2k
主动学习是一种学习算法可以交互式查询用户(teacher 或 oracle),用真实标签标注新数据点的策略。主动学习的过程也被称为优化实验设计。
模型的度量指标和损失函数有什么区别?为什么在项目中两者都很重要?
deephub
2022-06-20
阅读 2 分钟
781
你是否一直在使用你的损失函数来评估你的机器学习系统的性能?我相信有很多人也是这样做的,这是一个普遍存在的误解,因为人工智能中的程序默认设置、课程中介绍都是这样说的。
Curriculum Labeling:重新审视半监督学习的伪标签
deephub
2022-06-19
阅读 3 分钟
783
Pseudo-Labeling (PL) 通过将伪标签应用于未标记集中的样本以在自训练周期中进行模型训练。Curriculum Labeling (CL)中,应用类似课程学习的原则,通过在每个自学习周期之前重新启动模型参数来避免概念漂移。该论文发布在2021 AAAI 。
如何正确拆分数据集?常见的三种方法总结
deephub
2022-06-18
阅读 2 分钟
1.1k
将数据集分解为训练集,可以帮助我们了解模型,这对于模型如何推广到新的看不见数据非常重要。如果模型过度拟合可能无法很好地概括新的看不见的数据。因此也无法做出良好的预测。
联合概率和条件概率的区别和联系
deephub
2022-06-17
阅读 3 分钟
1k
例如:掷硬币的概率是 ¹⁄₂ = 50%,翻转 2 个公平硬币的概率是 ¹⁄₂ × ¹⁄₂ = ¹⁄₄ = 25%(这也可以理解为 50% 的 50%)
使用神经网络模型创建一个龙与地下城怪物生成器
deephub
2022-06-16
阅读 4 分钟
632
龙与地下城(DND)于1974年发行第一版,现在所有RPG游戏都有它的影子,可以说它影响了全世界的RPG,对于RPG来说,最主要的一个特点就是有着不同类型的怪物,而我们可以通过《dungeon master guide》中提供的Challenge Rating(CR)公式来创建我们自己的怪物,因为我们也是地牢大师的一员,对吧。
5篇关于特征嵌入的研究论文推荐
deephub
2022-06-15
阅读 3 分钟
870
在图像搜索算法中,数据库中的图片会随着时间的增长而增加。但是现有方法依赖于在整个数据集上训练的模型,而忽略了模型的不断更新。随着模型的更新,新模型必须为整个图库集重新提取特征以保持兼容的特征空间,这为大型图库集带来了很高的计算成本。为了解决长期视觉搜索的问题,论文引入了一种持续学习 (CL) 方法,该...
数据科学的面试的一些基本问题总结
deephub
2022-06-14
阅读 8 分钟
829
如果你是数据科学家或软件开发人员,那么应该已经知道一些 Python 和 SQL 的基本知识,这对数据科学家的面试已经足够了,因为大多数的公司基本上是这样的——但是,在你的简历中加入 Spark 是一个很好的加分项。
基于自动编码器的赛车视角转换与分割
deephub
2022-06-13
阅读 5 分钟
880
本篇文章将介绍如何将赛道的图像转换为语义分割后鸟瞰图的轨迹。如下所示,输入图像为输出:总结来说我们的任务是获取输入图像,即前方轨道的前置摄像头视图,并构建一个鸟瞰轨道视图,而鸟瞰轨道视图会分割不同的颜色表示赛道和路面的边界。仅仅从输入图像中提取出关于走向的信息是相当困难的,因为未来的许多轨道信息...
Multimix:从医学图像中进行的少量监督,可解释的多任务学习
deephub
2022-06-12
阅读 5 分钟
857
在本文中,我将讨论一种新的半监督,多任务医学成像方法,称为Multimix,Ayana Haque(ME),Abdullah-Al-Zubaer Imran,Adam Wang、Demetri Terzopoulos。该论文在被ISBI 2021收录,并于4月的会议上发表。
使用贝叶斯优化进行深度神经网络超参数优化
deephub
2022-06-11
阅读 8 分钟
1.1k
为了方便起见本文将使用 Tensorflow 中包含的 Fashion MNIST[1] 数据集。该数据集在训练集中包含 60,000 张灰度图像,在测试集中包含 10,000 张图像。每张图片代表属于 10 个类别之一的单品(“T 恤/上衣”、“裤子”、“套头衫”等)。因此这是一个多类分类问题。
机器学习中训练和验证指标曲线图能告诉我们什么?
deephub
2022-06-10
阅读 9 分钟
1.3k
我们在训练和验证模型时都会将训练指标保存成起来制作成图表,这样可以在结束后进行查看和分析,但是你真的了解这些指标的图表的含义吗?在本文中将对训练和验证可能产生的情况进行总结并介绍这些图表到底能为我们提供什么样的信息。让我们从一些简单的代码开始,以下代码建立了一个基本的训练流程框架。 {代码...} 以上...
在不平衡数据上使用AUPRC替代ROC-AUC
deephub
2022-06-09
阅读 3 分钟
1.8k
ROC曲线和曲线下面积AUC被广泛用于评估二元分类器的性能。但是有时,基于精确召回曲线下面积 (AUPRC) 的测量来评估不平衡数据的分类却更为合适。
如何计算LSTM层中的参数数量
deephub
2022-06-08
阅读 2 分钟
1.2k
长短期记忆网络(通常称为“ LSTM”)是一种特殊的RNN,经过精心设计LSTM能够学习长期的依赖。正如他的名字,它可以学习长期和短期的依赖。
卷积神经网络中的傅里叶变换:1024x1024 的傅里叶卷积
deephub
2022-06-07
阅读 11 分钟
1.8k
卷积神经网络 (CNN) 得到了广泛的应用并且事实证明他是非常成功的。但是卷积的计算很低效,滑动窗口需要很多计算并且限制了过滤器的大小,通常在 [3,3] 到 [7,7] 之间的小核限制了感受野(最近才出现的大核卷积可以参考我们以前的文章),并且需要许多层来捕获输入张量的全局上下文(例如 2D 图像)。图像越大小核的的表...
JAX介绍和快速入门示例
deephub
2022-06-06
阅读 6 分钟
2.2k
由于使用XLA(一种加速线性代数计算的编译器)将Python和JAX代码JIT编译成优化的内核,可以在不同设备(例如gpu和tpu)上运行。而优化的内核是为高吞吐量设备(例如gpu和tpu)进行编译,它与主程序分离但可以被主程序调用。JIT编译可以用jax.jit()触发。
14个面试中常见的概率问题
deephub
2022-06-05
阅读 3 分钟
2.1k
在任何数据科学面试中,基本上都会问道一些有关概率的问题。 这些问题有的非常棘手(因为里面包含了一些复杂的数学概念),但是如果逆知道基本公式和概念那么就很容易了。所以在本文中我总结了一些相关的问题供大家参考。
论文推荐:TResNet改进ResNet 实现高性能 GPU 专用架构并且效果优于 EfficientNet
deephub
2022-06-04
阅读 4 分钟
1.2k
TResNet: High Performance GPU-Dedicated Architecture 来自阿里的达摩院,发布于2021 WACV,该论文引入了一系列架构修改,旨在提高神经网络的准确性,同时保持其 GPU 训练和推理效率。
使用 Numpy 创建自己的深度学习框架
deephub
2022-06-03
阅读 8 分钟
1k
Numpy 已经提供了基本上所有需要的计算操作,我们需要的是一个支持自动微分(autograd)的框架来计算多个操作的梯度,这是模块化方法构建神经网络层的标准化方法,通过自动微分的框架,我们可以将优化器、激活函数等组合在一起用于训练神经网络。
一个新的基于样本数量计算的的高斯 softmax 函数
deephub
2022-06-02
阅读 2 分钟
1.6k
但是新数据可能不适合训练数据中使用的 z 值范围。如果出现新的数据点softmax将根据指数拟合确定其错误分类的概率;错误分类的机会并不能保证遵循其训练范围之外的指数(不仅如此——如果模型不够好,它只能将指数拟合到一个根本不是指数的函数中)。为避免这种情况将 softmax 函数包装在一个范围限制的线性函数中(将其概...
使用Python从头开始手写回归树
deephub
2022-06-01
阅读 9 分钟
749
在本篇文章中,我们将介绍回归树及其基本数学原理,并从头开始使用Python实现一个完整的回归树模型。为了简单起见这里将使用递归来创建树节点,虽然递归不是一个完美的实现,但是对于解释原理他是最直观的。首先导入库 {代码...} 首先需要创建训练数据,我们的数据将具有独立变量(x)和一个相关的变量(y),并使用nump...
上一页
1
…
More
27
28
29
(current)
30
31
…
More
下一页
上一页
29
(current)
下一页