找到约 3929 条结果
  • 使用Pandas进行数据清理的入门示例
    数据清理是数据分析过程中的关键步骤,它涉及识别缺失值、重复行、异常值和不正确的数据类型。获得干净可靠的数据对于准确的分析和建模非常重要。本文将介绍以下6个经常使用的数据清理操作:检查缺失值、检查重复行、处理离群值、检查所有列的数据类型、删除不必要的列、数据不一致处理第一步,让我们导入库和数据集。 {...
    2023-08-15
  • 数据增强方法的调查以及复现
    最近主要调查了对序列数据进行数据增强的方法,以下是几种基于深度学习的生成对抗网络的数据增强方法方法描述优缺点T-CGAN使用一维卷积的CGAN,条件输入为时间戳,时间戳可以间隔不等可以针对时间间隔不规则的情况WGAN适用于训练不稳定的传统GAN场景在某些情况下,WGAN可能仍然无法生成与真实数据完全一致的样本TimeGAN...
    2024-06-25
  • 可视化VIT中的注意力
    2022年, Vision Transformer (ViT)成为卷积神经网络(cnn)的有力竞争对手,卷积神经网络目前是计算机视觉领域的最先进技术,广泛应用于许多图像识别应用。在计算效率和精度方面,ViT模型超过了目前最先进的(CNN)几乎四倍。
    2023-01-19
  • Python数据分析入门教程(五):数据运算
    进行到这一步就可以算是开始正式的烹饪了,在这部分之前的数据操作部分我们列举了一些不同维度的分析指标,这一章我们主要看看这些指标都是怎么计算出来的。
    2020-01-15
  • 你还弄不懂的傅里叶变换,神经网络只用了30多行代码就学会了
    在我们的生活中,大到天体观测、小到MP3播放器上的频谱,没有傅里叶变换都无法实现。通俗来讲,离散傅里叶变换(DFT)就是把一串复杂波形中分成不同频率成分。比如声音,如果用声波记录仪显示声音的话,其实生活中绝大部分声音都是非常复杂、甚至杂乱无章的。而通过傅里叶变换,就能把这些杂乱的声波转化为正弦波,也就...
    2021-06-01
  • 数据分析实践入门(四):数据运算
    算术运算就是基本的加减乘除,在Excel或Python中数值类型的任意两列可以直接进行加、减、乘、除运算,而且是对应元素进行加、减、乘、除运算,Excel 中的算术运算比较简单,这里就不展开了,下面主要介绍Python中的算术运算。
    2019-12-09
  • Rstudio论文sci绘制图例代码数据/R语言科研ggplot2图例模板
    R语言是一门专门用于数据统计分析和可视化的编程语言。它拥有丰富的数据处理、分析和可视化库,是大数据时代的一个重要工具。本文将深入介绍R语言的数据代码。它提供了一系列用于数据分析、可视化和统计学习的工具和库。R语言的语法简洁、方便,可以使科研工作者轻易地对数据进行处理和分析。通过使用R语言,研究者可以...
    2023-11-09
  • CSC108H聊天机器人设计细节
    1.包含你的节目笔记和播客链接的文件应该上传到Quercus在截止日期前。如果未在截止日期前提交,将处以逾期罚款。如果您的URL不正确,将受到逾期罚款。如果您没有可访问的在线空间要发布到您的播客(例如博客)的链接,请发布文件共享中的URL您的播客托管的服务(例如SoundCloud)。工作分配内容显示笔记提供了播客某一集...
    2023-12-04
  • 谷歌的时间序列预测的基础模型TimesFM详解和对比测试
    TimesFM是一个为时间序列数据量身定制的大型预训练模型——一个无需大量再训练就能提供准确预测的模型。TimesFM有2亿参数,并在1000亿真实世界时间点上进行了训练。可以允许额外的协变量作为特征。
    2024-07-18
  • R语言混合效应模型(mixed model)案例研究|附代码数据
    混合模型在很多方面与线性模型相似。它估计一个或多个解释变量对因变量的影响。混合模型的输出将为解释值列表,它们的效果大小的估计值和置信区间,每种效果的p值以及至少一种模型拟合程度的度量。当您有一个变量将数据样本描述为可以收集的数据的子集时,应该使用混合模型而不是简单的线性模型。
    2022-11-17
  • 不平衡数据集分类实战:成人收入数据集分类模型训练和评估
    一个常用的例子是成人收入数据集,它涉及到社交关系、教育水平等个人数据,以此来预测成人的收入水平,判断其是否拥有5万美元/年的个人收入。数据集中个人收入低于5万美元的数据比高于5万美元的数据要明显多一些,存在着一定程度的分布不平衡。 针对这一数据集,可以使用很多不平衡分类的相关算法完成分类任务。
    2020-03-24
  • 基于R语言混合效应模型(mixed model)案例研究|附代码数据
    混合模型在很多方面与线性模型相似。它估计一个或多个解释变量对因变量的影响。混合模型的输出将为解释值列表,它们的效果大小的估计值和置信区间,每种效果的p值以及至少一种模型拟合程度的度量。当您有一个变量将数据样本描述为可以收集的数据的子集时,应该使用混合模型而不是简单的线性模型。
    2023-02-10
  • 将强化学习重新引入 RLHF
    我们很高兴在 TRL 中介绍 RLOO (REINFORCE Leave One-Out) 训练器。作为一种替代 PPO 的方法,RLOO 是一种新的在线 RLHF 训练算法,旨在使其更易于访问和实施。特别是, RLOO 需要的 GPU 内存更少,并且达到收敛所需的挂钟时间也更短。如下面的图表所示:
    2024-06-19
  • 【深度学习】10分钟看懂深度残差收缩网络
    残差网络ResNet获得了2016年IEEE Conference on Computer Vision and Pattern Recognition的最佳论文奖,在谷歌学术的引用量已达38295次。
    2020-08-29
  • 深度学习故障诊断方法:残差收缩网络
    残差收缩网络的工作原理,可以解释为:通过注意力机制注意到不重要的特征,通过软阈值函数将它们置为零;或者说,通过注意力机制注意到重要的特征,将它们保留下来,加强深度神经网络从含噪信号中提取有用特征的能力。
    2020-08-04
  • 单变量时间序列平滑方法介绍
    时间序列是由按时间排序的观察单位组成的数据。可能是天气数据、股市数据。,也就是说它是由按时间排序的观察值组成的数据。在本文中将介绍和解释时间序列的平滑方法,时间序列统计方法在另一篇文章中进行了解释。本文将解释以下 4 个结构概念:1、稳态(Stationary)稳态是指系统的状态不再随时间发生改变的一种状态。...
    2022-09-26
  • MapReduce设计模式之概要设计模式
    注意:MapReduce的内容结果输出,如果父文件夹已经存在,会报文件已存在错误,每次重新输出文件,如果都手动删除,会比较麻烦,可以自己写一个删除文件的工具类。或者hadoop中有一个FileUtil.fullyDelete()方法可以删除文件;以下是自己写的删除文件夹的代码:
    2019-07-18