找到约 3918 条结果
  • Python数据清洗(三):异常值识别与处理
    异常值也称为离群点,就是那些远离绝大多数样本点的特殊群体,通常这样的数据点在数据集中都表现出不合理的特性。如果忽视这些异常值,在某些建模场景下就会导致结论的错误(如线性回归模型、K均值聚类等),所以在数据的探索过程中,有必要识别出这些异常值并处理好它们。
    2019-11-25
  • 检测和处理异常值的极简指南
    本文是关于检测和处理数据集中的异常值,主要包含以下四部分内容:什么是异常值?为什么检测异常值很重要?如何检测异常值?如何处理异常值?什么是异常值?异常值是与其他观察结果显着不同的数据点。如下图所示,橙色数据点与一般分布相去甚远。我们将此点称为异常值。为什么检测异常值很重要?在数据科学项目、统计分...
    2022-04-19
  • 统计学小抄:常用术语和基本概念小结
    描述性统计是以数字和图表的形式来理解、分析和总结数据。对不同类型的数据(数值的和分类的)使用不同的图形和图表来分析数据,如条形图、饼图、散点图、直方图等。所有的解释和可视化都是描述性统计的一部分。重要的是要记住,描述性统计可以在样本和总体数据上执行,但并不会使用总体数据。
    2022-05-08
  • 拓端数据tecdat:R语言对布丰投针(蒲丰投针)实验进行模拟和动态可视化生成GIF动画
    布丰投针是几何概率领域中最古老的问题之一。它最早是在1777年提出的。它将针头掷到有平行线的纸上,并确定针和其中一条平行线相交的可能性。令人惊讶的结果是概率与pi的值直接相关。
    2021-04-07
  • CS4022 High Performance Computing
    UNIVERSITY OF WARWICKLEVEL 7 Open Book Assessment [2 hours]Department of Computer ScienceCS4022: High Performance ComputingInstructions
    2021-06-11
  • CS4022 High Performance 原理解说
    UNIVERSITY OF WARWICKLEVEL 7 Open Book Assessment [2 hours]Department of Computer ScienceCS4022: High Performance ComputingInstructions
    2021-06-11
  • Homework 4 INF 552
    Homework 4 INF 552, Disclaimer: This set of homework applies SMOTE to a seriously imbalanced datasetwith a large number of features and data points. SMOTE is essentially a time consumingmethod. You need to start doing this homework early, so that you have enough time to runSMOTE on the full dataset.
    2021-10-09
  • R语言基于ARMA-GARCH-VaR模型拟合和预测实证研究分析案例
    原文链接:[链接]本文显示了如何基于潜在的ARMA-GARCH模型(当然也涉及更广泛意义上的QRM)来拟合和预测风险价值(VaR)。从ARMA-GARCH过程模拟(log-return)数据我们考虑使用t 分布的ARMA(1,1)-GARCH(1,1)过程。模拟一个序列(用于说明目的)。 {代码...} 作为一个完整性检查,让我们绘制模拟序列,条件标准偏差和...
    2022-04-11
  • R语言基于ARMA-GARCH-VaR模型拟合和预测实证研究分析案例
    原文链接:[链接]原文出处:拓端数据部落公众号 本文显示了如何基于潜在的ARMA-GARCH模型(当然也涉及更广泛意义上的QRM)来拟合和预测风险价值(VaR)。从ARMA-GARCH过程模拟(log-return)数据我们考虑使用t 分布的ARMA(1,1)-GARCH(1,1)过程。模拟一个序列(用于说明目的)。 {代码...} 作为一个完整性检查,让我...
    2024-02-24
  • tensorflow学习笔记3——MNIST应用篇
    卷积神经网络(Convolutional Neural Network,CNN)是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现。[2] 它包括卷积层(convolutional layer)和池化层(pooling layer)。
    2018-01-30
  • esproc vs python 2 简单计算
    A4:我们用T表示序表。T.derive()表示增加字段。这里用age(日期)计算出年龄,作为Age字段。用NAME,SURNAME得到Fullname。
    2019-03-20
  • 拓端数据(tecdat):R语言线性回归和时间序列分析北京房价影响因素可视化案例
    原文链接:[链接] 目的房价有关的数据可能反映了中国近年来的变化:人们得到更多的资源(薪水),期望有更好的房子人口众多独生子女政策:如何影响房子的几何结构?更多的卧室,更多的空间我核心的想法是预测房价。然而,我不打算使用任何arima模型;相反,我将使用数据的特性逐年拟合回归。结构如下:数据准备:将数值...
    2021-03-18
  • 推荐系统入门笔记八: 基于矩阵分解的协同过滤推荐
    通常SVD矩阵分解指的是SVD(奇异值)分解技术,在这我们姑且将其命名为Traditional SVD(传统并经典着)其公式如下:$$M_{m \times n}=U{m \times k}\sum{}{}_{k \times k}V_{k \times n}^T$$Traditional SVD分解的形式为3个矩阵相乘,中间矩阵为奇异值矩阵。如果想运用SVD分解的话,有一个前提是要求矩阵是稠密的,即矩...
    2021-11-15
  • ​常见的8个概率分布公式和可视化
    现实世界中有几个现象实例被认为是统计性质的(即天气数据、销售数据、财务数据等)。这意味着在某些情况下,我们已经能够开发出方法来帮助我们通过可以描述数据特征的数学函数来模拟自然。
    2022-04-21
  • 10个Pandas的高级技巧
    Pandas是我们最常用的数据处理Python库之一。尽管您可能已经与它共事多年,但可能还有许多您尚未探索的实用方法。我将向您展示一些可能未曾听说但在数据整理方面非常实用的方法。
    2024-02-02
  • MIE 1622H Portfolio Selection Strategies
    MIE 1622H: Assignment 1 – Mean-VariancePortfolio Selection StrategiesJanuary 27, 2025Due: Saturday, February 15, 2025, not later than 11:59p.m.Use Python for all MIE1622H assignments.You should hand in:• Your report (pdf file and docx file). Maximum page limit is 4 pages.•  Compress all of your P...
    2025-02-17
  • 回归分析 Regression
    回归分析(regressionanalysis)是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,运用十分广泛。简单来说,就是将一系列影响因素和结果拟合出一个方程,然后将这个方程应用到其他同类事件中,可以进行预测。回归分析按照涉及的自变量的多少,分为一元回归和多元回归分析;按照自变量和因变量之间的关系类型...
    2017-02-24