找到约 3913 条结果
  • 多任务高斯过程数学原理和Pytorch实现示例
    高斯过程其在回归任务中的应用我们都很熟悉了,但是我们一般介绍的都是针对单个任务的,也就是单个输出。本文我们将讨论扩展到多任务gp,强调它们的好处和实际实现。
    2024-07-20
  • Matlab用BUGS马尔可夫区制转换Markov switching随机波动率模型、序列蒙特卡罗、M-H采样分析时间序列数据
    原文链接:http://tecdat.cn/?p=24498在这个例子中,我们考虑马尔可夫转换随机波动率模型。统计模型让  是因变量和  未观察到的对数波动率 . 随机波动率模型定义如下 区制变量  遵循具有转移概率的二态马尔可夫过程 表示均值的正态分布  和方差 .BUGS语言统计模型文件“ssv.bug”的内容: {代码...} 安装下载Matlab最新版...
    2021-12-02
  • Kaggle 比赛: 德国信用卡违约数据分析
    下面展示一下数据处理流程,主要是处理了一下缺失值,然后根据特征按连续型和离散型进行分别处理,使用了 sklearn 里面的 LogisticRegression 包,下面的代码都有很详细的注释。
    2016-11-26
  • Matlab用BUGS马尔可夫区制转换Markov switching随机波动率SV模型、序列蒙特卡罗SMC
    原文链接:http://tecdat.cn/?p=24498原文出处:拓端数据部落公众号在这个例子中,我们考虑马尔可夫转换随机波动率模型。统计模型[]()让  是因变量和  未观察到的对数波动率 . 随机波动率模型定义如下 区制变量  遵循具有转移概率的二态马尔可夫过程 表示均值的正态分布  和方差 .BUGS语言统计模型[]()文件“ssv.bug”的内...
    2024-04-30
  • Kaggle入门级赛题:房价预测——数据挖掘篇
    特征工程 我们注意到 MSSubClass 其实是一个 category 的值: {代码...} 有: {代码...} 它不应该做为数值型的值进行统计。因此,进行强制类型转换,把它变回 string: {代码...} 然后,统计其出现频次: {代码...} 就很清楚的了解 MSSubClass 特征了。 当我们用 numerical 来表达 categorical 的时候要注意,数字本身有...
    2018-11-12
    2
  • pandas的简单例子
    pandas的简单例子 标签(空格分隔): pandas {代码...}
    2016-01-17
  • 1. R语言运行效率分析(7)
    方法7: 采用 join 语句 1: 自定义函数 {代码...} 2: 调用函数进行运算 {代码...} {代码...} (未完!待续……)
    2020-02-06
  • PHP 并发场景的几种解决方案
    使用队列,额外起一个进程处理队列,并发请求都放到队列中,由额外进程串行处理,并发问题就不存在了,但是要额外进程支持以及处理延迟严重,本文不先不讨论这种方法。
    2019-06-12
  • Pandas 2.0 vs Polars:速度的全面对比
    前几天的文章,我们已经简单的介绍过Pandas 和Polars的速度对比。刚刚发布的Pandas 2.0速度得到了显著的提升。但是本次测试发现NumPy数组上的一些基本操作仍然更快。并且Polars 0.17.0,也在上周发布,并且也提到了性能的改善,所以我们这里做一个更详细的关于速度方面的评测。
    2023-04-12
  • InfluxDB -- Continuous Query解析
    Continuous Query(CQ)是内部周期运行的InfluxQL的查询,将查询结果写入指定的measurement,用它可以实现降采样downsampling。
    2021-09-16
  • python处理数据的风骚操作[pandas 之 groupby&agg]
    每隔一段时间我都会去学习、回顾一下python中的新函数、新操作。这对于你后面的工作是有一定好处的。本文重点介绍了pandas中groupby、Grouper和agg函数的使用。这2个函数作用类似,都是对数据集中的一类属性进行聚合操作,比如统计一个用户在每个月内的全部花销,统计某个属性的最大、最小、累和、平均等数值。
    2017-12-12
    1
  • 用R语言实现支持向量机(SVM)
    支持向量机(Support Vector Machine, SVM)是一种二分类模型,它通过构造一个最优超平面对数据进行分类。超平面就是在高维空间中将不同类别的数据分离开的一个分界面,最优超平面则是离两个类别最近的数据点的距离最大的那个超平面。
    2023-02-13
  • ECMT2130 R语言分析
    ECMT2130 - 2022 semester 2, assignment 1Your answers need to be submitted using the Canvas quiz forassignment 1. The R script and Microsoft Excelspreadsheet produced in doing this assignment must be uploaded using this Canvas quiz. These documentsmust be your own work.
    2023-08-08
  • 拓端数据(tecdat):R语言基于线性回归的资本资产定价模型(CAPM)
    资本资产定价模型(CAPM) 是用于确定是否在一个特定资产的投资是值得的。本质上,问题是:“该资产的回报是否值得投资?” 在本教程中,我们将应用CAPM模型,使用多元回归模型查看特定股票是否值得投资。
    2021-02-10
  • TensorFlow学习笔记(7):TensorBoard——Tensor与Graph可视化
    前言 本文基于TensorFlow官网How-Tos的Visualizing Learning和Graph Visualization写成。 TensorBoard是TensorFlow自带的一个可视化工具。本文在学习笔记(4)的基础上修改少量代码,以探索TensorBoard的使用方法。 代码 {代码...} 思考 主要修改点有: Summary:所有需要在TensorBoard上展示的统计结果。 tf.name_scope...
    2017-02-09
  • 2021科大讯飞-车辆贷款违约预测挑战赛Top1--方案学习
    公众号:DS数说 作者:xihuishaw简介车贷违约预测问题,目的是建立风险识别模型来预测可能违约的借款人。预测结果为借款人是否可能违约,属于二分类问题。偏数据挖掘的比赛,关键点是如何基于对数据的理解抽象归纳出有用的特征。站在大佬的视角,尝试学习总结,站在巨人的肩膀上,也许看得会更远一些。直接进入主题,开...
    2021-12-10
  • COMPSCI 220 数据结构算法
    COMPSCI 220:Algorithms and Data StructuresSlides and Pictures credited to Tanya GvozdevaYan Kolezhitskiy Algorithms
    2023-07-17