多任务高斯过程数学原理和Pytorch实现示例
高斯过程其在回归任务中的应用我们都很熟悉了,但是我们一般介绍的都是针对单个任务的,也就是单个输出。本文我们将讨论扩展到多任务gp,强调它们的好处和实际实现。
2024-07-20
Matlab用BUGS马尔可夫区制转换Markov switching随机波动率模型、序列蒙特卡罗、M-H采样分析时间序列数据
原文链接:http://tecdat.cn/?p=24498在这个例子中,我们考虑马尔可夫转换随机波动率模型。统计模型让 是因变量和 未观察到的对数波动率 . 随机波动率模型定义如下 区制变量 遵循具有转移概率的二态马尔可夫过程 表示均值的正态分布 和方差 .BUGS语言统计模型文件“ssv.bug”的内容: {代码...} 安装下载Matlab最新版...
2021-12-02
Kaggle 比赛: 德国信用卡违约数据分析
下面展示一下数据处理流程,主要是处理了一下缺失值,然后根据特征按连续型和离散型进行分别处理,使用了 sklearn 里面的 LogisticRegression 包,下面的代码都有很详细的注释。
Matlab用BUGS马尔可夫区制转换Markov switching随机波动率SV模型、序列蒙特卡罗SMC
原文链接:http://tecdat.cn/?p=24498原文出处:拓端数据部落公众号在这个例子中,我们考虑马尔可夫转换随机波动率模型。统计模型[]()让 是因变量和 未观察到的对数波动率 . 随机波动率模型定义如下 区制变量 遵循具有转移概率的二态马尔可夫过程 表示均值的正态分布 和方差 .BUGS语言统计模型[]()文件“ssv.bug”的内...
2024-04-30
Kaggle入门级赛题:房价预测——数据挖掘篇
特征工程 我们注意到 MSSubClass 其实是一个 category 的值: {代码...} 有: {代码...} 它不应该做为数值型的值进行统计。因此,进行强制类型转换,把它变回 string: {代码...} 然后,统计其出现频次: {代码...} 就很清楚的了解 MSSubClass 特征了。 当我们用 numerical 来表达 categorical 的时候要注意,数字本身有...
pandas的简单例子
pandas的简单例子 标签(空格分隔): pandas {代码...}
2016-01-17
1. R语言运行效率分析(7)
方法7: 采用 join 语句 1: 自定义函数 {代码...} 2: 调用函数进行运算 {代码...} {代码...} (未完!待续……)
PHP 并发场景的几种解决方案
使用队列,额外起一个进程处理队列,并发请求都放到队列中,由额外进程串行处理,并发问题就不存在了,但是要额外进程支持以及处理延迟严重,本文不先不讨论这种方法。
Pandas 2.0 vs Polars:速度的全面对比
前几天的文章,我们已经简单的介绍过Pandas 和Polars的速度对比。刚刚发布的Pandas 2.0速度得到了显著的提升。但是本次测试发现NumPy数组上的一些基本操作仍然更快。并且Polars 0.17.0,也在上周发布,并且也提到了性能的改善,所以我们这里做一个更详细的关于速度方面的评测。
2023-04-12
InfluxDB -- Continuous Query解析
Continuous Query(CQ)是内部周期运行的InfluxQL的查询,将查询结果写入指定的measurement,用它可以实现降采样downsampling。
2021-09-16
python处理数据的风骚操作[pandas 之 groupby&agg]
每隔一段时间我都会去学习、回顾一下python中的新函数、新操作。这对于你后面的工作是有一定好处的。本文重点介绍了pandas中groupby、Grouper和agg函数的使用。这2个函数作用类似,都是对数据集中的一类属性进行聚合操作,比如统计一个用户在每个月内的全部花销,统计某个属性的最大、最小、累和、平均等数值。
用R语言实现支持向量机(SVM)
支持向量机(Support Vector Machine, SVM)是一种二分类模型,它通过构造一个最优超平面对数据进行分类。超平面就是在高维空间中将不同类别的数据分离开的一个分界面,最优超平面则是离两个类别最近的数据点的距离最大的那个超平面。
2023-02-13
ECMT2130 R语言分析
ECMT2130 - 2022 semester 2, assignment 1Your answers need to be submitted using the Canvas quiz forassignment 1. The R script and Microsoft Excelspreadsheet produced in doing this assignment must be uploaded using this Canvas quiz. These documentsmust be your own work.
2023-08-08
拓端数据(tecdat):R语言基于线性回归的资本资产定价模型(CAPM)
资本资产定价模型(CAPM) 是用于确定是否在一个特定资产的投资是值得的。本质上,问题是:“该资产的回报是否值得投资?” 在本教程中,我们将应用CAPM模型,使用多元回归模型查看特定股票是否值得投资。
2021-02-10
TensorFlow学习笔记(7):TensorBoard——Tensor与Graph可视化
前言 本文基于TensorFlow官网How-Tos的Visualizing Learning和Graph Visualization写成。 TensorBoard是TensorFlow自带的一个可视化工具。本文在学习笔记(4)的基础上修改少量代码,以探索TensorBoard的使用方法。 代码 {代码...} 思考 主要修改点有: Summary:所有需要在TensorBoard上展示的统计结果。 tf.name_scope...
2021科大讯飞-车辆贷款违约预测挑战赛Top1--方案学习
公众号:DS数说 作者:xihuishaw简介车贷违约预测问题,目的是建立风险识别模型来预测可能违约的借款人。预测结果为借款人是否可能违约,属于二分类问题。偏数据挖掘的比赛,关键点是如何基于对数据的理解抽象归纳出有用的特征。站在大佬的视角,尝试学习总结,站在巨人的肩膀上,也许看得会更远一些。直接进入主题,开...
2021-12-10
COMPSCI 220 数据结构算法
COMPSCI 220:Algorithms and Data StructuresSlides and Pictures credited to Tanya GvozdevaYan Kolezhitskiy Algorithms
2023-07-17