R语言逻辑回归、随机森林、SVM支持向量机预测Framingham心脏病风险和模型诊断可视化

2024-02-03
阅读 8 分钟
763
世界卫生组织估计全世界每年有 1200 万人死于心脏病。在美国和其他发达国家,一半的死亡是由于心血管疾病。心血管疾病的早期预后可以帮助决定改变高危患者的生活方式,从而减少并发症。本研究旨在查明心脏病最相关/风险因素,并使用机器学习预测总体风险。\ 

R语言结构方程模型SEM、路径分析房价和犯罪率数据、预测智力影响因素可视化2案例|附代码数据

2024-02-03
阅读 12 分钟
709
SEM 在很大程度上是回归的多元扩展,我们可以在其中一次检查许多预测变量和结果。SEM 还提供了检查潜在结构(即未观察到某些变量的地方)的创新。更具体地说,“结构方程”的概念是指我们有不止一个方程表示协方差结构模型,其中我们(通常)有多个标准变量和多个预测变量。

Python随机波动模型Stochastic volatility,SV随机变分推断SVI分析标普500指数股票价格时间

2024-02-03
阅读 3 分钟
835
随机波动模型(Stochastic volatility models)经常被客户用来对股票价格随时间的变动性进行建模。波动性(volatility)是随时间的对数收益的标准差。与假设波动性恒定不变不同,随机波动模型具有隐变量参数,可以在每个时刻对波动性进行建模。

【专题】2023年中国企业跨境、出海、国际化、全球化行业报告汇总PDF合集分享(附原数据表)

2024-02-03
阅读 17 分钟
818
随着全球化的浪潮不断涌动,中国企业正面临着全球聚光灯的照射。企业的全球化已经从过去的可选项变成了当今时代发展的必然趋势。然而,中国企业在出海过程中也面临着一系列挑战和不确定性。阅读原文,获取专题报告合集全文,解锁文末242份跨境、出海、国际化、全球化相关行业研究报告。

R语言用决策树的酒店收入和产量预测可视化研究

2024-02-03
阅读 3 分钟
669
现代社会经济的发展,促进了酒店业的投资热潮, 投资者投资一个酒店,必须在投资前对若干经营数据进行科学预测与分析,对酒店可能形成的收入成本水平进行估算,从而对投资的风险进行有效预测。

Python中用PyTorch机器学习神经网络分类预测银行客户流失模型|附代码数据

2024-02-02
阅读 11 分钟
1.2k
在本文中,鉴于银行客户的某些特征,我们将预测客户在6个月后是否可能离开银行。客户离开组织的现象也称为客户流失。因此,我们的任务是根据各种客户特征预测客户流失。

R语言时变向量自回归(TV-VAR)模型分析时间序列和可视化|附代码数据

2024-02-02
阅读 6 分钟
777
另一个原因是,由于移动设备无处不在,从个人获得的时间序列变得越来越多。所谓的个人模型建模的主要目标是挖掘潜在的内部心理现象变化。考虑到这一目标,许多研究人员已经着手分析个人时间序列中的多变量依赖关系。对于这种依赖关系,最简单和最流行的模型是一阶向量自回归(VAR)模型,其中当前时间点的每个变量都是由...

NLP自然语言处理—主题模型LDA案例:挖掘人民网留言板文本数据|附代码数据

2024-02-02
阅读 3 分钟
720
随着网民规模的不断扩大,互联网不仅是传统媒体和生活方式的补充,也是民意凸显的地带。领导干部参与网络问政的制度化正在成为一种发展趋势,这种趋势与互联网发展的时代需求是分不开的

R语言社区检测算法可视化网络图:ggplot2绘制igraph对象分析物种相对丰度

2024-02-02
阅读 4 分钟
574
我们使用R中的igraph包,产生了网络的图形。\但是很难将这些图表放到演讲和文章中,因为图表很难根据需要定制。使用igraph中的绘图功能可以得到你想要的结果,但用ggplot对工作更有帮助。所以本文探索了一种在ggplot中创建igraph绘图的方法。\ 

【专题】2023年新消费趋势行业报告汇总PDF合集分享(附原数据表)

2024-02-01
阅读 29 分钟
451
2022年,全球面临疫情和经济放缓的挑战,给消费市场带来了不确定性。消费者的消费理念和生活方式也发生了变化,更加注重产品的实用性和简单性。居民收入增长放缓,消费支出减少。然而,随着疫情逐渐得到控制,中国消费市场正在逐步复苏。消费者对科学消费和提高生活质量的需求日益增长。本文将探讨2023年中国的消费趋势...

Python时间序列分析苹果股票数据:分解、平稳性检验、滤波器、滑动窗口平滑、移动平均、可视化

2024-02-01
阅读 11 分钟
792
在进行投资和交易研究时,对于时间序列数据及其操作要有专业的理解。本文将重点介绍如何使用Python和Pandas帮助客户进行时间序列分析来分析股票数据。

R语言社区检测算法可视化网络图:ggplot2绘制igraph对象分析物种相对丰度

2024-02-01
阅读 4 分钟
635
我们使用R中的igraph包,产生了网络的图形。\但是很难将这些图表放到演讲和文章中,因为图表很难根据需要定制。使用igraph中的绘图功能可以得到你想要的结果,但用ggplot对工作更有帮助。所以本文探索了一种在ggplot中创建igraph绘图的方法。\ 

R语言GAMLSS模型对艾滋病病例、降雪量数据拟合、预测、置信区间实例可视化

2024-02-01
阅读 5 分钟
765
GAMLSS模型是一种半参数回归模型,参数性体现在需要对响应变量作参数化分布的假设,非参数性体现在模型中解释变量的函数可以涉及非参数平滑函数,非参数平滑函数不预先设定函数关系,各个解释变量的非线性影响结果完全取决于样本数据。它克服了GAM模型和广义线性模型(Generalized Linear Models, GLM)的一些局限性。

【专题】2023年中国工业互联网平台行业研究报告PDF合集分享(附原数据表)

2024-02-01
阅读 4 分钟
592
这份报告合集是基于中国工业产业升级和智能制造的大背景而展开的。报告合集分析了工业互联网平台市场的发展阶段、平台玩家的产品和服务的底层逻辑以及变化趋势,并探讨了补贴减少、数据归属权之争、标准化与盈利模式、ChatGPT等因素对工业互联网平台企业的影响。阅读原文,获取专题报告合集全文,解锁文末77份工业互联网...

R语言用综合信息准则比较随机波动率(SV)模型对股票价格时间序列建模

2024-01-31
阅读 12 分钟
707
随机波动率(SV)模型是常用于股票价格建模的一系列模型。在所有的SV模型中,波动率都被看作是一个随机的时间序列。然而,从基本原理和参数布局的角度来看,SV模型之间仍有很大的不同。因此,为一组给定的股票价格数据选择最合适的SV模型对于对股票市场的未来预测非常重要。为了实现这一目标,可以使用留一交叉验证(LOO...

【专题】2023年中国白酒行业消费白皮书报告PDF合集分享(附原数据表)

2024-01-31
阅读 3 分钟
589
2023年中国白酒行业消费白皮书报告合集,总结了消费市场的两大传承和五大进化,以帮助白酒企业更好地理解消费者心理和供需变化,从而把握增长机会。两大传承包括争夺消费者的“第一口酒”以及品牌在消费决策中的关键作用。五大进化则揭示了商务应酬成为用酒场景的首位、消费档次的两极分化加剧、品牌交替使用和尝新热潮、...

R语言平稳性ADF检验、ARCH-LM效应检验分析收盘价收益率数据可视化

2024-01-31
阅读 3 分钟
1.2k
数据读取和处理是金融分析中非常重要的一步。为了减少误差,在估计时我们可以对每个交易日的收盘价进行自然对数处理,即对日收益率进行计算。本文通过R软件对金融数据帮助客户进行读取和处理,并进行了收益率波动图、收益率序列的平稳性检验、自相关图和偏自相关图以及ARCH效应检验等分析。通过这些分析,我们可以更好地...

【专题】2023年直播、短视频行业报告汇总PDF合集分享(附原数据表)

2024-01-31
阅读 15 分钟
658
中国直播电商行业正在经历蓬勃发展的时期,各大互联网平台之间的竞争日益激烈,而直播电商已成为品牌营销的常态。随着直播电商的崛起,对品牌提供了全新的产品营销和特惠促销渠道,同时也作为新产品生产和推广的媒体发布平台。本文将深入洞察中国直播电商行业的机遇和挑战,分析了不同行业领域的发展趋势和消费者行为特...

自然语言处理NLP:情感分析疫情下的新闻数据

2024-01-29
阅读 2 分钟
482
原文链接:[链接]原文出处:拓端数据部落公众号 新冠肺炎的爆发让今年的春节与往常不同。与此同时,新闻记录下了这场疫情发展的时间轴。▼为此我们分析了疫情相关的新闻内容、发布时期以及发布内容的主题和情感倾向这些方面的数据,希望通过这些数据,能对这场疫情有更多的了解。新闻对疫情相关主题的情感倾向通过对疫情...

如何用潜类别混合效应模型(Latent Class Mixed Model ,LCMM)分析老年痴呆年龄数据|附代码数据

2024-01-29
阅读 7 分钟
596
潜在类别成员由离散随机变量 ci 定义,如果主题 i 属于潜在类别 g (g = 1, …,G),则该变量等于 g。变量 ci 是潜在的;根据协变量 Xci 使用多项逻辑模型描述其概率:

R语言非线性方程数值分析生物降解、植物生长数据:多项式、渐近回归、负指数方程、幂函数曲线、米氏方程、逻辑曲线

2024-01-29
阅读 11 分钟
966
在选择最佳拟合实验数据的方程时,可能需要一些经验。当我们没有文献信息时该怎么办?我们建立模型的方法通常是经验主义的。也就是说,我们观察过程,绘制数据并注意到它们遵循一定的模式。

【专题】保险行业数字化洞察白皮书报告PDF合集分享(附原数据表)

2024-01-29
阅读 5 分钟
559
近年来,"养老"、"三胎政策"、"医疗成本"等一系列备受关注的民生话题,使得保险服务备受瞩目,并逐渐渗透到每个人的生活中。自2020年以来,由于多种因素的影响,人们对健康的意识不断提高,这正在重新塑造中国消费者对保险的认知。

【专题】2023年电力行业报告汇总PDF合集分享(附原数据表)

2024-01-29
阅读 7 分钟
794
在双碳背景下,为了实现碳达峰、碳中和目标,构建清洁低碳、安全高效的能源体系成为首要任务。清洁电力作为能源转型的关键,对于保障中国能源安全具有重要意义。为了适应新能源的大规模接入,新型电力系统应运而生,以确保电力系统的安全可靠运行。阅读原文,获取专题报告合集全文,解锁文末114份电力相关行业研究报告。

R语言中的模拟过程和离散化:泊松过程和维纳过程

2024-01-27
阅读 3 分钟
673
本文中,我们讨论了一个将Poisson过程与Wiener过程结合在一起的最佳算法的问题。实际上,为了生成泊松过程,我们总是习惯于模拟跳跃之间的持续时间。我们使用给定时间间隔内跳跃的均匀性,该条件取决于跳跃的次数。

【专题】2022中国工业机器人市场研究报告PDF合集分享(附原数据表)

2024-01-27
阅读 3 分钟
565
本报告合集将基于中国工业产业升级和智能制造的背景,通过对供应端市场和产业链的分析,结合投资视角,探讨工业机器人企业如何增强自身竞争力,推动中国工业产业发展,为企业带来新的增长和转型机会,并从而思考中国工业机器人行业的现状和未来趋势。阅读原文,获取专题报告合集全文,解锁文末190份全球制药相关行业研究...

PYTHON用时变马尔可夫区制转换(MARKOV REGIME SWITCHING)自回归模型分析经济时间序列|附代码数据

2024-01-27
阅读 6 分钟
595
本文提供了一个在统计模型中使用马可夫转换模型模型的例子,来复现Kim和Nelson(1999)中提出的一些结果。它应用了Hamilton(1989)的滤波器和Kim(1994)的平滑器

R语言KNN模型分类信贷用户信用等级参数调优和预测可视化

2024-01-27
阅读 3 分钟
583
本文主要介绍了如何帮助客户通过读取数据、查看部分数据、转换数据为因子并将数值变量归一化、进行描述性分析、建立knn模型等步骤对数据进行分析。通过分别选择不同的k值进行建模,并对比它们的准确度,找到最优的参数k。文章还介绍了如何扩大参数的范围,找到最优的k值,并绘制数据的散点图,查看每个分类的分布情况。...

【视频】R语言实现CNN(卷积神经网络)模型进行回归数据分析

2024-01-25
阅读 3 分钟
619
当我们将CNN(卷积神经网络)模型用于训练多维类型的数据(例如图像)时,它们非常有用。我们还可以实现CNN模型进行回归数据分析。我们之前使用Python进行CNN模型回归 ,在本文中,我们在R中实现相同的方法。

R语言关联规则模型(Apriori算法)挖掘杂货店的交易数据与交互可视化

2024-01-25
阅读 3 分钟
571
关联规则挖掘是一种无监督的学习方法,从交易数据中挖掘规则。它有助于找出数据集中的关系和一起出现的项目。在这篇文章中,我将解释如何在R中提取关联规则。\关联规则模型适用于交易数据。交易数据的一个例子可以是客户的购物历史。

SPSS Modeler决策树分类模型分析商店顾客消费商品数据

2024-01-25
阅读 4 分钟
1k
随着大数据时代的来临,数据挖掘和分析在商业决策中扮演着越来越重要的角色。商店的顾客消费行为数据是商业决策的关键信息之一,通过对这些数据的深入分析,可以更好地理解顾客的消费习惯和偏好,从而优化商品销售策略,提高销售业绩。本文将使用SPSS Modeler软件,帮助客户通过决策树分类模型对商店顾客消费商品数据进...