数据分享|R语言决策树和随机森林分类电信公司用户流失churn数据和参数调优、ROC曲线可视化|附代码数据

7 月 15 日
阅读 7 分钟
31
原文链接:[链接]最近我们被客户要求撰写关于电信公司用户流失的研究报告,包括一些图形和统计输出。在本教程中,我们将学习覆盖决策树和随机森林。这些是可用于分类或回归的监督学习算法下面的代码将加载本教程所需的包和数据集。 {代码...} 数据花点时间探索下面的这个数据集 ( 查看文末了解数据获取方式 ) 。此数据...

数据分享|python分类预测职员离职:逻辑回归、梯度提升、随机森林、XGB、CatBoost、LGBM交叉验证可视化

7 月 15 日
阅读 3 分钟
27
采用分类这一方法构建6种模型对职员离职预测,分别是逻辑回归、梯度提升、随机森林、XGB、CatBoost、LGBM。确定某一职员属于是或否离职的目标类,并以此来探究职员大量离职的潜在因素。

【专题】2024医疗健康行业报告合集PDF分享(附原数据表)

7 月 15 日
阅读 13 分钟
28
根据国家统计局的数据和业界预测,2022年我国医药工业市场规模已攀升至约2.9万亿元,并预计至2030年,规模以上医药工业企业的收入将突破4.8万亿元,实现年复合增长率约6.5%的稳健增长。过去三年,新冠疫情为医疗行业带来了前所未有的机遇与挑战。疫苗研发、中药、创新药、生物技术及医疗器械等领域均迎来了发展的新契机...

【专题】2023年中国跨境电商平台出海白皮书报告PDF合集分享(附原数据表)

7 月 15 日
阅读 13 分钟
28
自九十年代以来,中国跨境电商已经经历了四个发展阶段,其中B2C跨境电商有望在2022年后迎来高峰。阅读原文,获取专题报告合集全文,解锁文末372份跨境电商出海相关行业研究报告。

“网约车霸主“地位面临挑战|专题报告集

7 月 15 日
阅读 16 分钟
28
广汽埃安新能源汽车,在中国车市竞争加剧的浪潮中,坚定立场,誓不言退。近期,集团虽遭遇“反内卷”讨论及裁员传言的风暴,但埃安迅速且明确地澄清,所谓的“20%人员效率提升”并非裁员举措,而是优化调整,并承诺对受影响的应届毕业生履行合同赔偿,彰显企业责任感。同时,埃安宣布泰国与长沙新厂的投产及扩招蓝图,力证其...

【专题】2024餐饮行业及营销趋势报告合集PDF分享(附原数据表)

7 月 12 日
阅读 4 分钟
97
首先,健康成为了消费者在选择餐饮时的首要考量。人们越来越注重食材的新鲜度和健康性,对菜品的口味也有了更高的要求。这意味着餐饮品牌需要关注食材的源头,确保食品的安全与营养,同时不断创新菜品,满足消费者对美味与健康的双重追求。阅读原文,获取专题报告合集全文,解锁文末91份餐饮相关行业研究报告。

R语言广义加性混合模型(GAMM)分析长沙气象因子、空气污染、PM2.5浓度、显著性检验、逐日变化可视化|附代码数据

7 月 12 日
阅读 7 分钟
79
气候变化和空气污染对现代社会产生了越来越大的影响。在这种背景下,研究气象和空气污染之间的关系以及其对PM2.5浓度的影响变得非常重要。为了更好地理解和解释这些关系,广义加性混合模型(GAMM)成为一种强大的工具。

【视频讲解】Python比赛LightGBM、XGBoost+GPU和CatBoost预测学生在游戏学习过程表现|数据代码分享

7 月 12 日
阅读 14 分钟
83
基于游戏进行学习能让学校变得有趣,这种教育方法能让学生在游戏中学习,使其变得有趣和充满活力。尽管基于游戏的学习正在越来越多的教育环境中使用,但能用应用数据科学和学习分析原理来改进基于游戏学习的数据集仍然有限。

【视频】R语言逻辑回归(Logistic回归)模型分类预测病人冠心病风险|数据分享|附代码数据

7 月 11 日
阅读 8 分钟
70
它只是表示一个只有 2 个输出的变量,例如,预测抛硬币(正面/反面)的情况。结果是二进制的:如果硬币是正面,则为 1,如果硬币为反面,则为 0。这种回归技术类似于线性回归,可用于预测分类问题的概率。

R语言ARMA-GARCH模型金融产品价格实证分析黄金价格时间序列|附代码数据

7 月 11 日
阅读 5 分钟
65
研究黄金价格的动态演变过程至关重要。文中以黄金交易市场下午定盘价格为基础,帮助客户利用时间序列的相关理论,建立了黄金价格的ARMA-GARCH模型,并对数据进行了实证分析,其结果非常接近。利用该模型可动态刻画黄金价格数据的生成过程,也可帮助黄金产品投资者和生产者做出更加灵活、科学的决策。

经济学:动态模型平均(DMA)、动态模型选择(DMS)、ARIMA、TVP预测原油时间序列价格|附代码数据

7 月 11 日
阅读 8 分钟
59
本文提供了一个经济案例。着重于原油市场的例子。简要地提供了在经济学中使用模型平均和贝叶斯方法的论据,使用了动态模型平均法(DMA),并与ARIMA、TVP等方法进行比较

【专题】2024年中国AIGC行业应用价值研究报告合集PDF分享(附原数据表)

7 月 11 日
阅读 19 分钟
79
大模型的发展标志着AIGC时代的来临,没有大模型支撑的AI已成为旧时代产物,缺乏竞争力。技术的突破始终是AI发展的关键,而商业应用则是推动其迅速发展的加速器。AI的持久繁荣依赖于其商业化的成功。展望2024年,我们有理由将其视为AIGC应用的元年。阅读原文,获取专题报告合集全文,解锁文末491份AIGC相关行业研究报告。

【视频】R语言广义加性模型GAMs非线性效应、比较分析草种耐寒性实验数据可视化

7 月 11 日
阅读 8 分钟
66
广义加法模型(Generalized Additive Models, GAMs)作为一种高度灵活的统计工具,显著扩展了广义线性模型(Generalized Linear Models, GLMs)的框架。GAMs的核心思想在于,将GLM中的一个或多个线性预测变量替换为这些变量的平滑函数,从而允许模型捕捉预测变量与条件响应之间复杂且非线性的关系,而无需事先对这些关系...

【专题】2024年国产AI大模型应用报告合集PDF分享(附原数据表)

7 月 10 日
阅读 19 分钟
166
进入21世纪初期,随着计算能力飞跃与大数据浪潮的席卷,AI大模型技术经历了从无到有的蜕变,从纯学术构想迅速转化为实际应用,其复杂性与功能性均实现了质的飞跃。特别是自2022年11月OpenAI推出ChatGPT以来,大模型技术正式步入公众视野,成为热议焦点。阅读原文,获取专题报告合集全文,解锁文末523份全球制药相关行业...

【专题】2024中国中小企业数字化发展白皮书报告合集PDF分享(附原数据表)

7 月 10 日
阅读 11 分钟
77
在我国经济复苏波动加剧的背景下,中小企业经营展现出脆弱性,而AI与大模型技术则为它们开启了数字化与智能化转型的新机遇窗口。面对挑战与机遇并存的局面,中小企业应加速构建数字化能力,从平台、产品、服务三方面入手,精准选择AI、软件及解决方案,以抢占市场先机,推动数智化转型进程。阅读原文,获取专题报告合集...

Python TensorFlow Keras深度学习模型RetinaNet进行目标检测分析车牌数据

7 月 10 日
阅读 5 分钟
85
目标检测作为计算机视觉领域的关键任务之一,在交通管理、智能安防、自动驾驶等众多应用场景中具有重要意义。车牌作为车辆的重要标识,其准确检测对于车辆识别、交通监控等系统的性能提升至关重要。

RNN循环神经网络 、LSTM长短期记忆网络实现时间序列长期利率预测|附代码数据

7 月 8 日
阅读 5 分钟
125
时间序列涉及按时间顺序收集的数据。我用 xt∈R 表示单变量数据,其中 t∈T 是观察数据时的时间索引。时间 t 在 T=Z 的情况下可以是离散的,或者在 T=R 的情况下是连续的。为简化分析,我们将仅考虑离散时间序列。

R语言实现 Copula 算法建模相依性案例分析报告

7 月 8 日
阅读 4 分钟
81
copula是将多变量分布函数与其边缘分布函数耦合的函数,通常称为边缘。Copula是建模和模拟相关随机变量的绝佳工具。Copula的主要吸引力在于,通过使用它们,你可以分别对相关结构和边缘(即每个随机变量的分布)进行建模。 

R语言用逻辑回归、决策树和随机森林对信贷数据集进行分类预测|附代码数据

7 月 8 日
阅读 4 分钟
67
原文链接:[链接] 最近我们被客户要求撰写关于的研究报告,包括一些图形和统计输出。在本文中,我们使用了逻辑回归、决策树和随机森林模型来对信用数据集进行分类预测并比较了它们的性能数据集是 {代码...} 看起来所有变量都是数字变量,但实际上,大多数都是因子变量, {代码...} 让我们将分类变量转换为因子变量, {代...

【专题】2024年中国微短剧行业研究报告合集PDF分享(附原数据表)

7 月 8 日
阅读 6 分钟
79
近年来,随着网络基础设施的持续优化,特别是短视频行业的蓬勃兴起与技术创新的不断驱动,微短剧作为一种新兴内容形式迅速崛起,展现出强劲的发展势头。随着其产出量急剧攀升,内容供给日益丰富多样,加之用户对碎片化娱乐需求的日益增长,微短剧行业已成为娱乐内容领域的璀璨新星,备受瞩目。阅读原文,获取专题报告合...

【视频讲解】Python、R时间卷积神经网络TCN与CNN、RNN预测时间序列3实例附代码数据

7 月 8 日
阅读 12 分钟
112
本文旨在探讨时间卷积网络(Temporal Convolutional Network, TCN)与CNN、RNN在预测任务中的应用。通过引入TCN模型,我们尝试解决时间序列数据中的复杂依赖关系,以提高预测的准确性。本文首先介绍了TCN的基本原理,随后详细描述了数据预处理、模型构建、训练及评估的整个过程。实验结果表明,TCN模型在处理时间序列数...

数据分享|python分类预测职员离职:逻辑回归、梯度提升、随机森林、XGB、CatBoost、LGBM交叉验证可视化

7 月 5 日
阅读 3 分钟
133
采用分类这一方法构建6种模型对职员离职预测,分别是逻辑回归、梯度提升、随机森林、XGB、CatBoost、LGBM。确定某一职员属于是或否离职的目标类,并以此来探究职员大量离职的潜在因素。

R语言、SAS潜类别(分类)轨迹模型LCTM分析体重指数 (BMI)数据可视化|附代码数据

7 月 5 日
阅读 7 分钟
123
在本文中,潜类别轨迹建模 (LCTM) 是流行病学中一种相对较新的方法,用于描述生命过程中的暴露,它将异质人群简化为同质模式或类别。然而,对于给定的数据集,可以根据类的数量、模型结构和轨迹属性得出不同模型的分数

Python金融时间序列模型ARIMA 和GARCH 在股票市场预测应用|附代码数据

7 月 5 日
阅读 5 分钟
171
这篇文章讨论了自回归综合移动平均模型 (ARIMA) 和自回归条件异方差模型 (GARCH) 及其在股票市场预测中的应用 ( 点击文末“阅读原文”获取完整代码数据******** )。

Matlab马尔可夫链蒙特卡罗法(MCMC)估计随机波动率(SV,Stochastic Volatility) 模型|附代码数据

7 月 5 日
阅读 7 分钟
120
甚至波动率本身也是一种金融工具,例如 CBOE 的 VIX 波动率指数。然而,与证券价格或利率不同,波动性无法直接观察到。相反,它通常被衡量为证券或市场指数的收益率历史的统计波动。这种类型的度量称为已实现波动率或历史波动率。衡量波动性的另一种方法是通过期权市场,其中期权价格可用于通过某些期权定价模型得出标的...

【专题】2024中国快消品企业出海新商机报告合集PDF分享(附原数据表)

7 月 5 日
阅读 11 分钟
103
东南亚,一个由6.93亿人口构成的庞大市场,正以其稳定的经济增长和蓬勃发展的快消品行业,吸引着全球企业的目光。这一地区不仅人口基数大,且经济增长率持续高于全球及中国平均水平,为出海企业铺设了宽广的跑道。阅读原文,获取专题报告合集全文,解锁文末289份快消品、出海相关行业研究报告。

R语言大学城咖啡店消费问卷调查报告:信度分析、主成分分析可视化

7 月 4 日
阅读 4 分钟
74
本次调查旨在了解文汇路咖啡店的市场状况,以便为学校周边咖啡店的经营发展提供积极的引导意义。我们通过问卷调查的方式,收集了大量的数据,通过r软件对数据进行了基本情况分析、信度分析、问卷调查数据可视化分析以及主成分分析,以全面了解文汇路咖啡店的市场情况。

R语言汽车口碑数据采集抓取、文本数据分词和词云可视化实现

7 月 4 日
阅读 3 分钟
68
本文以R语言为工具,帮助客户对汽车网站的口碑数据进行抓取,并基于文本数据分词技术进行数据清理和统计。通过词频统计和词云可视化,对口碑中的关键词进行分析,挖掘出消费者对汽车的评价和需求,为汽车制造商和销售商提供重要的市场参考。

R语言武汉流动人口趋势预测:灰色模型GM(1,1)、ARIMA时间序列、logistic逻辑回归模型|附代码数据

7 月 4 日
阅读 5 分钟
73
人力资源是社会文明进步、人民富裕幸福、国家繁荣昌盛的核心推动力量。当前,我国经济正处于从以政府主导的投资驱动型的经济“旧常态”向以市场需求为主导的经济“新常态”转型过渡期。

【专题】2024年6月数字化行业报告合集汇总PDF分享(附原数据表)

7 月 4 日
阅读 20 分钟
67
随着科技的飞速发展和全球数字化进程的加速推进,我们正处在一个充满变革与机遇的时代。从人工智能的深入应用到工业互联网的蓬勃发展,从智慧医疗的兴起到新能源汽车的普及,每一个领域都在经历着前所未有的转型与升级。这些变革不仅重塑了我们的生产方式、生活方式,更深刻地影响着社会经济结构与发展模式。阅读原文,...