过采样SMOTE逻辑回归、SVM、随机森林、AdaBoost和XGBoost对不平衡数据分析预测

7 月 25 日
阅读 4 分钟
63
全文链接:[链接]原文出处:拓端数据部落公众号分析师:Yimeng Li近几年,伴随着互联网的发展,在线食品配送业务成为了新潮流。在此背景下,我们帮助客户对“在线食品交付偏好-班加罗尔地区”数据开展研究,建立印度在线食品配送平台消费者的用户画像,研究影响顾客购买意愿的因素,并给出相应的预测。本文结合一个Python...

【专题】2024年云计算白皮书报告合集PDF分享(附原数据表)

7 月 25 日
阅读 10 分钟
70
原文链接:[链接]年全球云计算市场显著增长,预计将持续繁荣至2027年突破万亿美元,中国市场同样保持强劲势头,预计也将大幅跃升。国内云计算经过十余年发展,虽取得显著进展,但在资源布局、服务质量和技术融合等方面仍需深化提升。阅读原文,获取专题报告合集全文,解锁文末268份云计算相关行业研究报告。同时,云计算...

困于数字化泥潭的软件公司|专题报告集

7 月 24 日
阅读 11 分钟
40
数字化专题报告集链接:[链接] 在探讨企业数字化转型的进程中,软件公司无疑扮演着举足轻重的角色。它们不仅是技术创新的驱动力,更是连接管理与技术的桥梁。然而,正如许多观察家所指出的那样,软件公司既是数字化转型成功的关键,也可能成为失败的替罪羊。这一现象背后,折射出软件公司在面对复杂市场环境和多变客户需...

【专题】2024AI人工智能体验营销行业研究报告合集PDF分享(附原数据表)

7 月 23 日
阅读 15 分钟
67
原文出处:拓端数据部落公众号 随着体验经济与智能新时代的双重浪潮席卷而来,既有的传统营销框架与初始体验营销理念逐渐显露出对快速膨胀的数字化生态及企业多元化需求的适应性不足。在此背景下,构建一个契合数智化时代脉搏的全新营销理论体系显得尤为迫切,旨在领航并精心策划针对未来用户的智能营销战略。阅读原文,...

Python贝叶斯、transformer自注意力机制self-attention个性化推荐模型预测课程平台学生数据

7 月 23 日
阅读 3 分钟
67
全文链接:[链接]原文出处:拓端数据部落公众号 分析师:Kung Fu近年来,在线课程凭借便捷的网络变得越来越流行。为了有更好的用户体验,在线课程平台想要给用户推荐他们所感兴趣的课程,以便增大点击率和用户黏性。解决方案任务/目标根据学生所选的历史课程,预测出学生接下来可能选择的课程。数据源准备数据说明:stu_...

【专题】百度萝卜快跑体验:Robotaxi发展现状与展望报告合集PDF分享(附原数据表)

7 月 22 日
阅读 15 分钟
75
百度“萝卜快跑”近期因事故与抵制引发关注,武汉部署超300辆全无人驾驶车。体验显示其安全但策略保守,行驶效率低于人类司机,价格亲民。阅读原文,获取专题报告合集全文,解锁文末410份Robotaxi相关行业研究报告。算法依赖高精地图,灵活度不足,盈利挑战大,因低单量与高成本。对网约车市场冲击有限,但显著提升智能驾...

【视频】Python遗传算法GA优化SVR支持向量回归、ANFIS自适应神经模糊推理系统预测证券指数ISE数据

7 月 22 日
阅读 5 分钟
59
全文链接:[链接]本文旨在通过应用多种机器学习技术,对交易所的历史数据进行深入分析和预测。我们帮助客户使用了遗传算法GA优化的支持向量回归(SVR)、自适应神经模糊推理系统(ANFIS)等方法,对数据进行了特征选择、数据预处理、模型训练与评估。实验结果表明,这些方法在预测证券交易所指数(ISE)方面具有显著效果...

【视频讲解】PCA主成分分析原理及R语言经济研究可视化2实例合集|附代码数据-CSDN博客

7 月 19 日
阅读 9 分钟
81
在数据分析的浩瀚宇宙中,我们时常面对多变量的数据海洋。这些变量虽然信息丰富,却也给处理带来了巨大挑战:工作量激增,而关键信息却可能淹没在繁杂的数据之中。为了有效减少指标数量同时尽可能保留原有信息,我们引入了相关性这一强大工具,通过它,我们得以重构数据世界,从而诞生了主成分分析法(PCA)——一种广泛应...

【专题】2024年中国网约车聚合型平台发展分析报告合集PDF分享(附原数据表)

7 月 19 日
阅读 17 分钟
75
报告揭示,2024年中国网约车市场正迈入聚合型平台引领的新纪元。这些平台汇聚了多家网约车服务,为用户带来前所未有的丰富与便捷出行选择,其满意度高达80%,巩固了市场领导地位。网约车行业的蓬勃发展离不开科技与创新。自动驾驶与大数据分析等前沿技术,为行业带来了颠覆性变革。无人驾驶出租车的逐步应用,不仅提升了...

R语言中贝叶斯网络(BN)、动态贝叶斯网络、线性模型分析错颌畸形数据|附代码数据

7 月 18 日
阅读 17 分钟
86
贝叶斯网络(BN)是一种基于有向无环图的概率模型,它描述了一组变量及其相互之间的条件依赖性。它是一个图形模型,我们可以很容易地检查变量的条件依赖性和它们在图中的方向

【专题】2024年中国AIGC行业应用价值研究报告合集PDF分享(附原数据表)

7 月 18 日
阅读 19 分钟
88
大模型的发展标志着AIGC时代的来临,没有大模型支撑的AI已成为旧时代产物,缺乏竞争力。技术的突破始终是AI发展的关键,而商业应用则是推动其迅速发展的加速器。AI的持久繁荣依赖于其商业化的成功。展望2024年,我们有理由将其视为AIGC应用的元年。阅读原文,获取专题报告合集全文,解锁文末491份AIGC相关行业研究报告。

【视频讲解】神经网络、Lasso回归、线性回归、随机森林、ARIMA股票价格时间序列预测|附代码数据

7 月 18 日
阅读 13 分钟
85
全文链接:tecdat.cn/?p=37019分析师:Haopeng Li随着我国股票市场规模的不断扩大、制度的不断完善,它在金融市场中也成为了越来越不可或缺的一部分。基于此,选择合适的模型对股票价格进行精准、可靠的预测变得愈加重要。因为股票市场容易受到经济、政策、心理等多种相关因素的影响,是一个极其复杂的非线性系统,再加...

写字楼没人租了,租金大跳水|专题报告集

7 月 18 日
阅读 4 分钟
77
原文链接:tecdat.cn/?p=35356原文出处:拓端数据部落公众号自2020年起,全球范围内的疫情、消费习惯数字化转型及远程工作模式的兴起,给商业地产带来了前所未有的挑战。空置率飙升、租金下滑、投资回报降低,这一系列连锁反应让商业地产市场陷入寒冬。特别是中国的一线城市,写字楼空置率已达到历史新高,租金水平也跌...

数据分享|逻辑回归、随机森林、SVM支持向量机预测心脏病风险数据和模型诊断可视化|附代码数据

7 月 17 日
阅读 10 分钟
80
该数据集 ( 查看文末了解数据获取方式 ) 来自对居民正在进行的心血管研究。分类目标是预测患者未来是否有 10 年患冠心病 (CHD) 的风险。数据集提供了患者的信息。它包括超过 4,000 条记录和 15 个属性。

R语言贝叶斯MCMC:用rstan建立线性回归模型分析汽车数据和可视化诊断|附代码数据

7 月 17 日
阅读 5 分钟
89
Stan是一种用于指定统计模型的编程语言。它最常被用作贝叶斯分析的MCMC采样器。马尔科夫链蒙特卡洛(MCMC)是一种抽样方法,允许你在不知道分布的所有数学属性的情况下估计一个概率分布。它在贝叶斯推断中特别有用,因为后验分布往往不能写成表达式。要使用Stan,用户要写一个Stan程序,代表他们的统计模型。这个程序指...

【专题】2023中国机器人产业分析报告PDF合集分享(附原数据表)

7 月 17 日
阅读 3 分钟
79
仿生机器人作为一类结合了仿生学原理的机器人,具备自主决策和规划行动的能力,正逐渐进入大众视野。它们的核心技术要素包括感知与认知技术、运动与控制技术、人机交互技术和自主决策技术。

Python对商店数据进行lstm和xgboost销售量时间序列建模预测分析|附代码数据

7 月 17 日
阅读 7 分钟
68
全文下载链接:[链接]最近我们被客户要求撰写关于销售量时间序列建模的研究报告,包括一些图形和统计输出。在本文中,在数据科学学习之旅中,我经常处理日常工作中的时间序列数据集,并据此做出预测 我将通过以下步骤:探索性数据分析(EDA)问题定义(我们要解决什么)变量识别(我们拥有什么数据)单变量分析(了解数...

Python回归、聚类、相关分析上海公租房租金满意度影响因素数据可视化

7 月 17 日
阅读 5 分钟
76
随着城市化进程的加速,住房问题日益成为城市居民关注的焦点。公租房作为政府为解决中低收入家庭住房困难而推出的一种重要住房保障形式,其租金水平、居住条件及租住体验直接关系到广大租户的切身利益和生活质量。因此,深入研究公租房租金满意度的影响因素,不仅有助于提升公租房的管理和服务水平,还能为政府制定更加...

数据分享|R语言逻辑回归、线性判别分析LDA、GAM、MARS、KNN、QDA、决策树、随机森林、SVM分类葡萄酒交叉验证ROC

7 月 16 日
阅读 13 分钟
71
该数据集(查看文末了解数据获取方式)有1599个观测值和12个变量,分别是固定酸度、挥发性酸度、柠檬酸、残糖、氯化物、游离二氧化硫、总二氧化硫、密度、pH值、硫酸盐、酒精和质量。固定酸度、挥发性酸度、柠檬酸、残糖、氯化物、游离二氧化硫、总二氧化硫、密度、pH、硫酸盐和酒精是自变量并且是连续的。质量是因变量...

PYTHON用时变马尔可夫区制转换(MARKOV REGIME SWITCHING)自回归模型分析经济时间序列|附代码数据

7 月 16 日
阅读 6 分钟
60
本文提供了一个在统计模型中使用马可夫转换模型模型的例子,来复现Kim和Nelson(1999)中提出的一些结果。它应用了Hamilton(1989)的滤波器和Kim(1994)的平滑器

极值理论 EVT、POT超阈值、GARCH 模型分析股票指数VaR、条件CVaR:多元化投资组合预测风险测度分析|附代码数据

7 月 16 日
阅读 11 分钟
74
使用 Anderson-Darling 检验对 10 只股票的组合数据进行正态性检验,并使用 Block Maxima 和 Peak-Over-Threshold 的 EVT 方法估计 VaR/CvaR。最后,使用条件异向性 (GARCH) 处理的广义自回归来预测未来 20 天后指数的未来值。本文将确定计算风险因素的不同方法对模型结果的影响。

R语言极值分析:GEV与GPD模型与MCMC的海洋观测数据极值模拟可视化研究

7 月 16 日
阅读 5 分钟
76
在海洋科学领域,极端天气和海洋事件如极端海浪、风暴潮和海啸等,对沿海社区、基础设施及生态环境构成了重大威胁。准确预测和评估这些极端事件的强度和频率,对于制定有效的防灾减灾策略至关重要。极值分析作为统计学的一个重要分支,专门用于处理和分析极端值的出现规律,近年来在海洋观测数据的处理中得到了广泛应用。

【专题】2024年资产管理报告:AI人工智能与下一轮转型浪潮报告合集PDF分享(附原数据表)

7 月 16 日
阅读 16 分钟
78
AI正深刻重塑资管界,不仅加速了投资决策与运营效率,更开辟了个性化服务蓝海与私募市场的新征途。在2023年的全球资管舞台上,资产规模虽跃升至近120万亿美元新高度,但行业亦面临收入增长迟滞与成本攀升的双重考验。阅读原文,获取专题报告合集全文,解锁文末432份AI、资产管理相关行业研究报告。

数据分享|R语言决策树和随机森林分类电信公司用户流失churn数据和参数调优、ROC曲线可视化|附代码数据

7 月 15 日
阅读 7 分钟
37
原文链接:[链接]最近我们被客户要求撰写关于电信公司用户流失的研究报告,包括一些图形和统计输出。在本教程中,我们将学习覆盖决策树和随机森林。这些是可用于分类或回归的监督学习算法下面的代码将加载本教程所需的包和数据集。 {代码...} 数据花点时间探索下面的这个数据集 ( 查看文末了解数据获取方式 ) 。此数据...

数据分享|python分类预测职员离职:逻辑回归、梯度提升、随机森林、XGB、CatBoost、LGBM交叉验证可视化

7 月 15 日
阅读 3 分钟
26
采用分类这一方法构建6种模型对职员离职预测,分别是逻辑回归、梯度提升、随机森林、XGB、CatBoost、LGBM。确定某一职员属于是或否离职的目标类,并以此来探究职员大量离职的潜在因素。

【专题】2024医疗健康行业报告合集PDF分享(附原数据表)

7 月 15 日
阅读 13 分钟
348
根据国家统计局的数据和业界预测,2022年我国医药工业市场规模已攀升至约2.9万亿元,并预计至2030年,规模以上医药工业企业的收入将突破4.8万亿元,实现年复合增长率约6.5%的稳健增长。过去三年,新冠疫情为医疗行业带来了前所未有的机遇与挑战。疫苗研发、中药、创新药、生物技术及医疗器械等领域均迎来了发展的新契机...

【专题】2023年中国跨境电商平台出海白皮书报告PDF合集分享(附原数据表)

7 月 15 日
阅读 13 分钟
287
自九十年代以来,中国跨境电商已经经历了四个发展阶段,其中B2C跨境电商有望在2022年后迎来高峰。阅读原文,获取专题报告合集全文,解锁文末372份跨境电商出海相关行业研究报告。

“网约车霸主“地位面临挑战|专题报告集

7 月 15 日
阅读 16 分钟
33
广汽埃安新能源汽车,在中国车市竞争加剧的浪潮中,坚定立场,誓不言退。近期,集团虽遭遇“反内卷”讨论及裁员传言的风暴,但埃安迅速且明确地澄清,所谓的“20%人员效率提升”并非裁员举措,而是优化调整,并承诺对受影响的应届毕业生履行合同赔偿,彰显企业责任感。同时,埃安宣布泰国与长沙新厂的投产及扩招蓝图,力证其...

【专题】2024餐饮行业及营销趋势报告合集PDF分享(附原数据表)

7 月 12 日
阅读 4 分钟
136
首先,健康成为了消费者在选择餐饮时的首要考量。人们越来越注重食材的新鲜度和健康性,对菜品的口味也有了更高的要求。这意味着餐饮品牌需要关注食材的源头,确保食品的安全与营养,同时不断创新菜品,满足消费者对美味与健康的双重追求。阅读原文,获取专题报告合集全文,解锁文末91份餐饮相关行业研究报告。

R语言广义加性混合模型(GAMM)分析长沙气象因子、空气污染、PM2.5浓度、显著性检验、逐日变化可视化|附代码数据

7 月 12 日
阅读 7 分钟
101
气候变化和空气污染对现代社会产生了越来越大的影响。在这种背景下,研究气象和空气污染之间的关系以及其对PM2.5浓度的影响变得非常重要。为了更好地理解和解释这些关系,广义加性混合模型(GAMM)成为一种强大的工具。