SF
拓端数据
拓端数据
注册登录
关注博客
注册登录
主页
关于
RSS
文本挖掘tf-idf,主题建模,情感分析,n-gram建模研究|附代码数据
拓端tecdat
2024-05-30
阅读 4 分钟
639
我们围绕文本挖掘技术进行一些咨询,帮助客户解决独特的业务问题。我们对20个Usenet公告板的20,000条消息进行分析 ( 点击文末“阅读原文”获取完整代码数据 )。
Python信贷风控模型:梯度提升Adaboost,XGBoost,SGD, GBOOST, SVC,随机森林, KNN预测
拓端tecdat
2024-05-30
阅读 6 分钟
595
1. ID: 每个客户的ID\2. LIMIT_BAL: 金额\3. SEX: 性别(1 =男,2 =女)\4.教育程度: (1 =研究生,2 =本科,3 =高中,4 =其他,5 =未知)\5.婚姻: 婚姻状况(1 =已婚,2 =单身,3 =其他)\6.年龄:\7. PAY\_0: 2005年9月的还款状态(-1 =正常付款,1 =延迟一个月的付款,2 =延迟两个月的付款,8 =延迟八个月的付...
【专题】2024年中国游戏营销趋势报告合集PDF分享(附原数据表)
拓端tecdat
2024-05-30
阅读 5 分钟
703
2023年,全球游戏行业表现卓越,不仅用户规模扩大至33.81亿,行业营收也攀升至1.35万亿人民币,呈现出强劲的增长态势。然而,与此同时,全球游戏创业公司在风险投资上的大幅缩减也揭示了行业面临的某些挑战。阅读原文,获取专题报告合集全文,解锁文末104份游戏相关行业研究报告。
数据分享|python分类预测职员离职:逻辑回归、梯度提升、随机森林、XGB、CatBoost、LGBM交叉验证可视化
拓端tecdat
2024-05-30
阅读 3 分钟
555
采用分类这一方法构建6种模型对职员离职预测,分别是逻辑回归、梯度提升、随机森林、XGB、CatBoost、LGBM。确定某一职员属于是或否离职的目标类,并以此来探究职员大量离职的潜在因素。
【专题】2024生成式AI人工智能使用趋势研究报告合集PDF分享(附原数据表)
拓端tecdat
2024-05-30
阅读 20 分钟
1.2k
在过去几十年的漫长时间里,人工智能的发展相对平缓,缺乏突破性的进展。然而,2022年标志着AI大模型技术奇点的诞生,这一里程碑式的事件彻底改变了AI的能力边界,使其受到前所未有的瞩目。公众对大模型技术的兴趣与日俱增,AI大模型技术现已进入企业间全面竞争和规模化应用推广的崭新阶段。在这一波浪潮中,各大互联网...
共享单车数据可视化分析|附代码数据
拓端tecdat
2024-05-29
阅读 3 分钟
698
作为城市共享交通系统的一个重要组成部分,以绿色环保、便捷高效、经济环保为特征的自行车共享行业在2016年用户总数达到2030万人次,全国运营市场达到11.5亿元。
【专题】2024年5月电商行业趋势报告合集汇总PDF分享(附原数据表)
拓端tecdat
2024-05-29
阅读 13 分钟
714
随着数字经济的蓬勃发展,电商行业正以前所未有的速度改变着我们的消费习惯和生活方式。本报告旨在全面梳理和分析2024年电商市场的最新动态、行业趋势以及关键领域的发展状况,为电商从业者、投资者和消费者提供有价值的参考。阅读原文,获取专题报告合集全文,解锁文末245份电商相关行业研究报告。
【视频讲解】偏最小二乘结构方程模型PLS-SEM分析白茶产业数字化对共同富裕的影响
拓端tecdat
2024-05-29
阅读 18 分钟
1.4k
本文将通过视频讲解,展示如何用偏最小二乘结构方程模型PLS-SEM分析白茶产业数字化对共同富裕的影响,并结合Python用偏最小二乘回归Partial Least Squares,PLS分析桃子近红外光谱数据可视化实例和R语言结构方程模型SEM、路径分析房价和犯罪率数据、预测智力影响的代码数据,为读者提供一套完整的实践数据分析流程。
梯度提升机器LightGBM集成学习回归、分类、参数调优可视化实例|附数据代码
拓端tecdat
2024-05-29
阅读 7 分钟
3.1k
全文链接:[链接]原文出处:拓端数据部落公众号Light Gradient Boosted Machine(简称LightGBM)是一个开源库,它为梯度提升算法提供了高效且有效的实现。LightGBM通过添加一种自动特征选择的方式,并专注于提升具有较大梯度的样本,来扩展梯度提升算法。这可以显著加速训练过程并提高预测性能。Light Gradient Boosted ...
【专题】2024年5月医药行业报告合集汇总PDF分享(附原数据表)
拓端tecdat
2024-05-29
阅读 20 分钟
751
随着科技的飞速发展,智慧医疗正逐渐成为医疗行业的重要发展方向。特别是在全球化背景下,中国医疗器械企业正迎来前所未有的机遇与挑战。2024年,中国医疗行业的创新活力持续释放,不仅在国内市场取得了显著成就,更在全球化进程中展现出强大的竞争力。
【专题】2023年中国主要城市充电基础设施监测报告PDF合集分享(附原数据表)
拓端tecdat
2024-05-27
阅读 2 分钟
777
2022年,中国城市充电基础设施继续快速增长,总量从2021年的261.7万台增加到2022年的521万台,同比增幅超过99%。其中,私人充电桩的增加数量达到194.2万台,是公共充电桩增加数量的3倍,私人充电桩占比也从2021年的56.2%增加到2022年的65.5%。阅读原文,获取专题报告合集全文,解锁文末18份充电基础设施相关行业研究报告。
R语言GARCH族模型:正态分布、t、GED分布EGARCH、TGARCH的VaR分析股票指数|附代码数据
拓端tecdat
2024-05-27
阅读 10 分钟
899
如何构建合适的模型以恰当的方法对风险进行测量是当前金融研究领域的一个热门话题 ( 点击文末“阅读原文”获取完整代码数据******** )。
【专题】2023年中国跨境电商平台出海白皮书报告PDF合集分享(附原数据表)
拓端tecdat
2024-05-27
阅读 13 分钟
569
自九十年代以来,中国跨境电商已经经历了四个发展阶段,其中B2C跨境电商有望在2022年后迎来高峰。阅读原文,获取专题报告合集全文,解锁文末372份跨境电商出海相关行业研究报告。
【专题】2024年4月新能源汽车、智能汽车行业报告汇总PDF合集分享(附原数据表)
拓端tecdat
2024-05-27
阅读 18 分钟
606
随着科技的不断进步和全球化的深入发展,汽车行业正经历着前所未有的变革。从传统的燃油车到新能源汽车的崛起,从简单的交通工具到智能互联的移动空间,汽车已经不仅仅是代步工具,更是科技创新和社会进步的缩影。在这个变革的时代,了解汽车行业的市场动态、技术趋势以及产业链的发展变得尤为重要。阅读原文,获取专题...
【专题】2024餐饮行业及营销趋势报告合集PDF分享(附原数据表)
拓端tecdat
2024-05-27
阅读 4 分钟
691
首先,健康成为了消费者在选择餐饮时的首要考量。人们越来越注重食材的新鲜度和健康性,对菜品的口味也有了更高的要求。这意味着餐饮品牌需要关注食材的源头,确保食品的安全与营养,同时不断创新菜品,满足消费者对美味与健康的双重追求。阅读原文,获取专题报告合集全文,解锁文末91份餐饮相关行业研究报告。
数据分享|R语言逻辑回归、Naive Bayes贝叶斯、决策树、随机森林算法预测心脏病|附代码数据
拓端tecdat
2024-05-24
阅读 8 分钟
673
这个数据集可以追溯到1988年,由四个数据库组成。克利夫兰、匈牙利、瑞士和长滩。"目标 "字段是指病人是否有心脏病。它的数值为整数,0=无病,1=有病
【专题】2024抖音春日热点报告-餐饮篇报告合集PDF分享(附原数据表)
拓端tecdat
2024-05-24
阅读 3 分钟
707
2023年,中国经济表现稳健,零售消费稳定增长,尤其国内旅游市场迅速回暖,人们出行频率回升,酒店、餐饮和旅游服务的消费需求稳步攀升,为相关行业复苏提供了强大动力。据文化和旅游部数据显示,全年国内旅游总人次和收入均实现显著增长。同时,国家统计局报告指出,餐饮行业收入突破5万亿元,创下历史新高。多地旅游餐...
【专题】2023年中国跨境电商平台出海白皮书报告PDF合集分享(附原数据表)
拓端tecdat
2024-05-24
阅读 13 分钟
960
自九十年代以来,中国跨境电商已经经历了四个发展阶段,其中B2C跨境电商有望在2022年后迎来高峰。阅读原文,获取专题报告合集全文,解锁文末372份跨境电商出海相关行业研究报告。
R语言上市公司经营绩效实证研究 ——因子分析、聚类分析、正态性检验、信度检验|附代码数据
拓端tecdat
2024-05-24
阅读 4 分钟
655
随着我国经济的快速发展,上市公司的经营绩效成为了一个备受关注的话题。本文旨在探讨上市公司经营绩效的相关因素,并运用数据处理、图示、检验和分析等方法进行深入研究,帮助客户对我国45家上市公司的16项财务指标进行了因子分析与聚类分析。
【专题】2024体验赋能企业出海白皮书报告合集PDF分享(附原数据表)
拓端tecdat
2024-05-24
阅读 5 分钟
626
答案并非仅仅依赖于创新和成本控制。如今,以“体验+品牌”为核心的战略思维正成为关键,它强调通过优化客户体验和管理细节,驱动转化率和复购率的提升。这种向“体验管理”和“精细化运营”转型的品牌化之路,已成为出海企业突破重围的必由之路。阅读原文,获取专题报告合集全文,解锁文末136份出海相关行业研究报告。
【专题】2024年4月新能源汽车、智能汽车行业报告汇总PDF合集分享(附原数据表)
拓端tecdat
2024-05-23
阅读 18 分钟
1k
随着科技的不断进步和全球化的深入发展,汽车行业正经历着前所未有的变革。从传统的燃油车到新能源汽车的崛起,从简单的交通工具到智能互联的移动空间,汽车已经不仅仅是代步工具,更是科技创新和社会进步的缩影。在这个变革的时代,了解汽车行业的市场动态、技术趋势以及产业链的发展变得尤为重要。阅读原文,获取专题...
【专题】2023年数字化转型指数报告:公众数字化转型认知报告PDF合集分享(附原数据表)
拓端tecdat
2024-05-23
阅读 4 分钟
485
在企业的数字化转型过程中,员工对数字化工具的充分运用能够持续推动企业生产力的提升。这些数字化工具并不仅仅是局限于某一方面的软件或者工具,而是涉及整个业务链的数字化生态系统,不同的业务场景需要不同的工具、系统或平台来支持。阅读原文,获取专题报告合集全文,解锁文末99份数字化转型相关行业研究报告。
R语言航班延误影响预测分析:lasso、决策树、朴素贝叶斯、QDA、LDA、缺失值处理、k折交叉验证
拓端tecdat
2024-05-23
阅读 8 分钟
666
航班延误是航空公司、旅客和机场管理方面都面临的一个重要问题。航班延误不仅会给旅客带来不便,还会对航空公司和机场的运营产生负面影响。因此,对航班延误的影响因素进行预测分析,对于航空公司、旅客和机场管理方面都具有重要意义。
【专题】2024电动汽车充电市场展望报告合集PDF分享(附原数据表)
拓端tecdat
2024-05-23
阅读 11 分钟
808
报告合集阐述,随着欧洲与中国在轻型和中重型车辆电动化监管政策上的逐步清晰化,预计到2035年,欧洲地区小于6吨的轻型电动车在新车市场中的份额将飙升至96%,而中国则有望达到78%。同时,对于中重型电动车领域,欧洲和中国的新车渗透率将分别攀升至62%和41%。阅读原文,获取专题报告合集全文,解锁文末272份汽车相关行...
R语言组lasso改进逻辑回归变量选择分析高血压、易感因素、2型糖尿病和LDL可视化
拓端tecdat
2024-05-23
阅读 6 分钟
1.1k
本文用逻辑回归和lasso算法医学上的疾病的相关因素,帮助客户确定哪种模型可用于某种疾病的相关因素分析。3个模型:Logistic模型、成组Lasso Logistic模型、由组Lasso选出协变量的Logistic模型,有3个易感因素、高血压、2型糖尿病和LDL,得出误差率和变量数目的图。
R语言电影数据分析:随机森林探索电影受欢迎程度因素、参数调优可视化
拓端tecdat
2024-05-22
阅读 5 分钟
467
是什么让一个电影受欢迎? 也许是影片的总收入(影院条目和DVD sellings)。我们选择的变量将是票房(gross) 或观众评分(movie_facebook_likes)。众所周知,关于IMDB和番茄的好评与高收益的电影有关。我们的分析旨在回答以下研究问题:“我们能在仅知道它的类型,流派(流派变量),MPAA评级(MPAA_RATING变量),发布...
R语言聚类、文本挖掘分析虚假电商评论数据:K-Means(K-均值)、层次聚类、词云可视化|附代码数据
拓端tecdat
2024-05-22
阅读 5 分钟
539
聚类分析是一种常见的数据挖掘方法,已经广泛地应用在模式识别、图像处理分析、地理研究以及市场需求分析。本文主要研究聚类分析算法K-means在电商评论数据中的应用,挖掘出虚假的评论数据。
【专题】2022年智慧城市白皮书报告PDF合集分享(附原数据表)
拓端tecdat
2024-05-22
阅读 2 分钟
380
其目的在于为建设新型智慧城市提供参考,这种城市应该应用先进技术、产生良好社会效益、并且友好生态环境。目前,新一代信息技术如5G、物联网和工业互联网的广泛应用,正在引领智慧城市综合解决方案向更深入实际、更协同布局、更注重社会与生态共赢的方向发展。因此,智慧城市建设也将迈入一个全新的阶段。
【专题】2024智慧医疗行业研究报告合集PDF分享(附原数据表)
拓端tecdat
2024-05-22
阅读 6 分钟
1k
医疗信息化正在以医疗服务需求不断升级的大背景下,融合大数据和人工智能等创新技术,不断扩展其范围和定义。从单一的院内信息化,逐步发展到区域间、不同机构间的数据互联互通与共享应用,涵盖的范围不再仅限于患者的病历信息,还延伸到居民的全生命周期健康数据,以及与健康息息相关的环境等信息,构建更加完善、智能...
DeepMTS深度学习神经网络多元时间序列预测宏观经济数据可视化|附数据代码
拓端tecdat
2024-05-22
阅读 3 分钟
619
在数据科学领域,时间序列分析一直是一个至关重要的研究方向,尤其在金融、气象、医学以及许多其他科学和工业领域中,准确的时间序列预测对于制定策略、政策规划以及资源管理都具有极其重要的意义。随着技术的不断进步,传统的时间序列分析方法已经难以满足复杂多变的数据需求。因此,探索更为先进和高效的时间序列预测...
上一页
1
…
More
13
14
15
(current)
16
17
…
More
下一页
上一页
15
(current)
下一页