找到约 3938 条结果
  • 拓端tecdat|R语言贝叶斯Poisson泊松-正态分布模型分析职业足球比赛进球数
    首先,我们认为职业足球比赛的进球数来自分布,其中θ是平均进球数。现在假设我们用一位足球专家的意见来得出足球比赛的平均进球数,即参数θ,我们得到:。
    2021-07-20
  • 拓端tecdat|R语言用Rshiny探索lme4广义线性混合模型(GLMM)和线性混合模型(LMM)
    随着软件包的进步,使用广义线性混合模型(GLMM)和线性混合模型(LMM)变得越来越容易。由于我们发现自己在工作中越来越多地使用这些模型,我们开发了一套R shiny工具来简化和加速与对象交互的lme4常见任务。 
    2022-07-06
  • COMP1111 设计
    COMP1111 Programming (Gold) 20-21Summative AssessmentProgramming Assignment 2: Server-Side ProgrammingOutline• Handout Date: 22 February 2021• Hand-in (Submission of code and video): by 14:00 23 April 2021• Return by 21 May 2021• Expected workload: 20 days, 3-4 hrs/day = 60 hrs• Total Marks: 100•...
    2022-02-23
  • Pandas字符串操作的各种方法速度测试
    由于LLM的发展, 很多的数据集都是以DF的形式发布的,所以通过Pandas操作字符串的要求变得越来越高了,所以本文将对字符串操作方法进行基准测试,看看它们是如何影响pandas的性能的。因为一旦Pandas在处理数据时超过一定限制,它们的行为就会很奇怪。
    2023-08-23
  • 数据挖掘终篇!一文学习模型融合!从加权融合到stacking, boosting
    模型融合:通过融合多个不同的模型,可能提升机器学习的性能。这一方法在各种机器学习比赛中广泛应用, 也是在比赛的攻坚时刻冲刺Top的关键。而融合模型往往又可以从模型结果,模型自身,样本集等不同的角度进行融合。
    2024-03-25
  • step by step带你fastText文本分类
    今天的教程是基于FAIR的Bag of Tricks for Efficient Text Classification[1]。也就是我们常说的fastText。
    2020-03-26
  • 大数据与云计算学习:数据分析(一)
    python基础 先看看 基础 注意点 切割操作 这里发现我们在取出list中的元素时候是左开右闭的,即[3,6) 索引6对应的元素7并没有被输出 改变list中的元素 添加删除元素 两种拷贝list的方式 list2拷贝给y,y改变,list2也变 list2拷贝给y,y改变,list2不变 删除实例的属性和删除字典属性的区别 {代码...} with as [链接] if...
    2017-10-15
  • sklearn中的数据预处理和特征工程
    小伙伴们大家好~o( ̄▽ ̄)ブ,我是菜菜,我的开发环境是Jupyter lab,所用的库和版本大家参考: Python 3.7.1(你的版本至少要3.4以上 Scikit-learn 0.20.0 (你的版本至少要0.19 Numpy 1.15.3, Pandas 0.23.4, Matplotlib 3.0.1, SciPy 1.1.0 1 sklearn中的数据预处理和特征工程 sklearn中包含众多数据预处理和特征工程...
    2019-04-18
  • 机器学习之逻辑回归
    $ \boldsymbol{x}_i = \left[ \begin{matrix} x_{i0} & x_{i1} & \cdots & x_{in} \end{matrix} \right]^{\text{T}} $ 表示第i个样本的特征值,显然我们有n个特征,$x_{i0}$ 表示截距$y_i$ 表示第i个样本的标签$m$ 是样本数量 $\boldsymbol{\theta} = \left[ \begin{matrix} \theta_0 & \theta_1 & ...
    2016-11-28
  • TensorRT 开始
    TensorRT 是 NVIDIA 自家的高性能推理库,其 Getting Started 列出了各资料入口,如下:本文基于当前的 TensorRT 8.2 版本,将一步步介绍从安装,直到加速推理自己的 ONNX 模型。安装进 TensorRT 下载页 选择版本下载,需注册登录。本文选择了 TensorRT-8.2.2.1.Linux.x86_64-gnu.cuda-11.4.cudnn8.2.tar.gz,可以注意到...
    2022-01-12
  • 精简模型,提升效能:线性回归中的特征选择技巧
    在本文中,我们将探讨各种特征选择方法和技术,用以在保持模型评分可接受的情况下减少特征数量。通过减少噪声和冗余信息,模型可以更快地处理,并减少复杂性。
    2024-07-26
  • 拓端数据|自然语言处理真实项目实战
    本文根据实际项目撰写,由于项目保密要求,源代码将进行一定程度的删减。本文撰写的目的是进行公司培训,请勿以任何形式进行转载。由于是日语项目,用到的分词软件等,在中文任务中需要替换为相应的中文分词软件。例如结巴分词 : [链接]
    2018-07-11
  • 基于 lumen 的微服务架构实践
    官网的介绍很简洁,而且 lumen 确实也很简单,我在调研了 lumen 相关组件(比如缓存,队列,校验,路由,中间件和最重要的容器)之后认为已经能够满足我目前这个微服务的需求了。
    2019-01-09
    3
  • Tensorflow Python API 翻译(constant_op)
    作者:chen_h微信号 & QQ:862251340微信公众号:coderpai简书地址:[链接] 计划现将 tensorflow 中的 Python API 做一个学习,这样方便以后的学习。原文链接 该章介绍有关常量张量,序列操作,随机数张量的API 常量张量 Tensorflow提供了很多的操作,去帮助你构建常量。 tf.zeros(shape, dtype = tf.float32, name ...
    2018-01-12
  • 推荐系统入门笔记九: 基于内容的推荐算法
    一. 简介基于内容的推荐方法是以物品的内容描述信息为依据来做出的推荐,本质上是基于对物品和用户自身的特征或属性的直接分析和计算。例如,假设已知电影A是一部喜剧,而恰巧我们得知某个用户喜欢看喜剧电影,那么我们基于这样的已知信息,就可以将电影A推荐给该用户。二. 基于内容推荐的实现步骤画像构建(画像就是刻画...
    2021-11-16
  • MAE 自监督算法介绍和基于 EasyCV 的复现
    自监督学习(Self-Supervised Learning)能利用大量无标注的数据进行表征学习,然后在特定下游任务上对参数进行微调。通过这样的方式,能够在较少有标注数据上取得优于有监督学习方法的精度。近年来,自监督学习受到了越来越多的关注,如Yann Lecun也在 AAAI 上讲 Self-Supervised Learning 是未来的大势所趋。在CV领域...
    2022-05-23
  • 使用手工特征提升模型性能
    通过对原始数据进行手工的特征工程,我们可以将模型的准确性和性能提升到新的水平,为更精确的预测和更明智的业务决策铺平道路, 可以以前所未有的方式优化模型并提升业务能力。
    2023-03-01