InfluxDB 开源分布式时序、事件和指标数据库
InfluxDB 是一个开源分布式时序、事件和指标数据库。使用 Go 语言编写,无需外部依赖。其设计目标是实现分布式和水平伸缩扩展。 特点 schemaless(无结构),可以是任意数量的列 Scalable min, max, sum, count, mean, median 一系列函数,方便统计 Native HTTP API, 内置http支持,使用http读写 Powerful Query Language ...
Apache Bench做压力测试
Apache Bench是一个简单易用的压力测试工具,在这里我不想多讲。今天主要说的是写一个py脚本来自动化测试过程,以及中间遇到的一些奇葩问题。
2015-01-02
100天搞定机器学习|day44 k均值聚类数学推导与python实现
1、k均值聚类模型给定样本,每个样本都是m为特征向量,模型目标是将n个样本分到k个不停的类或簇中,每个样本到其所属类的中心的距离最小,每个样本只能属于一个类。用C表示划分,他是一个多对一的函数,k均值聚类就是一个从样本到类的函数。2、k均值聚类策略k均值聚类的策略是通过损失函数最小化选取最优的划分或函数。...
2019-08-25
基于自适应margin的行人重识别的深度排序模型
假设$X=\{X_n\}_{n=1}^N$是训练样本,其中$X_n=\{X_A^n,X_B^n\}$表示第$n$个行人的训练样本,$X_n$包含了行人摄像头$A$和$B$下的图片的数据,进一步,$X_A^n=\{x_A^{n,i}\}_{i=1}^{A_n},X_B^n=\{x_B^{n,j}\}_{j=1}^{B_n}$,其中的$x_A^{n,i}$和$x_B^{n,j}$分别是第$i$个行人在$A$和$B$两个摄像头下的第$i$和第$j$张图片...
2020-05-04
R语言随机波动率(SV)模型、MCMC的Metropolis-Hastings算法金融应用:预测标准普尔SP500指数
原文链接:http://tecdat.cn/?p=23991在这个例子中,我们考虑随机波动率模型 SV0 的应用,例如在金融领域。统计模型随机波动率模型定义如下并为其中 yt 是因变量,xt 是 yt 的未观察到的对数波动率。N(m,σ2) 表示均值 m 和方差 σ2 的正态分布。αα、β 和 σ 是需要估计的未知参数。BUGS语言统计模型文件内容 'sv.bug': {...
2021-10-15
CephFS 如何恢复损毁的Metadata Pool
1) 模拟数据损毁 {代码...} 2) 创建 recovery fs 从 data pool 中恢复一个可用的备份文件系统。 {代码...} 3) 尝试恢复文件系统,成功者则流程结束,不成功继续第4)步 {代码...} 4) 利用 recovery fs 恢复原来已经被损毁的 metadata pool {代码...} 删除 recovery fs 和 metadata pool {代码...} 更多技术分享浏览我的博...
2022-11-13
宝典相授,无错在手 |昇思MindSpore报错调试宝典(六):网络构建与训练类报错之资源不足
上一期讲解了网络构建与训练类报错之算子执行错误该如何定位解决,相信如输入异常、算子实现错误之类算子执行问题已经难不倒大家了。那么本期我们看看网络构建与训练类报错常见的最后一个问题分类,即资源不足方面的报错,如遇到资源不足方面的报错,如 Out Of Memory、memory isn’t enough 等等资源问题应该如何分析呢...
2023-06-12
手把手教你入门和实践特征工程 的全方位万字笔记,附代码下载
🙊 说起特征工程,都说是机器学习建模中最为重要而且费时的一项工作,而且它涉及的知识点会非常地多,经验老道的老司机自然是轻车熟路了,但对于刚刚入门的新手司机,学习到的知识点都是东一点西一点的,不够系统化,本篇文章是在阅读了一本评分极高的特征工程书籍 📚 《特征工程入门与实践》后的一篇笔记文,记录下相对比...
PHP 7 新特征
最好的语言发布了新的版本,一个划时代的大版本:PHP7。 PHP7修复了大量BUG,新增了功能和语法糖。这些改动涉及到了核心包、GD库、PDO、ZIP、ZLIB等熟悉和不熟悉的核心功能与扩展包。 PHP7移除了已经被废弃的函数,如mysql_系列函数在PHP5.5被废弃,在PHP7被删除。 PHP7的性能高于HHVM。并且是PHP5.6的两倍。 {代码...} ...
带你看懂pandas中的两种数据结构
Pandas是基于Numpy的一种工具,这个工具是为了解决数据分析任务而创建的,pandas纳入了大量的库和一些标准的数据模型,提供了高效的操作大型数据集所需的工具,pandas提供了大量能使我们快速便捷的处理数据的函数和方法。Pandas是使Python成为强大而高效的数据分析环境的重要因素之一。另外
实例复习机器学习数学 - 2. 几种典型离散随机变量分布
上一节我们讨论的都是随机事件,某一个随机事件可能包含若干个随机试验样本空间中的随机结果,如果对于每一个可能的实验结果都关联一个特定的值,这样就形成了一个随机变量。
2021-07-14
R语言中实现马尔可夫链蒙特卡罗MCMC模型
这只是众多算法之一。这个术语代表“马尔可夫链蒙特卡洛”,因为它是一种使用“马尔可夫链”(我们将在后面讨论)的“蒙特卡罗”(即随机)方法。MCMC只是蒙特卡洛方法的一种,尽管可以将许多其他常用方法看作是MCMC的简单特例。
2021-12-14
云上玩转DeepSeek系列之五:实测优化16%, 体验FlashMLA加速DeepSeek-V2-Lite推理
2月25日,DeepSeek-AI 面向社区开源了其技术成果 FlashMLA([链接]),这是一个面向推理优化的高效多层注意力(Multi-Head Latent Attention)解码内核。该技术通过优化多头潜在注意力机制和分页 KV 缓存系统,显著提升了大语言模型的长序列处理能力与推理效率。
2025-02-26
小白学 Python 数据分析(10):Pandas (九)数据运算
人生苦短,我用 Python 前文传送门: 小白学 Python 数据分析(1):数据分析基础 小白学 Python 数据分析(2):Pandas (一)概述 小白学 Python 数据分析(3):Pandas (二)数据结构 Series 小白学 Python 数据分析(4):Pandas (三)数据结构 DataFrame 小白学 Python 数据分析(5):Pandas (四)基础操作(1...
2020-03-03
R语言中实现马尔可夫链蒙特卡罗MCMC模型
这只是众多算法之一。这个术语代表“马尔可夫链蒙特卡洛”,因为它是一种使用“马尔可夫链”(我们将在后面讨论)的“蒙特卡罗”(即随机)方法。MCMC只是蒙特卡洛方法的一种,尽管可以将许多其他常用方法看作是MCMC的简单特例。
2022-07-01
Python中的时间序列数据操作总结
Pandas是Python中一个强大且流行的数据操作库,特别适合处理时间序列数据。它提供了一系列工具和函数可以轻松加载、操作和分析时间序列数据。
2023-01-04
机器学习中空间和时间自相关的分析:从理论基础到实践应用
空间和时间自相关是数据分析中的两个基本概念,它们揭示了现象在空间和时间维度上的相互依赖关系。这些概念在各个领域都有广泛应用,从环境科学到城市规划,从流行病学到经济学。本文将探讨这些概念的理论基础,并通过一个实际的野火风险预测案例来展示它们的应用。
2024-10-20