Python 二分查找与 bisect 模块
Python 的列表(list)内部实现是一个数组,也就是一个线性表。在列表中查找元素可以使用 list.index() 方法,其时间复杂度为O(n)。对于大数据量,则可以用二分查找进行优化。二分查找要求对象必须有序,其基本原理如下:
2019-01-28
如何使用 Python 统计分析 access 日志?
一、前言性能场景中的业务模型建立是性能测试工作中非常重要的一部分。而在我们真实的项目中,业务模型跟线上的业务模型不一样的情况实在是太多了。原因可能多种多样,这些原因大大降低了性能测试的价值。
2021-05-21
8 个常用pandas的 index设置,你知道吗?
默认情况下,分组会将分组列编程index索引。但是很多情况下,我们不希望分组列变成索引,因为可能有些计算或者判断逻辑还是需要用到该列的。因此,我们需要设置一下让分组列不成为索引,同时也能完成分组的功能。
2021-12-20
使用‘消除’技术绕过LLM的安全机制,不用训练就可以创建自己的nsfw模型
开源的大模型在理解和遵循指令方面都表现十分出色。但是这些模型都有审查的机制,在获得被认为是有害的输入的时候会拒绝执行指令,例如会返回“As an AI assistant, I cannot help you.”。这个安全功能对于防止误用至关重要,但它限制了模型的灵活性和响应能力。
2024-06-14
特征工程与数据预处理全解析:基础技术和代码示例
在机器学习和数据科学的世界里,数据的质量是建模成功与否的关键所在。这就是特征工程和数据预处理发挥作用的地方。本文总结的这些关键步骤可以显著提高模型的性能,获得更准确的预测,我们将深入研究处理异常值、缺失值、编码、特征缩放和特征提取的各种技术。
2024-06-24
拓端tecdat|R语言: GARCH模型股票交易量的研究道琼斯股票市场指数
原文链接:[链接]我将建立道琼斯工业平均指数(DJIA)日交易量对数比的ARMA-GARCH模型。 获取数据load(file='DowEnvironment.RData')日交易量 每日交易量内发生的 变化。 plot(dj_vol) 首先,我们验证具有常数均值的线性回归在统计上是显着的。 在休息时间= 6时达到最小BIC。以下是道琼斯日均交易量与水平变化(红线...
2020-03-21
时间序列异常检测:统计和机器学习方法介绍
时间序列数据是按一定时间间隔记录的一系列观测结果。它经常在金融、天气预报、股票市场分析等各个领域遇到。分析时间序列数据可以提供有价值的见解,并有助于做出明智的决策。
2023-06-16
刘畊宏男孩女孩看过来!运动数据分析挖掘!⛵
因为疫情,2年多的时间里,大家多了很多居家的经历,但是运动健康并不能因为居家而停止,健身随时随处可以进行!健身环大冒险等大热,而前阵子的刘畊宏跳操,带火了一大票畊宏男孩女孩,可穿戴设备市场大涨,而这些设备也记录了大量的运动数据。
2016/08/26 Scott Meyers – The Most Important Design Guideline
API 是 library 的 interface,就像 GUI 是软件的界面一样。设计合理的 API 对于 library 的用户来说非常重要。请 library 的开发者都认真看一下这个视频吧。
2016-08-26
influxdb语法
第一部分称为key,key中包含了measurement name(类似表)和tags(tags又分为tag key和tag value,tags可以有多个)
机器学习之神经网络及python实现
神经网络在机器学习中有很大的应用,甚至涉及到方方面面。本文主要是简单介绍一下神经网络的基本理论概念和推算。同时也会介绍一下神经网络在数据分类方面的应用。
性能测试概念
简介性能测试是软件测试的一种类型,旨在评估系统、应用程序或服务在特定负载条件下的性能表现。它涉及模拟真实世界中的用户行为、请求和负载,以便测量系统在不同条件下的响应时间、吞吐量、并发用户数和资源利用率等性能指标。性能测试相关概念并发:并发是指虚拟并发用户数,从业务角度,也可以理解为同时在线的用户...
2024-07-22
对抗训练介绍——尝试欺骗一个模型
当我们要实际部署一个机器学习系统的时候,一件非常重要的事情就是系统的鲁棒性,我们希望系统不仅能够对大多数的例子有效,而且要真正的可靠,例如能够识别出别人的攻击(欺骗你的分类模型)。因此近几年对抗鲁棒性(Adversarial Robustness)这个话题引发了广泛的关注。要先改进模型,我们必须知道模型的问题在哪,今...
2020-06-02
【KG】TransE 及其实现
TransE (Translating Embedding), an <u>energy-based</u> model for learning low-dimensional embeddings of entities.
2023-01-07
biaoti
======================================================================== attachmentList:[
2019-03-01
机器学习笔记之性能评估指标
机器学习在不同的业务需求下,需要使用不同的评估指标对算法效果进行评估,这篇文章将对常见的评估指标进行总结。 Todo list: [ ] 分类任务 [x] Accuracy [ ] Precision [ ] Recall [ ] F1 Score [ ] Roc curve [ ] PR curve [ ] AUC [ ] 回归任务 [ ] MAE [ ] MSE <div class="note info"><p>由于翻译问题...
2018-04-25
InfluxDB 开源分布式时序、事件和指标数据库
InfluxDB 是一个开源分布式时序、事件和指标数据库。使用 Go 语言编写,无需外部依赖。其设计目标是实现分布式和水平伸缩扩展。 特点 schemaless(无结构),可以是任意数量的列 Scalable min, max, sum, count, mean, median 一系列函数,方便统计 Native HTTP API, 内置http支持,使用http读写 Powerful Query Language ...