MLX vs MPS vs CUDA:苹果新机器学习框架的基准测试

2023-12-21
阅读 4 分钟
759
如果你是一个Mac用户和一个深度学习爱好者,你可能希望在某些时候Mac可以处理一些重型模型。苹果刚刚发布了MLX,一个在苹果芯片上高效运行机器学习模型的框架。

高维向量压缩方法IVFPQ :通过创建索引加速矢量搜索

2023-12-20
阅读 4 分钟
487
向量相似性搜索是从特定嵌入空间中的给定向量列表中找到相似的向量。它能有效地从大型数据集中检索相关信息,在各个领域和应用中发挥着至关重要的作用。

从头开始实现LoRA以及一些实用技巧

2023-12-19
阅读 14 分钟
1.4k
LoRA是Low-Rank Adaptation或Low-Rank Adaptors的缩写,它提供了一种用于对预先存在的语言模型进行微调的高效且轻量级的方法。

2023年12月 论文推荐

2023-12-18
阅读 2 分钟
441
该研究介绍了Mamba,一种硬件感知并行算法,克服了Transformers 在语言处理任务中长序列的低效率。通过实现选择性状态空间,Mamba实现了快速推理、线性可伸缩性以及与大型transformer模型相比具有竞争力的性能。

使用LM Studio在本地运行LLM完整教程

2023-12-17
阅读 3 分钟
3.3k
GPT-4被普遍认为是最好的生成式AI聊天机器人,但开源模型一直在变得越来越好,并且通过微调在某些特定领域是可以超过GPT4的。在开源类别中出于以下的原因,你可能会考虑过在本地计算机上本地运行LLM :

使用subplot_mosaic创建复杂的子图布局

2023-12-16
阅读 2 分钟
10.5k
在本文中,我将介绍matplotlib一个非常有价值的用于管理子图的函数——subplot_mosaic()。如果你想处理多个图的,那么subplot_mosaic()将成为最佳解决方案。我们将用四个不同的图实现不同的布局。

一种用于心音分类的轻量级1D-CNN+DWT网络

2023-12-15
阅读 2 分钟
468
这是由National Institute of Technology Rourkela, Central University of Rajasthan发布在2022 ICETCI的论文,利用离散小波变换(DWT)得到的多分辨率域特征对1D-CNN模型进行心音分类训练。

使用GAN进行异常检测

2023-12-14
阅读 7 分钟
573
自从基于Stable Diffusion的生成模型大火以后,基于GAN的研究越来越少了,但是这并不能说明他就没有用了。异常检测是多个研究领域面临的重要问题,包括金融、医疗保健和网络安全。检测和正确分类未见的异常是一个具有挑战性的问题,多年来已经以许多不同的方式解决了这个问题。而今天我们要介绍一种基于GAN的异常检测方...

AutoGen多代理对话项目示例和工作流程分析

2023-12-13
阅读 16 分钟
597
在这篇文章中,我将介绍AutoGen的多个代理的运行。这些代理将能够相互对话,协作评估股票价格,并使用AmCharts生成图表。我们创建对话的目的是要求代理分析特定公司的股票价格,并制作股票价格图表。为了实现这一目标,我们创建一下代理并协同工作:金融分析师:分析师的任务是获取股票价格数据,进行分析,然后将数据传...

CLIP的升级版Alpha-CLIP:区域感知创新与精细控制

2023-12-12
阅读 1 分钟
576
为了增强CLIP在图像理解和编辑方面的能力,上海交通大学、复旦大学、香港中文大学、上海人工智能实验室、澳门大学以及MThreads Inc.等知名机构共同合作推出了Alpha-CLIP。这一创新性的突破旨在克服CLIP的局限性,通过赋予其识别特定区域(由点、笔画或掩码定义)的能力。Alpha-CLIP不仅保留了CLIP的视觉识别能力,而且实...

使用PyTorch II的新特性加快LLM推理速度

2023-12-11
阅读 2 分钟
434
Pytorch团队提出了一种纯粹通过PyTorch新特性在的自下而上的优化LLM方法,包括:Torch.compile: PyTorch模型的编译器GPU量化:通过降低精度操作来加速模型推测解码:使用一个小的“草稿”模型来加速llm来预测一个大的“目标”模型的输出张量并行:通过在多个设备上运行模型来加速模型。我们来看看这些方法的性能比较:作为对比,...

System 2 Attention:可以提高不同LLM问题的推理能力

2023-12-10
阅读 3 分钟
432
推理正在成为大型语言模型(llm)关注的下一个主要领域。尽管llm拥有先进的能力,但大多数llm经常被简单的错误绊倒,显示出他们在推理方面的局限性。这些模型可能会被上下文中的不相关细节所误导,或者受到输入提示中的偏差的影响。而后一种倾向被称为谄媚,也就是说模型会更偏向与输入一致,而不管准确性如何。人们已经做...

Matplotlib中的titles(标题)、labels(标签)和legends(图例)

2023-12-09
阅读 4 分钟
5.1k
Matplotlib是一个Python中常用的绘图库,用于创建各种类型的图表。在Matplotlib中,你可以使用titles(标题)、labels(标签)和legends(图例)来增强你的图表。本文讨论Python的Matplotlib绘图库中可用的不同标记选项。

RAG应用程序的12种调优策略:使用“超参数”和策略优化来提高检索性能

2023-12-08
阅读 5 分钟
703
本文从数据科学家的角度来研究检索增强生成(retrieve - augmented Generation, RAG)管道。讨论潜在的“超参数”,这些参数都可以通过实验来提高RAG管道的性能。与本文还将介绍可以应用的不同策略,这些策略虽然不是超参数,但对性能也会产生很大的影响。

2023年5个自动化EDA库推荐

2023-12-07
阅读 8 分钟
492
EDA或探索性数据分析是一项耗时的工作,但是由于EDA是不可避免的,所以Python出现了很多自动化库来减少执行分析所需的时间。EDA的主要目标不是制作花哨的图形或创建彩色的图形,而是获得对数据集的理解,并获得对变量之间的分布和相关性的初步见解。我们在以前也介绍过EDA自动化的库,但是现在已经过了1年的时间了,我们...

使用Python代码识别股票价格图表模式

2023-12-06
阅读 11 分钟
643
collections.defaultdict:当缺少键时,返回默认值。使用它可以有效地存储和组织数据,比如键反映日期或资产符号等可识别的度量,值表示相应的变量。

使用Huggingface创建大语言模型RLHF训练流程的完整教程

2023-12-05
阅读 7 分钟
1.8k
但是大语言模型像所有机器/深度学习模型一样,从数据中学习。因此也会有garbage in garbage out的规则。也就是说如果我们在低质量的数据上训练模型,那么在推理时输出的质量也会同样低。

11月推荐阅读的12篇大语言模型相关论文

2023-12-04
阅读 2 分钟
678
一种称为S2A的新注意力方法被开发出来,解决llm中不相关或有偏见的输出问题。受人类认知过程的启发,S2A过滤掉不相关的上下文,促进LLM推理的真实性和客观性。

4个解决特定的任务的Pandas高效代码

2023-12-03
阅读 3 分钟
10.1k
在本文中,我将分享4个在一行代码中完成的Pandas操作。这些操作可以有效地解决特定的任务,并以一种好的方式给出结果。从列表中创建字典我有一份商品清单,我想看看它们的分布情况。更具体地说:希望得到唯一值以及它们在列表中出现的次数。Python字典是以这种格式存储数据的好方法。键将是字典,值是出现的次数。这里可...

高斯混合模型:GMM和期望最大化算法的理论和代码实现

2023-12-02
阅读 12 分钟
2.2k
在本文中,将首先探讨混合模型,重点是高斯混合模型及其基本原理。然后将研究如何使用一种称为期望最大化(EM)的强大技术来估计这些模型的参数,并提供在Python中从头开始实现它。最后将演示如何使用Scikit-Learn库使用GMM执行聚类。

简化版Transformer :Simplifying Transformer Block论文详解

2023-12-01
阅读 8 分钟
506
在这篇文章中我将深入探讨来自苏黎世联邦理工学院计算机科学系的Bobby He和Thomas Hofmann在他们的论文“Simplifying Transformer Blocks”中介绍的Transformer技术的进化步骤。这是自Transformer 开始以来,我看到的最好的改进。

Pandas中选择和过滤数据的终极指南

2023-11-30
阅读 6 分钟
1.8k
本文将介绍使用pandas进行数据选择和过滤的基本技术和函数。无论是需要提取特定的行或列,还是需要应用条件过滤,pandas都可以满足需求。

使用Accelerate库在多GPU上进行LLM推理

2023-11-29
阅读 8 分钟
825
大型语言模型(llm)已经彻底改变了自然语言处理领域。随着这些模型在规模和复杂性上的增长,推理的计算需求也显著增加。为了应对这一挑战利用多个gpu变得至关重要。

三种常用的风险价值(VaR)计算方法总结

2023-11-28
阅读 5 分钟
3.3k
风险价值(VaR)是金融领域广泛使用的风险度量,它量化了在特定时间范围内和给定置信度水平下投资或投资组合的潜在损失。它提供了一个单一的数字,代表投资者在正常市场条件下可能经历的最大损失。VaR是风险管理、投资组合优化和法规遵从的重要工具。

PubMedBERT:生物医学自然语言处理领域的特定预训练模型

2023-11-27
阅读 2 分钟
504
今年大语言模型的快速发展导致像BERT这样的模型都可以称作“小”模型了。Kaggle LLM比赛LLM Science Exam 的第四名就只用了deberta,这可以说是一个非常好的成绩了。所以说在特定的领域或者需求中,大语言模型并不一定就是最优的解决方案,“小”模型也有一定的用武之地,所以今天我们来介绍PubMedBERT,它使用特定领域语料...

使用skforecast进行时间序列预测

2023-11-26
阅读 5 分钟
400
时间序列预测是数据科学和商业分析中基于历史数据预测未来价值的一项重要技术。它有着广泛的应用,从需求规划、销售预测到计量经济分析。由于Python的多功能性和专业库的可用性,它已经成为一种流行的预测编程语言。其中一个为时间序列预测任务量身定制的库是skforecast。

LLMLingua:集成LlamaIndex,对提示进行压缩,提供大语言模型的高效推理

2023-11-25
阅读 6 分钟
660
大型语言模型(llm)的出现刺激了多个领域的创新。但是在思维链(CoT)提示和情境学习(ICL)等策略的驱动下,提示的复杂性不断增加,这给计算带来了挑战。这些冗长的提示需要大量的资源来进行推理,因此需要高效的解决方案,本文将介绍LLMLingua与专有的LlamaIndex的进行集成执行高效推理。

6个常用的聚类评价指标

2023-11-24
阅读 14 分钟
1.7k
评估聚类结果的有效性,即聚类评估或验证,对于聚类应用程序的成功至关重要。它可以确保聚类算法在数据中识别出有意义的聚类,还可以用来确定哪种聚类算法最适合特定的数据集和任务,并调优这些算法的超参数(例如k-means中的聚类数量,或DBSCAN中的密度参数)。

斯坦福大学引入FlashFFTConv来优化机器学习中长序列的FFT卷积

2023-11-23
阅读 2 分钟
308
斯坦福大学的FlashFFTConv优化了扩展序列的快速傅里叶变换(FFT)卷积。该方法引入Monarch分解,在FLOP和I/O成本之间取得平衡,提高模型质量和效率。并且优于PyTorch和FlashAttention-v2。它可以处理更长的序列,并在人工智能应用程序中打开新的可能性。

使用ExLlamaV2量化并运行EXL2模型

2023-11-22
阅读 3 分钟
492
量化大型语言模型(llm)是减少这些模型大小和加快推理速度的最流行的方法。在这些技术中,GPTQ在gpu上提供了惊人的性能。与非量化模型相比,该方法使用的VRAM几乎减少了3倍,同时提供了相似的精度水平和更快的生成速度。