Nougat:一种用于科学文档OCR的Transformer 模型

2023-09-08
阅读 2 分钟
656
随着人工智能领域的不断进步,其子领域,包括自然语言处理,自然语言生成,计算机视觉等,由于其广泛的用例而迅速获得了大量的普及。光学字符识别(OCR)是计算机视觉中一个成熟且被广泛研究的领域。它有许多用途,如文档数字化、手写识别和场景文本识别。数学表达式的识别是OCR在学术研究中受到广泛关注的一个领域。

CMT:卷积与Transformers的高效结合

2023-09-07
阅读 4 分钟
757
论文提出了一种基于卷积和VIT的混合网络,利用Transformers捕获远程依赖关系,利用cnn提取局部信息。构建了一系列模型cmt,它在准确性和效率方面有更好的权衡。

使用GPT-4生成训练数据微调GPT-3.5 RAG管道

2023-09-06
阅读 7 分钟
1.1k
OpenAI在2023年8月22日宣布,现在可以对GPT-3.5 Turbo进行微调了。也就是说,我们可以自定义自己的模型了。然后LlamaIndex就发布了0.8.7版本,集成了微调OpenAI gpt-3.5 turbo的功能

Pandas DataFrame 数据存储格式比较

2023-09-05
阅读 3 分钟
1.2k
Pandas 支持多种存储格式,在本文中将对不同类型存储格式下的Pandas Dataframe的读取速度、写入速度和大小的进行测试对比。创建测试Dataframe首先创建一个包含不同类型数据的测试Pandas Dataframe。 {代码...} 以不同的格式存储接下来创建测试函数,以不同的格式进行读写。 {代码...} 然后运行该函数并将结果存储在另一...

量化自定义PyTorch模型入门教程

2023-09-04
阅读 8 分钟
680
在以前Pytorch只有一种量化的方法,叫做“eager mode qunatization”,在量化我们自定定义模型时经常会产生奇怪的错误,并且很难解决。但是最近,PyTorch发布了一种称为“fx-graph-mode-qunatization”的方方法。在本文中我们将研究这个fx-graph-mode-qunatization”看看它能不能让我们的量化操作更容易,更稳定。

15个基本且常用Pandas代码片段

2023-09-03
阅读 4 分钟
1.1k
Pandas提供了强大的数据操作和分析功能,是数据科学的日常基本工具。在本文中,我们将介绍最常用的15个Pandas代码片段。这些片段将帮助简化数据分析任务,从数据集中提取有价值的见解。

20用于深度学习训练和研究的数据集

2023-09-02
阅读 4 分钟
980
数据集在计算机科学和数据科学中发挥着至关重要的作用。它们用于训练和评估机器学习模型,研究和开发新算法,改进数据质量,解决实际问题,推动科学研究,支持数据可视化,以及决策制定。数据集提供了丰富的信息,用于理解和应用数据,从而支持各种应用领域,包括医疗、金融、交通、社交媒体等。正确选择和处理数据集是...

Pandas 2.1发布了

2023-09-01
阅读 2 分钟
863
PyArrow是在Panda 2.0中新加入的后端,对于大数据来说提供了优于NumPy的性能。Pandas 2.1增强了对PyArrow的支持。官方在这次更新中使用最大的高亮字体宣布 PyArrow 将是 Pandas 3.0的基础依赖,这说明Panda 是认定了PyArrow了。
封面图

是否在业务中使用大语言模型?

2023-08-31
阅读 3 分钟
733
在这篇文章中我们将讨论上面这个问题并尝试解答为什么LLM对企业来说是一项伟大的投资,或者不是。是大炮打蚊子 还是 物尽其用?这就要看何时以及如何有效和高效地使用这个大模型了。

使用卷积操作实现因子分解机

2023-08-30
阅读 7 分钟
649
本文将介绍如何使用卷积操作实现因子分解机器。卷积网络因其局部性和权值共享的归纳偏差而在计算机视觉领域获得了广泛的成功和应用。卷积网络可以用来捕获形状的堆叠分类特征(B, num_cat, embedding_size)和形状的堆叠特征(B, num_features, embedding_size)之间的特征交互。

Fooocus:一个简单且功能强大的Stable Diffusion webUI

2023-08-29
阅读 3 分钟
1.2k
Fooocus的创始人Lvmin Zhang(也是 ControlNet论文的作者)将这个项目描述为对“Stable Diffusion”和“ Midjourney”设计的重新设计。Fooocus就像是Midjourney的免费离线版本,但是它使用SDXL模型。或者说它将Stable Diffusion的出图过程做了非常好的优化,没有那么多繁琐的配置。

Dynamic ReLU:根据输入动态确定的ReLU

2023-08-28
阅读 2 分钟
752
这是我最近才看到的一篇论文,它提出了动态ReLU (Dynamic ReLU, DY-ReLU),可以将全局上下文编码为超函数,并相应地调整分段线性激活函数。与传统的ReLU相比,DY-ReLU的额外计算成本可以忽略不计,但表示能力明显增强,并且实现简单,所以可以非常简单的对我们现有的模型进行修改。

理解图傅里叶变换和图卷积

2023-08-26
阅读 4 分钟
1.2k
图神经网络(GNN)代表了一类强大的深度神经网络架构。在一个日益互联的世界里,因为信息的联通性,大部分的信息可以被建模为图。例如,化合物中的原子是节点,它们之间的键是边。

微调llama2模型教程:创建自己的Python代码生成器

2023-08-25
阅读 8 分钟
1.1k
本文将演示如何使用PEFT、QLoRa和Huggingface对新的lama-2进行微调,生成自己的代码生成器。所以本文将重点展示如何定制自己的llama2,进行快速训练,以完成特定任务。

StableVideo:使用Stable Diffusion生成连续无闪烁的视频

2023-08-24
阅读 3 分钟
1.1k
使用Stable Diffusion生成视频一直是人们的研究目标,但是我们遇到的最大问题是视频帧和帧之间的闪烁,但是最新的论文则着力解决这个问题。

Pandas字符串操作的各种方法速度测试

2023-08-23
阅读 4 分钟
635
由于LLM的发展, 很多的数据集都是以DF的形式发布的,所以通过Pandas操作字符串的要求变得越来越高了,所以本文将对字符串操作方法进行基准测试,看看它们是如何影响pandas的性能的。因为一旦Pandas在处理数据时超过一定限制,它们的行为就会很奇怪。
封面图

使用Pytorch和OpenCV实现视频人脸替换

2023-08-22
阅读 20 分钟
619
“DeepFaceLab”项目已经发布了很长时间了,作为研究的目的,本文将介绍他的原理,并使用Pytorch和OpenCV创建一个简化版本。

FlashAttention算法详解

2023-08-21
阅读 8 分钟
1.8k
这篇文章的目的是详细的解释Flash Attention,为什么要解释FlashAttention呢?因为FlashAttention 是一种重新排序注意力计算的算法,它无需任何近似即可加速注意力计算并减少内存占用。所以作为目前LLM的模型加速它是一个非常好的解决方案,本文介绍经典的V1版本,最新的V2做了其他优化我们这里暂时不介绍。因为V1版的Fl...
封面图

知识图谱入门:使用Python创建知识图,分析并训练嵌入模型

2023-08-20
阅读 8 分钟
1.6k
接下来,创建一个NetworkX图(G)来表示KG。DataFrame (df)中的每一行都对应于KG中的三元组(头、关系、尾)。add_edge函数在头部和尾部实体之间添加边,关系作为标签。
封面图

Google开源了可视化编程框架Visual Blocks for ML

2023-08-19
阅读 3 分钟
1.3k
Visual Blocks for ML是一个由Google开发的开源可视化编程框架。它使你能够在易于使用的无代码图形编辑器中创建ML管道。

马修斯相关系数MCC简介

2023-08-18
阅读 2 分钟
894
在这种情况下,数据集代表了一种罕见疾病的医学测试,只有少量正例。混淆矩阵表明该模型具有高的真反例(TN)率,但具有低的真正例(TP)率。以下是精确度、召回率和F1分数的计算结果:
封面图

Prompt、RAG、微调还是重新训练?如何选择正确的生成式AI的使用方法

2023-08-16
阅读 3 分钟
1.1k
生成式人工智能正在快速发展,许多人正在尝试使用这项技术来解决他们的业务问题。一般情况下有4种常见的使用方法:Prompt EngineeringRetrieval Augmented Generation (RAG 检索增强生成)微调从头开始训练基础模型(FM)本文将试图根据一些常见的可量化指标,为选择正确的生成式人工智能方法提供建议。本文不包括“使用原模...

使用Pandas进行数据清理的入门示例

2023-08-15
阅读 6 分钟
1k
数据清理是数据分析过程中的关键步骤,它涉及识别缺失值、重复行、异常值和不正确的数据类型。获得干净可靠的数据对于准确的分析和建模非常重要。本文将介绍以下6个经常使用的数据清理操作:检查缺失值、检查重复行、处理离群值、检查所有列的数据类型、删除不必要的列、数据不一致处理第一步,让我们导入库和数据集。 {...
封面图

时间序列去趋势化和傅里叶变换

2023-08-14
阅读 5 分钟
1.6k
在计算傅里叶变换之前对信号去趋势是一种常见的做法,特别是在处理时间序列时。在这篇文章中,我将从数学和视觉上展示信号去趋势是如何影响傅里叶变换的。
封面图

使用LSH 进行特征提取

2023-08-13
阅读 3 分钟
600
局部敏感哈希(LSH)通常用于近似最近邻算法(ANN) 操作(向量搜索)。LSH的特性也可以在以矢量为输入的神经网络模型中得到利用(例如,各种的音频、视频和文本嵌入等内容信号)。

基于时态差分法的强化学习:Sarsa和Q-learning

2023-08-12
阅读 3 分钟
633
时态差分法(Temporal Difference, TD)是一类在强化学习中广泛应用的算法,用于学习价值函数或策略。Sarsa和Q-learning都是基于时态差分法的重要算法,用于解决马尔可夫决策过程(Markov Decision Process, MDP)中的强化学习问题。
封面图

Streamlit 入门教程:构建一个Dashboard

2023-08-11
阅读 8 分钟
3.1k
Streamlit 是一个用于创建数据科学和机器学习应用程序的开源 Python 库。它的主要目标是使开发人员能够以简单的方式快速构建交互式的数据应用,而无需过多的前端开发经验。Streamlit 提供了一种简单的方法来转换数据脚本或分析代码为具有可视化界面的应用程序,这些应用程序可以通过网络浏览器访问。

用于3D MRI和CT扫描的深度学习模型总结

2023-08-10
阅读 2 分钟
488
医学成像数据与其他我们日常图像的最大区别之一是它们很多都是3D的,比如在处理DICOM系列数据时尤其如此。DICOM图像由很多的2D切片组成了一个扫描或身体的特定部分。

使用Automatic1111在本地PC上运行SDXL 1.0

2023-08-09
阅读 2 分钟
990
这是我们部署Stable Diffusion的第三篇文章了,前两篇文章都详细介绍了Automatic1111的stable-diffusion-webui的安装,这次主要介绍如何使用SDXL 1.0模型。
封面图

使用Python中从头开始构建决策树算法

2023-08-08
阅读 4 分钟
769
决策树(Decision Tree)是一种常见的机器学习算法,被广泛应用于分类和回归任务中。并且再其之上的随机森林和提升树等算法一直是表格领域的最佳模型,所以本文将介绍理解其数学概念,并在Python中动手实现,这可以作为了解这类算法的基础知识。
封面图