Attention Is All You Need（图像上使用）

Marilyn_Manson

阅读 1 分钟

0

参考文章：Attention Is All You Need 用于NLP的讲解

注意力机制（Attention）

目的：是用于捕捉图像的感受野。

Transformer

Transformer的本质是一个Encoder-Decoder的结构。在encoder中，数据首先会经过一个叫做‘self-attention’的模块得到一个加权之后的特征向量 \(Z\) ，这个 \(Z\) 便是论文公式1中的\(Attention(Q,K,V)\)：
$$ Attention(Q,K,V)=softmax((QK^T)/√(d_k ))V （1） $$
得到 \(Z\) 之后，它会被送到encoder的下一个模块，即Feed Forward Neural Network。这个全连接有两层，第一层的激活函数是ReLU，第二层是一个线性激活函数，可以表示为
$$ FFN(Z)=max(0,ZW_1+b_1)W_2+b_2 （2） $$

目前在学习图像分割，transformer中的注意力机制还是挺重要的，持续更新。。。。。。

深度学习算法神经网络

本文系转载，阅读原文

https://zhuanlan.zhihu.com/p/48508221

阅读 1.1k更新于 2022-02-13

Marilyn_Manson

1 声望0 粉丝

坚持更新，记录学习

« 上一篇

下一篇 »

Attention机制用于图像

引用和评论

推荐阅读

Attention图像上应用个人理解

Marilyn_Manson阅读 850

大模型中的Token究竟是什么？从原理到作用深度解析

DBLens赞 5阅读 4k

用PyTorch从零构建 DeepSeek R1：模型架构和分步训练详解

deephub赞 3阅读 2.8k评论 1

功率器件热设计基础（九）——功率半导体模块的热扩散

oneyac唯样赞 2阅读 514评论 2

英飞凌 | 驱动电路设计（二）——驱动器的输入侧探究

oneyac唯样赞 4阅读 420评论 5

Manus邀请码如何获取，申请理由如何写及申请技巧

zlibrary阅读 1.7k

基于yolov5实现的AI智能盒子框架

贝壳里的沙阅读 1.7k

0 条评论

评论支持部分 Markdown 语法：**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用。你还可以使用 @ 来通知其他用户。