《電子技術應用》
您所在的位置:首頁 > 人工智能 > 設計應用 > 基于YOLOX融合自注意力機制的FSA-FPN重構方法
基于YOLOX融合自注意力機制的FSA-FPN重構方法
電子技術應用 2023年3期
安鶴男1,管聰2,鄧武才1,楊佳洲2,馬超2
(1.深圳大學 電子與信息工程學院,廣東 深圳 518000;2.深圳大學 微納光電子學研究院,廣東 深圳 518000)
摘要: 隨著目前目標檢測任務輸入圖像分辨率的不斷增大,在特征提取網絡的感受野不變的情況下,網絡提取的特征信息會越來越局限,相鄰特征點之間的信息重合度也會越來越高。提出一種FSA(Fusion Self-Attention)-FPN,設計SAU(Self-Attention Upsample)模塊,SAU內部結構通過CNN與自注意力機制(Self-Attention)進行交叉計算以進一步進行特征融合,并通過重構FCU(Feature Coupling Unit)消除二者之間的特征錯位,彌補語義差距。以YOLOX-Darknet53為主干網絡,在Pascal VOC2007數據集上進行了對比實驗。實驗結果表明,對比原網絡的FPN,替換FSA-FPN后的平均精度值mAP@[.5:.95]提升了1.5%,預測框的位置也更為精準,在需要更高精度的檢測場景下有更為出色的使用價值。
中圖分類號:TP391.4 文獻標志碼:A DOI: 10.16157/j.issn.0258-7998.223139
中文引用格式: 安鶴男,管聰,鄧武才,等. 基于YOLOX融合自注意力機制的FSA-FPN重構方法[J]. 電子技術應用,2023,49(3):61-66.
英文引用格式: An Henan,Guan Cong,Deng Wucai,et al. FSA-FPN reconstruction method that fused self-attention mechanism based on YOLOX[J]. Application of Electronic Technique,2023,49(3):61-66.
FSA-FPN reconstruction method that fused self-attention mechanism based on YOLOX
An Henan1,Guan Cong2,Deng Wucai1,Yang Jiazhou2,Ma Chao2
(1.College of Electronics and Information Engineering,Shenzhen University,Shenzhen 518000,China; 2.Institute of Microscale Optoelectronics,Shenzhen University,Shenzhen 518000,China)
Abstract: Abstract: With the increasing resolution of the input image of the current target detection task,the feature information extracted from the feature extraction network will become more and more limited under the condition that the receptive field of the feature extraction network remains unchanged,and the information coincidence degree between adjacent feature points will also become higher and higher.This paper proposes an FSA(fusion self-attention)-FPN,and designs SAU(self-attention upsample) module.The internal structure of SAU performs cross calculation with self-attention mechanism and CNN to further Feature fusion,and reconstructs FCU(feature coupling unit) to eliminate feature dislocation between them and bridge semantic gap. In this paper,a comparative experiment is carried out on Pascal VOC2007 data set using YOLOX-Darknet 53 as the main dry network. The experimental results show that compared with the FPN of the original network,the average accuracy of MAP@ [.5:.95] after replacing FSA-FPN is improved by 1.5%,and the position of the prediction box is also more accurate.It has better application value in detection scenarios requiring higher accuracy.
Key words : FSA-feature pyramid networks;feature fusion;SAU;self-attention mechanism

0 引言

目標檢測是致力于解決確定圖像中所需物體類別并標識出物體具體位置的一類任務。自從以卷積神經網絡(Convolutional Neural Networks,CNN)為代表的深度學習技術在多個領域取得突破性成功后,基于CNN的目標檢測方法也憑著卷積運算的特性做到對圖像特征信息的深層次提取,從而達到較為優秀的檢測性能。目前主流目標檢測任務大多還是分為兩類,分別是以Faster-RCNN[1]為代表的雙階段檢測與以YOLO和SSD為代表的單階段檢測算法,它們都以CNN作為特征提取核心。FPN(Feature Pyramid Network)是自頂向下的一種特征融合方式,通過將不同尺寸的特征信息進行融合,對不同尺寸的物體檢測均有較為出色的適應性。整體來說,CNN受制于其卷積層的大小,感受野有限,所以更多地是對局部特征的提取。

Transformer開創了自注意力機制(Self-attention)的先河,在全局特征的提取上有著CNN無法比擬的優勢。而現在的目標檢測算法大部分還是以CNN為主要特征提取手段,雖然也有以ViT、Swin-Transformer等以Self-attention為特征提取核心的目標檢測算法,但是其計算量巨大,且實際落地受到硬件設施、計算資源的限制,通用性不如Faster-RCNN和YOLOv3、SSD等以CNN為特征提取核心的目標檢測算法。

本文對Conformer提出的一種CNN分支與Transformer分支互相彌補語義差距、 消除特征錯位的方法做出改進,并結合Darknet-53的結構,在其FPN的特征融合過程中引入自注意力機制,設計了SAU(Self-Attention Upsample)模塊,通過對特征圖進行重新編碼以對齊自注意力輸入的特征維度,同時設計多次的自注意力計算與上下層之間的聯動結合,提出的FSA-FPN在融合不同尺寸物體的特征時同時也注重了自身全局信息的特征提取以提升其整體檢測效果,在需要更高精度的檢測場景下有更大的使用價值。




本文詳細內容請下載:http://www.rjjo.cn/resource/share/2000005230




作者信息:

安鶴男1,管聰2,鄧武才1,楊佳洲2,馬超2

(1.深圳大學 電子與信息工程學院,廣東 深圳 518000;2.深圳大學 微納光電子學研究院,廣東 深圳 518000)



微信圖片_20210517164139.jpg

此內容為AET網站原創,未經授權禁止轉載。
主站蜘蛛池模板: 国产成人做受免费视频 | 欧美做爰野外在线视频观看 | 高清在线一区二区 | 欧美视频一区二区三区精品 | 欧美福利一区二区三区 | 精品精品国产自在久久高清 | 成人久久18免费网站游戏 | 91欧美精品 | 视频一区二区三区在线 | 看一级毛片一区二区三区免费 | 欧美性精品 | 国产精品合集一区二区 | 在线观看免费视频国产 | 国产成人一区二区三区在线播放 | 国产特黄特色一级特色大片 | 伊人青 | 欧美亚洲黄色 | 国产年成美女网站视频免费看 | 久久爱91| 在线亚洲精品自拍 | 亚洲一一在线 | 免费视频一区二区三区四区 | 另类亚洲孕妇分娩网址 | 亚洲 欧美 国产 日韩 制服 bt | 中文字幕人成乱码在线观看 | 台湾香港澳门三级在线 | 失禁h啪肉尿出来高h | 米奇精品一区二区三区 | 日韩欧美一区二区三区不卡视频 | 天堂资源8中文最新版在线 天堂最新版 | 福利一二三区 | 粉嫩jk制服美女啪啪 | 久久综合精品国产一区二区三区无 | 欧美激情视频在线观看一区二区三区 | 成年人福利视频 | 欧美满嘴射 | 午夜不卡在线 | 最新亚洲精品国自产在线观看 | 国产欧美日韩免费一区二区 | 中文字幕亚洲一区 | 日韩欧美一区二区三区在线 |