YOLO11-LKAConv: optimizing UAV image multi-target detection based on improved YOLO architecture

Wu Xianyi; Ablameyko, S. V.

Please use this identifier to cite or link to this item: https://libeldoc.bsuir.by/handle/123456789/59789

Title:	YOLO11-LKAConv: optimizing UAV image multi-target detection based on improved YOLO architecture
Other Titles:	YOLO11-LKAConv: оптимизация обнаружения нескольких целей на снимках БПЛА на основе улучшенной архитектуры YOLO
Authors:	Wu Xianyi Ablameyko, S. V.
Keywords:	материалы конференций;small target detection;lightweightt
Issue Date:	2025
Publisher:	БГУИР
Citation:	Wu Xianyi. YOLO11-LKAConv: optimizing UAV image multi-target detection based on improved YOLO architecture = YOLO11-LKAConv: оптимизация обнаружения нескольких целей на снимках БПЛА на основе улучшенной архитектуры YOLO / Wu Xianyi, S. V. Ablameyko // Открытые семантические технологии проектирования интеллектуальных систем = Open Semantic Technologies for Intelligent Systems (OSTIS) : сборник научных трудов / Белорусский государственный университет информатики и радиоэлектроники ; редкол.: В. В. Голенков [и др.]. – Минск, 2025. – Вып. 9. – С. 267–272.
Abstract:	This paper presents YOLO11-LKAConv, an improved model based on the YOLOv11 framework, to address the issue of low detection accuracy for small targets in UAV aerial images. By replacing standard convolutions with lightweight large-kernel attention convolution (LKAConv), the model integrates dynamic large-kernel receptive fields and channel-spatial attention mechanisms, enhancing its ability to capture long-range contextual features for small targets. Experiments on the VisDrone2019 dataset show that the improved model achieves an mAP50-95 of 0.173, a 1.2% increase over the baseline YOLOv11n, with improvement in both P and mAP50 while maintaining almost the same inference time. The results indicate that LKAConv effectively balances detection accuracy and computational efficiency through its lightweight large-kernel design, offering a better solution for real-time UAV target detection tasks.
Alternative abstract:	В данной статье представлен YOLO11-LKAConv – улучшенная модель, построенная на основе фреймворка YOLOv11, которая направлена на решение проблемы низкой точности обнаружения маленьких целей на аэрофотоизображениях БПЛА. Заменяя стандартные сверточные слои на легковесные сверточные слои с большим ядром и вниманием (LKA-Conv), модель интегрирует динамические крупные рецептивные поля и механизмы канално-пространственного внимания, что усиливает ее способность захватывать долгосрочные контекстные признаки для маленьких целей. Эксперименты на датасете VisDrone2019 показывают, что улучшенная модель достигает mAP50-95 в 0,173, что на 1,2% выше, чем у базовой YOLOv11n, причем показатели точности (P) и mAP50 также улучшены, а время вывода осталось почти неизменным. Результаты указывают на то, что LKAConv благодаря своему легкому дизайну с большим ядром эффективно балансирует точность обнаружения и вычислительную эффективность, предлагая лучшее решение для задач реального времени по обнаружению целей на БПЛА.
URI:	https://libeldoc.bsuir.by/handle/123456789/59789
Appears in Collections:	OSTIS-2025

Files in This Item:

File	Description	Size	Format
Xianyi_YOLO11-LKAConv.pdf		218.74 kB	Adobe PDF	View/Open

Show full item record Google Scholar