https://libeldoc.bsuir.by/handle/123456789/59789
Title: | YOLO11-LKAConv: optimizing UAV image multi-target detection based on improved YOLO architecture |
Other Titles: | YOLO11-LKAConv: оптимизация обнаружения нескольких целей на снимках БПЛА на основе улучшенной архитектуры YOLO |
Authors: | Wu Xianyi Ablameyko, S. V. |
Keywords: | материалы конференций;small target detection;lightweightt |
Issue Date: | 2025 |
Publisher: | БГУИР |
Citation: | Wu Xianyi. YOLO11-LKAConv: optimizing UAV image multi-target detection based on improved YOLO architecture = YOLO11-LKAConv: оптимизация обнаружения нескольких целей на снимках БПЛА на основе улучшенной архитектуры YOLO / Wu Xianyi, S. V. Ablameyko // Открытые семантические технологии проектирования интеллектуальных систем = Open Semantic Technologies for Intelligent Systems (OSTIS) : сборник научных трудов / Белорусский государственный университет информатики и радиоэлектроники ; редкол.: В. В. Голенков [и др.]. – Минск, 2025. – Вып. 9. – С. 267–272. |
Abstract: | This paper presents YOLO11-LKAConv, an improved model based on the YOLOv11 framework, to address the issue of low detection accuracy for small targets in UAV aerial images. By replacing standard convolutions with lightweight large-kernel attention convolution (LKAConv), the model integrates dynamic large-kernel receptive fields and channel-spatial attention mechanisms, enhancing its ability to capture long-range contextual features for small targets. Experiments on the VisDrone2019 dataset show that the improved model achieves an mAP50-95 of 0.173, a 1.2% increase over the baseline YOLOv11n, with improvement in both P and mAP50 while maintaining almost the same inference time. The results indicate that LKAConv effectively balances detection accuracy and computational efficiency through its lightweight large-kernel design, offering a better solution for real-time UAV target detection tasks. |
Alternative abstract: | В данной статье представлен YOLO11-LKAConv – улучшенная модель, построенная на основе фреймворка YOLOv11, которая направлена на решение проблемы низкой точности обнаружения маленьких целей на аэрофотоизображениях БПЛА. Заменяя стандартные сверточные слои на легковесные сверточные слои с большим ядром и вниманием (LKA-Conv), модель интегрирует динамические крупные рецептивные поля и механизмы канално-пространственного внимания, что усиливает ее способность захватывать долгосрочные контекстные признаки для маленьких целей. Эксперименты на датасете VisDrone2019 показывают, что улучшенная модель достигает mAP50-95 в 0,173, что на 1,2% выше, чем у базовой YOLOv11n, причем показатели точности (P) и mAP50 также улучшены, а время вывода осталось почти неизменным. Результаты указывают на то, что LKAConv благодаря своему легкому дизайну с большим ядром эффективно балансирует точность обнаружения и вычислительную эффективность, предлагая лучшее решение для задач реального времени по обнаружению целей на БПЛА. |
URI: | https://libeldoc.bsuir.by/handle/123456789/59789 |
Appears in Collections: | OSTIS-2025 |
File | Description | Size | Format | |
---|---|---|---|---|
Xianyi_YOLO11-LKAConv.pdf | 218.74 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.