Skip navigation
Please use this identifier to cite or link to this item: https://libeldoc.bsuir.by/handle/123456789/55578
Title: Crowd Attention Estimation Automatisation Based on Semi-Automatic Image Semantic Segmentation by Using UNet and CRF Networks
Other Titles: Автоматизация оценки внимания скоплений людей на основе полуавтоматической семантической сегментации изображений с использованием сетей UNET и CRF
Authors: Sholtanyuk, S.
Malionkin, Ya.
Bin Lei
Nedzved, A.
Keywords: материалы конференций;computer vision;crowd images;crowd detection;crowd behavior
Issue Date: 2024
Publisher: БГУИР
Citation: Crowd Attention Estimation Automatisation Based on Semi-Automatic Image Semantic Segmentation by Using UNet and CRF Networks = Автоматизация оценки внимания скоплений людей на основе полуавтоматической семантической сегментации изображений с использованием сетей UNET и CRF / S. Sholtanyuk [et al.] // Открытые семантические технологии проектирования интеллектуальных систем = Open Semantic Technologies for Intelligent Systems (OSTIS) : сборник научных трудов / Белорусский государственный университет информатики и радиоэлектроники ; редкол.: В. В. Голенков [и др.]. – Минск, 2024. – Вып. 8. – С. 269–278.
Abstract: Semantic segmentation of crowd images plays a pivotal role in various applications such as crowd management, surveillance, and urban planning. In this paper, we propose an approach for dense and sparse crowd image semantic segmentation based on semi-automatic labeling by employing a combination of UNet and Conditional Random Field (CRF). We introduce a technique for generating segmentation maps for crowd images. We utilize UNet for initial rough segmentation followed by refi nement using CRF. Experimental results demonstrate the model performs better in binary segmentation (crowd and on-crowded regions) rather than ternary segmentation (dense crowds, sparse crowds, and non-crowded areas). However the latter shows better results in terms of crowd detection (regardless of its type). Besides, we show the CRF refi nement is signifi cant in ternary segmentation. Also, we highlight some crowd behavior patterns based on the proposed segmentation model. They diff er in people’s attention types, connections within and between crowds, and possibilities of emergencies.
Alternative abstract: Семантическая сегментация изображений скоплений людей играет ключевую роль в различных приложениях, таких как управление толпой, наблюдение и городское планирование. В данной статье предложен подход к семантической сегментаций изображений с плотной и разреженной толпой на основе полуавтоматической разметки, использующий комбинацию UNet и условных случайных полей (CRF). Представлена методика генерации карт сегментации для изображений скоплений людей. Сеть UNet используется для первоначальной, грубой сегментации, после которой следует её уточнение с использованием CRF. Результаты экспериментов показали, что модель лучше выполняет бинарную сегментацию (области, занятые толпой, и области, свободные от толпы), нежели тернарную сегментацию (области плотной толпы, разреженной толпы, и области, свободные от толпы). Однако, в ходе тернарной сегментации получились лучшие результаты по сегментации толпы в целом (без учёта типа толпы). Кроме того, показана значимость уточнения сегментации при помощи CRF в задаче тернарной сегментации толпы. Также на основе предложенной модели сегментации выделены некоторые закономерности поведения скоплений людей. Они различаются по типу внимания людей, связями внутри скоплений людей и между ними, а также вероятностью возникновения чрезвычайных ситуаций.
URI: https://libeldoc.bsuir.by/handle/123456789/55578
Appears in Collections:OSTIS-2024

Files in This Item:
File Description SizeFormat 
Sholtanyuk_Crowd.pdf397.87 kBAdobe PDFView/Open
Show full item record Google Scholar

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.