Skip navigation
Please use this identifier to cite or link to this item: https://libeldoc.bsuir.by/handle/123456789/63916
Full metadata record
DC FieldValueLanguage
dc.contributor.authorПотёмин, И. В.-
dc.coverage.spatialМинскen_US
dc.date.accessioned2026-06-02T05:58:55Z-
dc.date.available2026-06-02T05:58:55Z-
dc.date.issued2026-
dc.identifier.citationПотёмин, И. В. Исследование балансировки на реальных данных = Research of balancing on real data / И. В. Потёмин // Компьютерные системы и сети : сборник материалов 62-й научной конференции аспирантов, магистрантов и студентов БГУИР, Минск, 13–17 апреля 2026 г. / Белорусский государственный университет информатики и радиоэлектроники. – Минск, 2026. – С. 73–79.en_US
dc.identifier.urihttps://libeldoc.bsuir.by/handle/123456789/63916-
dc.description.abstractВ работе исследуется влияние дисбаланса классов на эффективность алгоритмов машинного обучения. На примере датасета прогнозирования профессионального выгорания проведено сравнение трёх методов балансировки: передискретизации, недодискретизации и взвешивания классов. Экспериментально оценены логистическая регрессия, дерево решений и метод опорных векторов. Установлено, что игнорирование дисбаланса приводит к неспособности моделей выявлять минорный класс при высокой общей точности. Наиболее универсальным решением признано взвешивание классов, обеспечивающее высокую сбалансированную точность и PR-AUC без изменения объёма данных. Результаты формируют рекомендации по выбору стратегии балансировки для задач с неравномерным распределением классов.en_US
dc.language.isoruen_US
dc.publisherБГУИРen_US
dc.subjectматериалы конференцийen_US
dc.subjectмашинное обучениеen_US
dc.subjectдисбаланс классовen_US
dc.subjectбалансировка данныхen_US
dc.subjectпередискретизацияen_US
dc.subjectнедодискретизацияen_US
dc.subjectвзвешивание классовen_US
dc.subjectбинарная классификацияen_US
dc.subjectлогистическая регрессияen_US
dc.titleИсследование балансировки на реальных данныхen_US
dc.title.alternativeResearch of balancing on real dataen_US
dc.typeArticleen_US
local.description.annotationThe paper examines the influence of class imbalance on the efficiency of machine learning algorithms. Using the example of a dataset of professional burnout forecasting, three balancing methods are compared: oversampling, undersampling and weighing classes. Logistic regression, decision tree and reference vector method were experimentally evaluated. It has been established that ignoring the imbalance leads to the inability of models to identify a minor class with high overall accuracy. Class weighing is recognized as the most versatile solution, providing high balanced accuracy and PR-AUC without changing the amount of data. The results form recommendations for choosing a balancing strategy for tasks with an uneven distribution of classes.en_US
Appears in Collections:Компьютерные системы и сети : материалы 62-й научной конференции аспирантов, магистрантов и студентов : сборник статей (2026)

Files in This Item:
File Description SizeFormat 
Potyomin_Issledovanie.pdf1.36 MBAdobe PDFView/Open
Show simple item record Google Scholar

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.