| DC Field | Value | Language |
| dc.contributor.author | Полоско, Е. И. | - |
| dc.coverage.spatial | Минск | en_US |
| dc.date.accessioned | 2026-05-04T06:25:18Z | - |
| dc.date.available | 2026-05-04T06:25:18Z | - |
| dc.date.issued | 2026 | - |
| dc.identifier.citation | Полоско, Е. И. Комплексный статистический анализ больших данных: интеграция методов снижения размерности, кластеризации и регрессии = Complex statistical analysis of big data: integration of dimensionality reduction, clustering and regression methods / Е. И. Полоско // Big Data и анализ высокого уровня = Big Data and Advanced Analytics : сборник научных статей XII Международной научно-практической конференции, Республика Беларусь, Минск, 23 апреля 2026 года : в 2 ч. Ч. 1 / Белорусский государственный университет информатики и радиоэлектроники [и др.] ; редкол.: В. А. Богуш [и др.]. – Минск, 2026. – С. 246–254. | en_US |
| dc.identifier.uri | https://libeldoc.bsuir.by/handle/123456789/63502 | - |
| dc.description.abstract | В статье рассматривается методология комплексного статистического анализа,
объединяющая методы описательной статистики, корреляционного анализа, снижения размерности (метод
главных компонент), кластеризации (K-Means) и регрессионного моделирования для обработки больших
данных. Используется пошаговый подход к анализу данных, реализованный в среде Python и апробированный
на имитированных производственных и энергетических данных ОАО «МАЗ» за 2021-2025 гг. Проведён
сравнительный анализ регрессионных моделей прогнозирования энергопотребления; ансамблевые методы
(Gradient Boosting) демонстрируют наивысшую точность (R2 = 0,873 и МАЕ = 3,61 МВт ч) по сравнению с
линейными моделями. Практическая значимость работы заключается в универсальном подходе к анализу
производственных данных для поддержки управленческих решений и оптимизации бизнес-процессов на
промышленных предприятиях. | en_US |
| dc.language.iso | ru | en_US |
| dc.publisher | БГУИР | en_US |
| dc.subject | материалы конференций | en_US |
| dc.subject | Big Data | en_US |
| dc.subject | информационные системы | en_US |
| dc.subject | комплексный статистический анализ | en_US |
| dc.subject | кластерный анализ | en_US |
| dc.subject | регрессионное моделирование | en_US |
| dc.subject | энергоэффективность | en_US |
| dc.subject | машиностроение | en_US |
| dc.subject | предиктивная аналитика | en_US |
| dc.title | Комплексный статистический анализ больших данных: интеграция методов снижения размерности, кластеризации и регрессии | en_US |
| dc.title.alternative | Complex statistical analysis of big data: integration of dimensionality reduction, clustering and regression methods | en_US |
| dc.type | Article | en_US |
| local.description.annotation | The article presents a methodology for complex statistical analysis that combines descriptive statistics, correlation analysis, dimensionality reduction (Principal Component Analysis), clustering (К-Means) and regression modelling for big data processing. A step-by-step data analysis approach is used, implemented in Python and tested on simulated production and energy data of OJSC “MAZ” for 2021-2025. A comparative analysis of regression models for forecasting energy consumption is carried out; ensemble methods (Gradient Boosting) demonstrate the highest accuracy (R2 = 0,873 и MAE = 3,61 МВт ч) compared to linear models. The practical significance of the study lies in a universal approach to the analysis of production data to support managerial decisionmaking and optimize business processes at industrial enterprises. | en_US |
| Appears in Collections: | BIG DATA and Advanced Analytics = BIG DATA и анализ высокого уровня : сборник научных статей : в 2 ч. (2026)
|