Skip navigation
Please use this identifier to cite or link to this item: https://libeldoc.bsuir.by/handle/123456789/64010
Full metadata record
DC FieldValueLanguage
dc.contributor.authorВенско, В. В.-
dc.contributor.authorЯкуть, А. Ю.-
dc.coverage.spatialМинскen_US
dc.date.accessioned2026-06-04T11:01:28Z-
dc.date.available2026-06-04T11:01:28Z-
dc.date.issued2026-
dc.identifier.citationВенско, В. В. Спектральный анализ динамики обучения нейронных сетей: исследование низкоранговой структуры градиентного спуска = Spectral analysis of neural network training dynamics: investigating the low-rank structure of gradient descent / В. В. Венско, А. Ю. Якуть // Компьютерные системы и сети : сборник материалов 62-й научной конференции аспирантов, магистрантов и студентов БГУИР, Минск, 13–17 апреля 2026 г. / Белорусский государственный университет информатики и радиоэлектроники. – Минск, 2026. – С. 162–167.en_US
dc.identifier.urihttps://libeldoc.bsuir.by/handle/123456789/64010-
dc.description.abstractДанная работа посвящена исследованию структуры матриц весов, возникающей в процессе обучения многослойного перцептрона. Выдвинута гипотеза об убывании эффективного ранга матриц весов в процессе обучения методом градиентного спуска. Для проверки гипотезы обучена полносвязная нейронная сеть (MLP) на наборе данных MNIST с помощью библиотеки PyTorch; на каждой эпохе вычислялся эффективный ранг матриц весов для разных функций активации. Полученные результаты подтверждают гипотезу и демонстрируют устойчивую тенденцию к снижению эффективного ранга.en_US
dc.language.isoruen_US
dc.publisherБГУИРen_US
dc.subjectматериалы конференцийen_US
dc.subjectнейронные сетиen_US
dc.subjectсингулярное разложениеen_US
dc.subjectэнтропия Шеннонаen_US
dc.subjectнейронаукаen_US
dc.subjectмашинное обучениеen_US
dc.titleСпектральный анализ динамики обучения нейронных сетей: исследование низкоранговой структуры градиентного спускаen_US
dc.title.alternativeSpectral analysis of neural network training dynamics: investigating the low-rank structure of gradient descenten_US
dc.typeArticleen_US
local.description.annotationThis work is devoted to studying the structure of weight matrices arising during the training of a multilayer perceptron. A hypothesis is proposed that the effective rank of weight matrices decreases during training by gradient descent. To test the hypothesis, a fully connected neural network (MLP) was trained on the MNIST dataset using the PyTorch library; at each epoch, the effective rank of the weight matrices was computed for different activation functions. The obtained results confirm the hypothesis and demonstrate a steady trend toward a decrease in the effective rank.en_US
Appears in Collections:Компьютерные системы и сети : материалы 62-й научной конференции аспирантов, магистрантов и студентов : сборник статей (2026)

Files in This Item:
File Description SizeFormat 
Vensko_Spektralnyj.pdf1.31 MBAdobe PDFView/Open
Show simple item record Google Scholar

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.