Skip navigation
Please use this identifier to cite or link to this item: https://libeldoc.bsuir.by/handle/123456789/46800
Title: Вложенное преобразование с сохранением семантики исходных данных
Other Titles: Embedding With Preservation of Semantics of the Original Data
Authors: Ваткин, М. Е.
Воробей, Д. А.
Яковлев, М. В.
Кривова, М. Г.
Keywords: доклады БГУИР;исходные данные;машинное обучение;линейное пространство;автокодировщики;data;embedding;vector;loss function;linear space;autoencoder;machine learning
Issue Date: 2022
Publisher: БГУИР
Citation: Вложенное преобразование с сохранением семантики исходных данных / Ваткин М. Е. [и др.] // Доклады БГУИР. – 2022. – Т. 20, № 2. – С. 46–52. – DOI : http://dx.doi.org/10.35596/1729-7648-2022-20-2-46-52.
Abstract: В современном мире данные, используемые для описания объектов, часто представлены в виде разряженных векторов с большим количеством признаков. Работа с такими данными является вычислительно неэффективной, что зачастую приводит к переобучению при моделировании. Поэтому используются алгоритмы понижения размерности данных, одними из которых являются автокодировщики. В статье предложен новый подход для оценки свойств полученных векторов меньшей размерности, а также основанная на этом подходе функция потерь. Идея предложенной функции потерь состоит в вычислении качества сохранения семантической структуры в пространстве вложений и добавлении этой метрики в функцию потерь, что позволяет сохранить отношения объектов в пространстве вложений и таким образом сохранить больше полезной информации об объектах. Полученные результаты показывают, что использование комбинации среднеквадратичной функции потерь вместе с предложенной позволяет улучшить качество полученных вложений.
Alternative abstract: In the modern world, the data used to describe objects is often presented as sparse vectors with a large number of features. Working with them can be computationally inefficient, and often leads to overfitting; therefore, the data dimension reduction algorithms are used, one of which is auto encoders. In this article, we propose a new approach for evaluating the properties of the obtained vectors of lower dimension, as well as a loss function based on this approach. The idea of the suggested loss function is to evaluate the quality of preserving the semantic structure in the embedding space, and to add that metric to loss function to save object relations in the embedding space and thus save more useful information about objects. The results obtained show that using a combination of the mean squared loss function together with the suggested one allows to improve the quality of the embeddings.
URI: https://libeldoc.bsuir.by/handle/123456789/46800
Appears in Collections:№ 20(2)

Files in This Item:
File Description SizeFormat 
Vatkin_Vlozhennoye.pdf1.01 MBAdobe PDFView/Open
Show full item record Google Scholar

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.