Skip navigation
Please use this identifier to cite or link to this item: https://libeldoc.bsuir.by/handle/123456789/60412
Title: Актуальные проблемы ассиметричного семантического поиска на основе многомерных векторных представлений текстовых данных
Other Titles: Actual problems of asymmetric semantic search based on multidimensional vector representations of text data
Authors: Рябинкин, Г. М.
Keywords: материалы конференций;глубокое обучение;текстовые данные;семантический поиск;векторный поиск
Issue Date: 2025
Publisher: БГУИР
Citation: Рябинкин, Г. М. Актуальные проблемы ассиметричного семантического поиска на основе многомерных векторных представлений текстовых данных = Actual problems of asymmetric semantic search based on multidimensional vector representations of text data / Г. М. Рябинкин // Компьютерные системы и сети : материалы 61-й научной конференции аспирантов, магистрантов и студентов, Минск, 22–26 апреля 2025 г. / Белорусский государственный университет информатики и радиоэлектроники. – Минск, 2025. – C. 407–411.
Abstract: В статье рассматриваются проблемы и подходы к семантическому поиску, основанному на методах глубокого обучения и векторном представлении текстовых данных. Особое внимание уделяется асимметричному семантическому поиску, когда запрос и документы различаются по объему и лексике. Анализируются методы формирования векторных пространств, выбор единиц кодирования (слова, предложения, документы) и метрики семантической близости. Рассматриваются проблемы, возникающие при выборе модели и способа обучения, а также влияние обучающего корпуса на качество результатов поиска.
Alternative abstract: The article considers problems and approaches to semantic search based on deep learning methods and vector representation of text data. Particular attention is paid to asymmetric semantic search, when the query and documents differ in volume and vocabulary. The methods of forming vector spaces, the choice of encoding units (words, sentences, documents) and semantic similarity metrics are analyzed. The problems arising in the choice of a model and training method, as well as the influence of the training corpus on the quality of search results are considered.
URI: https://libeldoc.bsuir.by/handle/123456789/60412
Appears in Collections:Компьютерные системы и сети : материалы 61-й научной конференции аспирантов, магистрантов и студентов : сборник статей (2025)

Files in This Item:
File Description SizeFormat 
Ryabinkin_Aktualnye.pdf611.69 kBAdobe PDFView/Open
Show full item record Google Scholar

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.