Title: | Актуальные проблемы ассиметричного семантического поиска на основе многомерных векторных представлений текстовых данных |
Other Titles: | Actual problems of asymmetric semantic search based on multidimensional vector representations of text data |
Authors: | Рябинкин, Г. М. |
Keywords: | материалы конференций;глубокое обучение;текстовые данные;семантический поиск;векторный поиск |
Issue Date: | 2025 |
Publisher: | БГУИР |
Citation: | Рябинкин, Г. М. Актуальные проблемы ассиметричного семантического поиска на основе многомерных векторных представлений текстовых данных = Actual problems of asymmetric semantic search based on multidimensional vector representations of text data / Г. М. Рябинкин // Компьютерные системы и сети : материалы 61-й научной конференции аспирантов, магистрантов и студентов, Минск, 22–26 апреля 2025 г. / Белорусский государственный университет информатики и радиоэлектроники. – Минск, 2025. – C. 407–411. |
Abstract: | В статье рассматриваются проблемы и подходы к семантическому поиску, основанному на методах глубокого обучения
и векторном представлении текстовых данных. Особое внимание уделяется асимметричному семантическому поиску, когда запрос и документы различаются по объему и лексике. Анализируются методы формирования векторных пространств, выбор единиц кодирования (слова, предложения, документы) и метрики семантической близости. Рассматриваются проблемы, возникающие при выборе модели и способа обучения, а также влияние обучающего корпуса на качество результатов поиска. |
Alternative abstract: | The article considers problems and approaches to semantic search based on deep learning methods and vector representation of
text data. Particular attention is paid to asymmetric semantic search, when the query and documents differ in volume and vocabulary. The methods of forming vector spaces, the choice of encoding units (words, sentences, documents) and semantic similarity metrics are analyzed. The problems arising in the choice of a model and training method, as well as the influence of the training corpus on the quality of search results are considered. |
URI: | https://libeldoc.bsuir.by/handle/123456789/60412 |
Appears in Collections: | Компьютерные системы и сети : материалы 61-й научной конференции аспирантов, магистрантов и студентов : сборник статей (2025)
|