Алгоритмы сравнения текстовой информации

Крез, К. С.; Шнейдеров, Е. Н.; Голушко, В. И.

Full metadata record

DC Field	Value	Language
dc.contributor.author	Крез, К. С.	-
dc.contributor.author	Шнейдеров, Е. Н.	-
dc.contributor.author	Голушко, В. И.	-
dc.coverage.spatial	Минск	en_US
dc.date.accessioned	2026-05-06T08:17:34Z	-
dc.date.available	2026-05-06T08:17:34Z	-
dc.date.issued	2026	-
dc.identifier.citation	Крез, К. С. Алгоритмы сравнения текстовой информации = Algorithms for comparing text information / К. С. Крез, Е. Н. Шнейдеров, В. И. Голушко // Big Data и анализ высокого уровня = Big Data and Advanced Analytics : сборник научных статей XII Международной научно-практической конференции, Республика Беларусь, Минск, 23 апреля 2026 года : в 2 ч. Ч. 2 / Белорусский государственный университет информатики и радиоэлектроники [и др.] ; редкол.: В. А. Богуш [и др.]. – Минск, 2026. – С. 181–187.	en_US
dc.identifier.uri	https://libeldoc.bsuir.by/handle/123456789/63578	-
dc.description.abstract	В статье рассматриваются алгоритмы сравнения текстовой информации, применяемые в задачах обработки естественного языка. Выполнен обзор подходов, ориентированных на анализ лексического, структурного и семантического сходства текстов, включая статистические методы, расстояние Левенштейна, алгоритмы локально-чувствительного хеширования и фонетические подходы. В статье рассмотрены архитектуры, принципы работы и области применения моделей Word2Vec, GloVe, FastText, BERT и Doc2Vec. На основании проведённого анализа установлено, что выбор оптимального алгоритма зависит от требований к точности, вычислительной эффективности и специфики обрабатываемых данных. Особо отмечается высокая эффективность модели BERT в задачах сравнения текстов.	en_US
dc.language.iso	ru	en_US
dc.publisher	БГУИР	en_US
dc.subject	материалы конференций	en_US
dc.subject	Big Data	en_US
dc.subject	информационные системы	en_US
dc.subject	алгоритмы сравнения	en_US
dc.subject	семантический анализ	en_US
dc.subject	текстовая информация	en_US
dc.subject	обработка текста	en_US
dc.title	Алгоритмы сравнения текстовой информации	en_US
dc.title.alternative	Algorithms for comparing text information	en_US
dc.type	Article	en_US
local.description.annotation	This article examines algorithms for comparing textual information used in natural language processing tasks. It provides an overview of approaches focused on analyzing the lexical, structural, and semantic similarity of texts, including statistical methods, Levenshtein distance, locality-sensitive hashing algorithms, and phonetic approaches. The article discusses the architectures, operating principles, and application areas of the Word2Vec, GloVe, FastText, BERT, and Doc2Vec models. Based on the conducted analysis, it is established that the selection of the optimal algorithm depends on requirements regarding accuracy, computational efficiency, and the specific characteristics of the data being processed. Particular emphasis is placed on the high effectiveness of the BERT model in text comparison tasks.	en_US
Appears in Collections:	BIG DATA and Advanced Analytics = BIG DATA и анализ высокого уровня : сборник научных статей : в 2 ч. (2026)