Skip navigation
Please use this identifier to cite or link to this item: https://libeldoc.bsuir.by/handle/123456789/63578
Full metadata record
DC FieldValueLanguage
dc.contributor.authorКрез, К. С.-
dc.contributor.authorШнейдеров, Е. Н.-
dc.contributor.authorГолушко, В. И.-
dc.coverage.spatialМинскen_US
dc.date.accessioned2026-05-06T08:17:34Z-
dc.date.available2026-05-06T08:17:34Z-
dc.date.issued2026-
dc.identifier.citationКрез, К. С. Алгоритмы сравнения текстовой информации = Algorithms for comparing text information / К. С. Крез, Е. Н. Шнейдеров, В. И. Голушко // Big Data и анализ высокого уровня = Big Data and Advanced Analytics : сборник научных статей XII Международной научно-практической конференции, Республика Беларусь, Минск, 23 апреля 2026 года : в 2 ч. Ч. 2 / Белорусский государственный университет информатики и радиоэлектроники [и др.] ; редкол.: В. А. Богуш [и др.]. – Минск, 2026. – С. 181–187.en_US
dc.identifier.urihttps://libeldoc.bsuir.by/handle/123456789/63578-
dc.description.abstractВ статье рассматриваются алгоритмы сравнения текстовой информации, применяемые в задачах обработки естественного языка. Выполнен обзор подходов, ориентированных на анализ лексического, структурного и семантического сходства текстов, включая статистические методы, расстояние Левенштейна, алгоритмы локально-чувствительного хеширования и фонетические подходы. В статье рассмотрены архитектуры, принципы работы и области применения моделей Word2Vec, GloVe, FastText, BERT и Doc2Vec. На основании проведённого анализа установлено, что выбор оптимального алгоритма зависит от требований к точности, вычислительной эффективности и специфики обрабатываемых данных. Особо отмечается высокая эффективность модели BERT в задачах сравнения текстов.en_US
dc.language.isoruen_US
dc.publisherБГУИРen_US
dc.subjectматериалы конференцийen_US
dc.subjectBig Dataen_US
dc.subjectинформационные системыen_US
dc.subjectалгоритмы сравненияen_US
dc.subjectсемантический анализen_US
dc.subjectтекстовая информацияen_US
dc.subjectобработка текстаen_US
dc.titleАлгоритмы сравнения текстовой информацииen_US
dc.title.alternativeAlgorithms for comparing text informationen_US
dc.typeArticleen_US
local.description.annotationThis article examines algorithms for comparing textual information used in natural language processing tasks. It provides an overview of approaches focused on analyzing the lexical, structural, and semantic similarity of texts, including statistical methods, Levenshtein distance, locality-sensitive hashing algorithms, and phonetic approaches. The article discusses the architectures, operating principles, and application areas of the Word2Vec, GloVe, FastText, BERT, and Doc2Vec models. Based on the conducted analysis, it is established that the selection of the optimal algorithm depends on requirements regarding accuracy, computational efficiency, and the specific characteristics of the data being processed. Particular emphasis is placed on the high effectiveness of the BERT model in text comparison tasks.en_US
Appears in Collections:BIG DATA and Advanced Analytics = BIG DATA и анализ высокого уровня : сборник научных статей : в 2 ч. (2026)

Files in This Item:
File Description SizeFormat 
Krez_Algoritmy.pdf3.44 MBAdobe PDFView/Open
Show simple item record Google Scholar

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.