Skip navigation
Please use this identifier to cite or link to this item: https://libeldoc.bsuir.by/handle/123456789/61939
Title: Ансамблевые методы многоаспектного анализа текстов в задачах категоризации документов
Other Titles: Ensemble methods of multi-aspect texts analysis in document categorization tasks / А. И. Парамонов, И. А. Труханович // Информационные системы и технологии = Information Systems and Technologies
Authors: Парамонов, А. И.
Труханович, И. А.
Keywords: публикации ученых;машинное обучение;идентификация авторства;ансамблевые методы
Issue Date: 2025
Publisher: БГУ
Citation: Парамонов, А. И. Ансамблевые методы многоаспектного анализа текстов в задачах категоризации документов = Ensemble methods of multi-aspect texts analysis in document categorization tasks / А. И. Парамонов, И. А. Труханович // Информационные системы и технологии = Information Systems and Technologies : материалы XI Международного научного конгресса по информатике (CSIST-2025), Минск, 29–31 октября 2025 г. : в 2 ч. Ч. 2 / Белорусский государственный университет ; редкол.: С. В. Абламейко (гл. ред.) [и др.]. – Минск, 2025. – С. 204–211.
Abstract: В статье представлен комплексный подход к задаче категоризации документов на основе многоаспектного анализа естественно-языковых текстов с учётом их различных особенностей. Описана общая схема ансамблевого метода, где каждая модель представления текста исследует его со своей перспективы: статистический анализ, семантическое представление, а также квантовые признаки текстовой информации. Представлены основные результаты сравнительного эксперимента, который показал, что стратифицированный подход обеспечивает более высокую точность и надёжность идентификации авторов, раскрывая глубинные уровни индивидуального стиля.
Alternative abstract: The article presents a comprehensive approach to the task of document categorization based on a multi-aspect analysis of natural language texts taking into account their statistical, semantic and quantum features. The scheme of the ensemble method is described, where each model of text representation studies it from its own perspective: statistical analysis, semantic representation, and quantum features of text information. The main results of a comparative experiment are presented, which showed that the stratified approach provides higher accuracy and reliability of author identification, revealing deep levels of individual style.
URI: https://libeldoc.bsuir.by/handle/123456789/61939
Appears in Collections:Публикации в изданиях Республики Беларусь

Files in This Item:
File Description SizeFormat 
Paramonov_Ansamblevye.pdf480.73 kBAdobe PDFView/Open
Show full item record Google Scholar

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.