Skip navigation
Please use this identifier to cite or link to this item: https://libeldoc.bsuir.by/handle/123456789/62173
Full metadata record
DC FieldValueLanguage
dc.contributor.authorНестеренков, С. Н.-
dc.contributor.authorЛазук, И. С.-
dc.coverage.spatialМинскen_US
dc.date.accessioned2025-11-28T09:03:25Z-
dc.date.available2025-11-28T09:03:25Z-
dc.date.issued2025-
dc.identifier.citationНестеренков, С. Н. Анализ текстового содержимого главной страницы веб-сайта для определения его тематики при помощи LLM / С. Н. Нестеренков, И. С. Лазук // Информационные технологии и системы 2025 (ИТС 2025) : материалы Международной научной конференции, Минск, 19 ноября 2025 / Белорусский государственный университет информатики и радиоэлектроники ; редкол.: Л. Ю. Шилин [и др.]. – Минск, 2025. – С. 219–220.en_US
dc.identifier.urihttps://libeldoc.bsuir.by/handle/123456789/62173-
dc.description.abstractРабота посвящена задаче автоматического определения тематики веб-сайтов по тексту их главной страницы. Предложена методика, включающая сбор HTML-контента, извлечение основного текста, предобработку, применение больших языковых моделей (LLM) в режимах zero/few-shot и приёмы стабилизации ответов. Представлены экспериментально-гипотетические результаты сравнения различных LLM (G PT-4 от OpenAI, YandexGPT, DeepSeek) и режимов их использования на главных страницах веб-ресурсов. Обсуждаются ограничения, связанные с вёрсткой, мультимедийностью, использованием нескольких языков, предлагаются направления дальнейших исследований.en_US
dc.language.isoruen_US
dc.publisherБГУИРen_US
dc.subjectматериалы конференцийen_US
dc.subjectбольшие языковые моделиen_US
dc.subjectвеб-ресурсыen_US
dc.subjectLLMen_US
dc.titleАнализ текстового содержимого главной страницы веб-сайта для определения его тематики при помощи LLMen_US
dc.typeArticleen_US
Appears in Collections:ИТС 2025

Files in This Item:
File Description SizeFormat 
Nesterenkov_Analiz.pdf152.21 kBAdobe PDFView/Open
Show simple item record Google Scholar

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.