| DC Field | Value | Language |
| dc.contributor.author | Нестеренков, С. Н. | - |
| dc.contributor.author | Лазук, И. С. | - |
| dc.coverage.spatial | Минск | en_US |
| dc.date.accessioned | 2025-11-28T09:03:25Z | - |
| dc.date.available | 2025-11-28T09:03:25Z | - |
| dc.date.issued | 2025 | - |
| dc.identifier.citation | Нестеренков, С. Н. Анализ текстового содержимого главной страницы веб-сайта для определения его тематики при помощи LLM / С. Н. Нестеренков, И. С. Лазук // Информационные технологии и системы 2025 (ИТС 2025) : материалы Международной научной конференции, Минск, 19 ноября 2025 / Белорусский государственный университет информатики и радиоэлектроники ; редкол.: Л. Ю. Шилин [и др.]. – Минск, 2025. – С. 219–220. | en_US |
| dc.identifier.uri | https://libeldoc.bsuir.by/handle/123456789/62173 | - |
| dc.description.abstract | Работа посвящена задаче автоматического определения тематики веб-сайтов по тексту их главной
страницы. Предложена методика, включающая сбор HTML-контента, извлечение основного текста,
предобработку, применение больших языковых моделей (LLM) в режимах zero/few-shot и приёмы стабилизации
ответов. Представлены экспериментально-гипотетические результаты сравнения различных
LLM (G PT-4 от OpenAI, YandexGPT, DeepSeek) и режимов их использования на главных страницах
веб-ресурсов. Обсуждаются ограничения, связанные с вёрсткой, мультимедийностью, использованием
нескольких языков, предлагаются направления дальнейших исследований. | en_US |
| dc.language.iso | ru | en_US |
| dc.publisher | БГУИР | en_US |
| dc.subject | материалы конференций | en_US |
| dc.subject | большие языковые модели | en_US |
| dc.subject | веб-ресурсы | en_US |
| dc.subject | LLM | en_US |
| dc.title | Анализ текстового содержимого главной страницы веб-сайта для определения его тематики при помощи LLM | en_US |
| dc.type | Article | en_US |
| Appears in Collections: | ИТС 2025
|