Влияние методов дообучения на адаптацию языковых моделей для анализа процессов разработки

Красёв, П. А.; Калугина, М. А.

Please use this identifier to cite or link to this item: https://libeldoc.bsuir.by/handle/123456789/63520

Title:	Влияние методов дообучения на адаптацию языковых моделей для анализа процессов разработки
Other Titles:	The impact of fine-tuning methods on the adaptation of language models for software development process analysis
Authors:	Красёв, П. А. Калугина, М. А.
Keywords:	материалы конференций;Big Data;информационные системы;языковые модели,;fine-tuning;анализ процессов;метрики потока;релевантность
Issue Date:	2026
Publisher:	БГУИР
Citation:	Красёв, П. А. Влияние методов дообучения на адаптацию языковых моделей для анализа процессов разработки = The impact of fine-tuning methods on the adaptation of language models for software development process analysis / П. А. Красёв, М. А. Калугина // Big Data и анализ высокого уровня = Big Data and Advanced Analytics : сборник научных статей XII Международной научно-практической конференции, Республика Беларусь, Минск, 23 апреля 2026 года : в 2 ч. Ч. 1 / Белорусский государственный университет информатики и радиоэлектроники [и др.] ; редкол.: В. А. Богуш [и др.]. – Минск, 2026. – С. 220–226.
Abstract:	В статье рассматриваются методы адаптации больших языковых моделей для автоматизации анализа процессов разработки программного обеспечения. Акцент сделан на интеграции моделей с данными систем управления проектами. Проведено сравнение различных подходов к дообучению: полный fine-tuning, параметрически эффективные методы (LoRA, QLoRA, P-Tuning, IA3), а также методы оптимизации на основе предпочтений (DPO). Оценка качества выполнена по двум группам показателей: стандартные метрики оценки связности и семантической близости текста (Perplexity, BLEU, ROUGE-L, BERTScore) и предметные метрики — релевантность формируемых аналитических заключений и практическая реализуемость предлагаемых шагов по улучшению процессов. Установлено, что наибольшую эффективность демонстрирует комбинированное применение QLoRA и DPO, обеспечивающее высокое качество генераций при существенно меньших вычислительных затратах по сравнению с полным fine-tuning. Показана необходимость предварительной стратификации данных по типам задач для корректного анализа потоковых метрик.
Alternative abstract:	This article examines methods for adapting large language models to automate analytical support in software development processes. The focus is on integrating models with project management system data. Various fine-tuning approaches are compared: full fine-tuning, parameter-efficient methods (LoRA, QLoRA, Р-Tuning, IA3), and preference optimization methods (DPO). Quality assessment is performed using two groups of metrics: standard metrics for evaluating text coherence and semantic similarity (Perplexity, BLEU, ROUGE-L, BERTScore) and task specific metrics-the relevance of generated analytical conclusions and the practical feasibility of proposed process improvement steps. The combined application of QLoRA and DPO demonstrates the highest effectiveness, providing high-quality generations with substantially lower computational costs compared to full fine-tuning. The necessity of preliminary data stratification by task types for correct analysis of flow metrics is shown.
URI:	https://libeldoc.bsuir.by/handle/123456789/63520
Appears in Collections:	BIG DATA and Advanced Analytics = BIG DATA и анализ высокого уровня : сборник научных статей : в 2 ч. (2026)

Files in This Item:

File	Description	Size	Format
Krasyov_Vliyanie.pdf		2.1 MB	Adobe PDF	View/Open

Show full item record Google Scholar