Skip navigation
Please use this identifier to cite or link to this item: https://libeldoc.bsuir.by/handle/123456789/54881
Title: Обучение вопросно-ответной нейросетевой модели на базе архитектуры модели LLaVA 1.5 с энкодером Saiga Mistral 7b и алгоритма низкоранговой адаптации LoRA
Other Titles: Training a question and answering neural network model based on LLaVA 1.5 model architecture with Saiga Mistral 7b encoder and low-rank adaptation algorithm LoRA
Authors: Демидова, Л. А.
Морошкин, Н. А.
Keywords: материалы конференций;нейросетевые модели;вопросно-ответное моделирование;технология LoRA
Issue Date: 2024
Publisher: БГУИР
Citation: Демидова, Л. А. С Обучение вопросно-ответной нейросетевой модели на базе архитектуры модели LLaVA 1.5 с энкодером Saiga Mistral 7b и алгоритма низкоранговой адаптации LoRA = Training a question and answering neural network model based on LLaVA 1.5 model architecture with Saiga Mistral 7b encoder and low-rank adaptation algorithm LoRA / Л. А. Демидова, Н. А. Морошкин // BIG DATA и анализ высокого уровня = BIG DATA and Advanced Analytics : сборник научных статей X Международной научно-практической конференции, Минск, 13 марта 2024 г. : в 2 ч. Ч. 2 / Белорусский государственный университет информатики и радиоэлектроники ; редкол.: В. А. Богуш [и др.]. – Минск, 2024. – С. 401–407.
Abstract: В данной работе реализован алгоритм обучения визуальной вопросно-ответной нейросетевой модели на базе архитектуры нейросетевой модели LLaVA 1.5 с использованием текстового энкодера Mistral 7b, позволяющего улучшить результаты работы модели в задаче визуального вопросно- ответного моделирования и алгоритма низкоранговой адаптации LoRA, позволяющего ускорить процесс обучения модели. Показано, что задача вопросно-ответного моделирования может быть решена нейросетевыми моделями с использованием больших языковых моделей, описана методика ускорения обучения таких моделей. Проведена оценка эффективности разработанной модели и показаны общие аспекты обучения вопросно-ответных моделей на наиболее популярных вопросно-ответных наборах данных.
Alternative abstract: In this work, a training algorithm for a visual question-answer neural network model is implemented based on the structure of the LLaVA 1.5 neural network model using the Mistral 7b text encoder, which allows improving the model’s performance in the task of visual question-answer modeling and the LoRA low-rank adaptation algorithm, which speeds up the model learning process . It is shown that the problem of question-answer modeling can be solved by neural network models using large language models, and a technique for accelerating the training of such models is described. The effectiveness of the algorithmic model is assessed and general aspects of training question-answer models on the most popular sets of question-answer data are shown.
URI: https://libeldoc.bsuir.by/handle/123456789/54881
Appears in Collections:BIG DATA and Advanced Analytics = BIG DATA и анализ высокого уровня : сборник научных статей : в 2 ч. (2024)

Files in This Item:
File Description SizeFormat 
Demidova_Training.pdf1.32 MBAdobe PDFView/Open
Show full item record Google Scholar

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.