https://libeldoc.bsuir.by/handle/123456789/63532| Title: | Интеграция систем генерации на основе поиска и семантического кэширования для повышения достоверности предметно-ориентированных LLM |
| Other Titles: | Integration of search-based generation systems and semantic caching to increase the reliability of domain-oriented LLMS |
| Authors: | Шкрабов, А. В. Резников, Н. А. Дик, С. К. Бондарик, В. М. Ревинская, И. И. |
| Keywords: | материалы конференций;Big Data;информационные системы;большие языковые модели;генерация;дополненный поиск;галлюцинации нейросетей;распределенные базы данных;DRAG;MEGA-RAG;семантическое кэширование;графы знаний |
| Issue Date: | 2026 |
| Publisher: | БГУИР |
| Citation: | Интеграция систем генерации на основе поиска и семантического кэширования для повышения достоверности предметно-ориентированных LLM = Integration of search-based generation systems and semantic caching to increase the reliability of domain-oriented LLMS / А. В. Шкрабов, Н. А. Резников, С. К. Дик [и др.] // Big Data и анализ высокого уровня = Big Data and Advanced Analytics : сборник научных статей XII Международной научно-практической конференции, Республика Беларусь, Минск, 23 апреля 2026 года : в 2 ч. Ч. 1 / Белорусский государственный университет информатики и радиоэлектроники [и др.] ; редкол.: В. А. Богуш [и др.]. – Минск, 2026. – С. 289–298. |
| Abstract: | В статье приведено решение проблемы сокращения галлюцинаций больших языковых моделей (LLM) при работе с высоко нагруженными распределенными базами данных в архитектуре RAG. Анализируется влияние системных факторов (сетевых задержек, асинхронной консистентности, семантического шума) на фактологическую точность генерации. В качестве решения рассмотрены инновационные подходы: децентрализованная архитектура DRAG, многоисточниковая кросс-верификация MEGA-RAG на базе графов знаний, интеллектуальное семантическое кэширование и стратегии многофазного ранжирования. Установлено, что комплексное внедрение данных методов сводит к минимуму фактологическую манипуляцию, эффективно отсеивает «жесткие негативы» и оптимизирует баланс между барьером и скоростью вывода без ресурсоемкого дообучения модели. |
| Alternative abstract: | The paper discusses an approach to increasing the robustness of neural network models used in eye footage segmentation to typical image distortions using targeted data augmentation. Using the example of the winner of the OpenEDS Semantic Segmentation Challenge 2019 - the RitNet model (based on U-Net and DenseNet), it is shown how the addition of synthetic artifacts (structured starbursts, Gaussian blur, random lines and shifts), characteristic of images in VR / AR glasses, made it possible to achieve high accuracy with an extremely small model size. This approach emphasizes the importance of adapting training data to real-world application conditions to improve the reliability of models in computer vision tasks. |
| URI: | https://libeldoc.bsuir.by/handle/123456789/63532 |
| Appears in Collections: | BIG DATA and Advanced Analytics = BIG DATA и анализ высокого уровня : сборник научных статей : в 2 ч. (2026) |
| File | Description | Size | Format | |
|---|---|---|---|---|
| SHkrabov_Integraciya.pdf | 1.47 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.