Skip navigation
Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: https://libeldoc.bsuir.by/handle/123456789/34660
Название: Analysis of Semantic Probabilistic Inference Control Method in Multiagent Foraging Task
Другие названия: Анализ метода управления на основе семантического вероятностного вывода в многоагентной задаче фуражировки
Авторы: Vorobiev, V.
Rovbo, M.
Ключевые слова: материалы конференций;adaptive control;robotics;semantic probabilistic inference;foraging;local interaction
Дата публикации: 2019
Издательство: БГУИР
Описание: Vorobiev, V. Analysis of Semantic Probabilistic Inference Control Method in Multiagent Foraging Task / V. Vorobiev, M. Rovbo // Открытые семантические технологии проектирования интеллектуальных систем = Open Semantic Technologies for Intelligent Systems (OSTIS-2019) : материалы международной научно-технической конференции, Минск, 21 - 23 февраля 2019 г. / Белорусский государственный университет информатики и радиоэлектроники; редкол.: В. В. Голенков (гл. ред.) [и др.]. - Минск, 2019. - С. 237 - 242.
Аннотация: Adaptation in robotics systems is often implemented as some form of learning. While much research is dedicated to studying policy and value approximation in reinforcement learning, some methods are based on rule inference and logical descriptions. One of these methods is based on a semantic probabilistic inference algorithm that has its roots in the theory of functional systems. In this article, the method is applied to a distributed multiagent foraging problem that has an important property of providing an environment that allows to study a decentralized system of individually learning agents. We compare the performance of this method to other methods: Q-learning and a random choice algorithm as a baseline. We also propose a modification of the algorithm that includes an exploration behavior. Experiments are carried out in a computer simulation system. The results show the performance of the algorithms with different parameters, as well as the effect of exploration on the performance.
Аннотация на другом языке: Адаптация в робототехнических системах часто представляет собой какую-либо форму обучения. Хотя многие исследования посвящены изучению приближения стратегии и функции полезности в обучении с подкреплением, некоторые методы основываются на выводе правил и логическом описании. Один из них основан на алгоритме семантического вероятностного вывода, который имеет корни в теории функциональных систем. В этой статье метод применяется к распределенной многоагентной проблеме фуражировки, которая имеет важное свойство в виде среды, позволяющей изучать децентрализованную систему индивидуально обучающихся агентов. Мы сравниваем эффективность этого метода с другими: Q-обучения и алгоритма случайного выбора в качестве основы сравнения. Мы также предлагаем модификацию алгоритма, включающую исследовательское поведение. Эксперименты проведвены в системе компьютерного моделирования. Результаты показывают эффективность работы алгоритмов для различных параметров, а также влияние исследовательского поведения.
URI: https://libeldoc.bsuir.by/handle/123456789/34660
Располагается в коллекциях:OSTIS-2019

Файлы этого ресурса:
Файл Описание РазмерФормат 
Vorobiev_Analysis.PDF197.22 kBAdobe PDFОткрыть
Показать полное описание Просмотр статистики Google Scholar

Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.