Skip navigation
Please use this identifier to cite or link to this item: https://libeldoc.bsuir.by/handle/123456789/34660
Title: Analysis of Semantic Probabilistic Inference Control Method in Multiagent Foraging Task
Other Titles: Анализ метода управления на основе семантического вероятностного вывода в многоагентной задаче фуражировки
Authors: Vorobiev, V.
Rovbo, M.
Воробьев, В. В.
Ровбо, М. А.
Keywords: материалы конференций
adaptive control
robotics
semantic probabilistic inference
foraging
local interaction
Issue Date: 2019
Publisher: БГУИР
Citation: Vorobiev, V. Analysis of Semantic Probabilistic Inference Control Method in Multiagent Foraging Task / V. Vorobiev, M. Rovbo // Открытые семантические технологии проектирования интеллектуальных систем = Open Semantic Technologies for Intelligent Systems (OSTIS-2019) : материалы международной научно-технической конференции, Минск, 21 - 23 февраля 2019 г. / Белорусский государственный университет информатики и радиоэлектроники; редкол.: В. В. Голенков (гл. ред.) [и др.]. - Минск, 2019. - С. 237 - 242.
Abstract: Adaptation in robotics systems is often implemented as some form of learning. While much research is dedicated to studying policy and value approximation in reinforcement learning, some methods are based on rule inference and logical descriptions. One of these methods is based on a semantic probabilistic inference algorithm that has its roots in the theory of functional systems. In this article, the method is applied to a distributed multiagent foraging problem that has an important property of providing an environment that allows to study a decentralized system of individually learning agents. We compare the performance of this method to other methods: Q-learning and a random choice algorithm as a baseline. We also propose a modification of the algorithm that includes an exploration behavior. Experiments are carried out in a computer simulation system. The results show the performance of the algorithms with different parameters, as well as the effect of exploration on the performance. Адаптация в робототехнических системах часто представляет собой какую-либо форму обучения. Хотя многие исследования посвящены изучению приближения стратегии и функции полезности в обучении с подкреплением, некоторые методы основываются на выводе правил и логическом описании. Один из них основан на алгоритме семантического вероятностного вывода, который имеет корни в теории функциональных систем. В этой статье метод применяется к распределенной многоагентной проблеме фуражировки, которая имеет важное свойство в виде среды, позволяющей изучать децентрализованную систему индивидуально обучающихся агентов. Мы сравниваем эффективность этого метода с другими: Q-обучения и алгоритма случайного выбора в качестве основы сравнения. Мы также предлагаем модификацию алгоритма, включающую исследовательское поведение. Эксперименты проведвены в системе компьютерного моделирования. Результаты показывают эффективность работы алгоритмов для различных параметров, а также влияние исследовательского поведения.
URI: https://libeldoc.bsuir.by/handle/123456789/34660
Appears in Collections:OSTIS-2019

Files in This Item:
File Description SizeFormat 
Vorobiev_Analysis.PDF197,22 kBAdobe PDFView/Open
Show full item record


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.