Method of Multi-Agent Reinforcement Learning in Systems with a Variable Number of Agents

Petrenko, V. I.; Петренко, В. И.; Tebueva, F. B.; Тебуева, Ф. Б.; Gurchinsky, M. M.; Гурчинский, М. М.; Pavlov, A. S.; Павлов, А. С.

Please use this identifier to cite or link to this item: https://dspace.ncfu.ru/handle/20.500.12258/22748

Full metadata record

DC Field	Value	Language
dc.contributor.author	Petrenko, V. I.	-
dc.contributor.author	Петренко, В. И.	-
dc.contributor.author	Tebueva, F. B.	-
dc.contributor.author	Тебуева, Ф. Б.	-
dc.contributor.author	Gurchinsky, M. M.	-
dc.contributor.author	Гурчинский, М. М.	-
dc.contributor.author	Pavlov, A. S.	-
dc.contributor.author	Павлов, А. С.	-
dc.date.accessioned	2023-02-22T11:50:01Z	-
dc.date.available	2023-02-22T11:50:01Z	-
dc.date.issued	2022	-
dc.identifier.citation	Petrenko, V.I., Tebueva, F.B., Gurchinsky, M.M., Pavlov, A.S. Method of Multi-Agent Reinforcement Learning in Systems with a Variable Number of Agents // Mekhatronika, Avtomatizatsiya, Upravlenie. - 2022. - 23 (10). - 507-514. (In Russ.) - DOI: 10.17587/mau.23.507-514	ru
dc.identifier.uri	http://hdl.handle.net/20.500.12258/22748	-
dc.description.abstract	Методы мультиагентного обучения с подкреплением являются одним из новейших и активно развивающихся направлений машинного обучения. Среди методов мультиагентного обучения с подкреплением одним из наиболее перспективных является метод MADDPG, достоинством которого является высокая сходимость процесса обучения. Недостатком метода MADDPG является необходимость обеспечения равенства числа агентов N на стадии обучения и числа агентов K на стадии функционирования. В то же время целевые мультиагентные системы (МАС), такие как группы БПЛА или мобильных наземных роботов, являются системами с переменным числом агентов, что не позволяет применять в них метод MADDPG. Для решения данной проблемы в статье предложен усовершенствованный метод MADDPG для мультиагентного обучения с подкреплением в системах с переменным числом агентов. Усовершенствованный метод MADDPG базируется на гипотезе о том, что для выполнения своих функций агенту нужна информация о состоянии не всех прочих агентов МАС, а только нескольких ближайших соседей. На основе данной гипотезы предложен метод гибридного совместного/независимого обучения МАС с переменным числом агентов, который предполагает обучение некоторого небольшого числа агентов N для обеспечения функционирования произвольного числа агентов K, K > N. Проведенные эксперименты показали, что усовершенствованный метод MADDPG обеспечивает сопоставимую с оригинальным методом эффективность функционирования МАС при варьировании числа K агентов на стадии функционирования в широких пределах.	ru
dc.language.iso	ru	ru
dc.relation.ispartofseries	Mekhatronika, Avtomatizatsiya, Upravlenie	-
dc.subject	Мультиагентное обучение с подкреплением	ru
dc.subject	Переменное число агентов	ru
dc.subject	Мультиагентные системы	ru
dc.subject	Машинное обучение	ru
dc.subject	Независимое обучение	ru
dc.subject	Совместное обучение	ru
dc.title	Method of Multi-Agent Reinforcement Learning in Systems with a Variable Number of Agents	ru
dc.type	Статья	ru
vkr.inst	Институт цифрового развития	ru
Appears in Collections:	Статьи, проиндексированные в SCOPUS, WOS

Files in This Item:

File	Size	Format
scopusresults 2493 .pdf Restricted Access	114.41 kB	Adobe PDF	View/Open

Show simple item record

Репозиторий научных и учебно-методических публикаций

Северо-Кавказский федеральный университет