Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: https://dspace.ncfu.ru/handle/20.500.12258/22748
Полная запись метаданных
Поле DCЗначениеЯзык
dc.contributor.authorPetrenko, V. I.-
dc.contributor.authorПетренко, В. И.-
dc.contributor.authorTebueva, F. B.-
dc.contributor.authorТебуева, Ф. Б.-
dc.contributor.authorGurchinsky, M. M.-
dc.contributor.authorГурчинский, М. М.-
dc.contributor.authorPavlov, A. S.-
dc.contributor.authorПавлов, А. С.-
dc.date.accessioned2023-02-22T11:50:01Z-
dc.date.available2023-02-22T11:50:01Z-
dc.date.issued2022-
dc.identifier.citationPetrenko, V.I., Tebueva, F.B., Gurchinsky, M.M., Pavlov, A.S. Method of Multi-Agent Reinforcement Learning in Systems with a Variable Number of Agents // Mekhatronika, Avtomatizatsiya, Upravlenie. - 2022. - 23 (10). - 507-514. (In Russ.) - DOI: 10.17587/mau.23.507-514ru
dc.identifier.urihttp://hdl.handle.net/20.500.12258/22748-
dc.description.abstractМетоды мультиагентного обучения с подкреплением являются одним из новейших и активно развивающихся направлений машинного обучения. Среди методов мультиагентного обучения с подкреплением одним из наиболее перспективных является метод MADDPG, достоинством которого является высокая сходимость процесса обучения. Недостатком метода MADDPG является необходимость обеспечения равенства числа агентов N на стадии обучения и числа агентов K на стадии функционирования. В то же время целевые мультиагентные системы (МАС), такие как группы БПЛА или мобильных наземных роботов, являются системами с переменным числом агентов, что не позволяет применять в них метод MADDPG. Для решения данной проблемы в статье предложен усовершенствованный метод MADDPG для мультиагентного обучения с подкреплением в системах с переменным числом агентов. Усовершенствованный метод MADDPG базируется на гипотезе о том, что для выполнения своих функций агенту нужна информация о состоянии не всех прочих агентов МАС, а только нескольких ближайших соседей. На основе данной гипотезы предложен метод гибридного совместного/независимого обучения МАС с переменным числом агентов, который предполагает обучение некоторого небольшого числа агентов N для обеспечения функционирования произвольного числа агентов K, K > N. Проведенные эксперименты показали, что усовершенствованный метод MADDPG обеспечивает сопоставимую с оригинальным методом эффективность функционирования МАС при варьировании числа K агентов на стадии функционирования в широких пределах.ru
dc.language.isoruru
dc.relation.ispartofseriesMekhatronika, Avtomatizatsiya, Upravlenie-
dc.subjectМультиагентное обучение с подкреплениемru
dc.subjectПеременное число агентовru
dc.subjectМультиагентные системыru
dc.subjectМашинное обучениеru
dc.subjectНезависимое обучениеru
dc.subjectСовместное обучениеru
dc.titleMethod of Multi-Agent Reinforcement Learning in Systems with a Variable Number of Agentsru
dc.typeСтатьяru
vkr.instИнститут цифрового развитияru
Располагается в коллекциях:Статьи, проиндексированные в SCOPUS, WOS

Файлы этого ресурса:
Файл РазмерФормат 
scopusresults 2493 .pdf
  Доступ ограничен
114.41 kBAdobe PDFПросмотреть/Открыть


Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.