Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс:
https://dspace.ncfu.ru/handle/20.500.12258/22748Полная запись метаданных
| Поле DC | Значение | Язык |
|---|---|---|
| dc.contributor.author | Petrenko, V. I. | - |
| dc.contributor.author | Петренко, В. И. | - |
| dc.contributor.author | Tebueva, F. B. | - |
| dc.contributor.author | Тебуева, Ф. Б. | - |
| dc.contributor.author | Gurchinsky, M. M. | - |
| dc.contributor.author | Гурчинский, М. М. | - |
| dc.contributor.author | Pavlov, A. S. | - |
| dc.contributor.author | Павлов, А. С. | - |
| dc.date.accessioned | 2023-02-22T11:50:01Z | - |
| dc.date.available | 2023-02-22T11:50:01Z | - |
| dc.date.issued | 2022 | - |
| dc.identifier.citation | Petrenko, V.I., Tebueva, F.B., Gurchinsky, M.M., Pavlov, A.S. Method of Multi-Agent Reinforcement Learning in Systems with a Variable Number of Agents // Mekhatronika, Avtomatizatsiya, Upravlenie. - 2022. - 23 (10). - 507-514. (In Russ.) - DOI: 10.17587/mau.23.507-514 | ru |
| dc.identifier.uri | http://hdl.handle.net/20.500.12258/22748 | - |
| dc.description.abstract | Методы мультиагентного обучения с подкреплением являются одним из новейших и активно развивающихся направлений машинного обучения. Среди методов мультиагентного обучения с подкреплением одним из наиболее перспективных является метод MADDPG, достоинством которого является высокая сходимость процесса обучения. Недостатком метода MADDPG является необходимость обеспечения равенства числа агентов N на стадии обучения и числа агентов K на стадии функционирования. В то же время целевые мультиагентные системы (МАС), такие как группы БПЛА или мобильных наземных роботов, являются системами с переменным числом агентов, что не позволяет применять в них метод MADDPG. Для решения данной проблемы в статье предложен усовершенствованный метод MADDPG для мультиагентного обучения с подкреплением в системах с переменным числом агентов. Усовершенствованный метод MADDPG базируется на гипотезе о том, что для выполнения своих функций агенту нужна информация о состоянии не всех прочих агентов МАС, а только нескольких ближайших соседей. На основе данной гипотезы предложен метод гибридного совместного/независимого обучения МАС с переменным числом агентов, который предполагает обучение некоторого небольшого числа агентов N для обеспечения функционирования произвольного числа агентов K, K > N. Проведенные эксперименты показали, что усовершенствованный метод MADDPG обеспечивает сопоставимую с оригинальным методом эффективность функционирования МАС при варьировании числа K агентов на стадии функционирования в широких пределах. | ru |
| dc.language.iso | ru | ru |
| dc.relation.ispartofseries | Mekhatronika, Avtomatizatsiya, Upravlenie | - |
| dc.subject | Мультиагентное обучение с подкреплением | ru |
| dc.subject | Переменное число агентов | ru |
| dc.subject | Мультиагентные системы | ru |
| dc.subject | Машинное обучение | ru |
| dc.subject | Независимое обучение | ru |
| dc.subject | Совместное обучение | ru |
| dc.title | Method of Multi-Agent Reinforcement Learning in Systems with a Variable Number of Agents | ru |
| dc.type | Статья | ru |
| vkr.inst | Институт цифрового развития | ru |
| Располагается в коллекциях: | Статьи, проиндексированные в SCOPUS, WOS | |
Файлы этого ресурса:
| Файл | Размер | Формат | |
|---|---|---|---|
| scopusresults 2493 .pdf Доступ ограничен | 114.41 kB | Adobe PDF | Просмотреть/Открыть |
Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.