Adaptive distributed convex optimization for multi-agent systems

(1)

学学学校校校编编编码码码：：：10384 学学学号号号：：：23220141153324 分分分类类类号号号密密密级级级 UDC

硕

硕士

士

士学

学

学位

位

位论

论

论文

文

多

多智

智

智能

能

能体

体

体的

的

的自

自

自适

适

适应

应

应分

分布

分

布

布式

式

式凸

凸

凸优

优

优化

化

化算

算

算法

法

法研

研

研究

究

Adaptive distributed convex optimization for multi-agent

systems

黄骜哲

指导教师姓名：

兰维瑶

教授

专业名称：

控制理论与控制工程

论文提交日期：

2 0 1 7

年

月

论文答辩时间：

2 0 1 7

年

月

学位授予日期：

2 0 1 7

年

月

答辩委员会主席：

评

阅

人：

2017 年

年

月

厦门大学博硕士论文摘要库

(2)

(3)

厦

厦门

门

门大

大

大学

学

学学

学

学位

位

位论

论

论文

文

文原

原

原创

创

创性

性

性声

声

声明

明

本人呈交的学位论文是本人在导师指导下,独立完成的研究成

果。本人在论文写作中参考其他个人或集体已经发表的研究成果，

均在文中以适当方式明确标明，并符合法律规范和《厦门大学研究

生学术活动规范（试行）》。

另外，该学位论文为（

）课题（组）

的研究成果，获得（

）课题（组）经费或实验室

的资助，在（

）实验室完成。（请在以上括号内填

写课题或课题组负责人或实验室名称，未有此项声明内容的，可以

不作特别声明。）

声明人（签名）：年月日

厦门大学博硕士论文摘要库

(4)

(5)

厦

厦门

门

门大

大

大学

学

学学

学

学位

位

位论

论

论文

文

文著

著

著作

作

作权

权

权使

使

使用

用

用声

声

声明

明

本人同意厦门大学根据《中华人民共和国学位条例暂行实施办

法》等规定保留和使用此学位论文，并向主管部门或其指定机构送交

学位论文（包括纸质版和电子版），允许学位论文进入厦门大学图书

馆及其数据库被查阅、借阅。本人同意厦门大学将学位论文加入全国

博士、硕士学位论文共建单位数据库进行检索，将学位论文的标题和

摘要汇编出版，采用影印、缩印或者其它方式合理复制学位论文。

　　本学位论文属于：

　　（

）1.经厦门大学保密委员会审查核定的保密学位论文，

于　　年　　月　　日解密，解密后适用上述授权。

　　（

）2.不保密，适用上述授权。

　　（请在以上相应括号内打“√”或填上相应内容。保密学位论文

应是已经厦门大学保密委员会审定过的学位论文，未经厦门大学保密

委员会审定的学位论文均为公开学位论文。此声明栏不填写的，默认

为公开学位论文，均适用上述授权。）

声明人（签名）：年月日

厦门大学博硕士论文摘要库

(6)

(7)

摘

摘要

要

近年来，多智能体系统受到越来越多的关注，如一致性控制，分布式编队控制和分布式优化等。其中，分布式优化在无线传感器网络，智能电网和机器学习等许多军事领域或民用领域具有广阔的应用前景。本文考虑了线性多智能体系统的分布式凸优化问题。系统的全局目标函数是每个智能体的局部目标函数之和，并且是严格凸的。智能体的目标是协同合作，最小化全局目标函数。我们提出了一个解决分布式凸优化问题的自适应算法，并且证明了使用该算法可以使智能体在达到状态值一致的情况下同时实现全局目标函数的最优化。值得注意的是，本文所提出的分布式优化算法中的控制增益是自适应的，因此不需要任何关于全局目标函数或通信拓扑图的全局信息。此外，我们研究了该算法在离散时间通信情况下的实现，并给出了保证算法收敛的通信时间间隔的上界。接着，我们给出了两个数值仿真例子，证明以上理论结果的正确性。另外，我们考虑了智能体动力学模型中的扰动项的影响，该扰动项可能来自于外部干扰、模型中的不确定性或建模误差。我们提出了一个基于神经网络的分布式凸优化算法，消除扰动项的影响，并证明了该算法可以保证智能体状态值的一致并优化全局目标函数。关键词：多智能体系统; 分布式凸优化; 自适应控制; 神经网络 I

厦门大学博硕士论文摘要库

(8)

(9)

Abstract

These years have witnessed a growing research interest in multi-agents systems, such as consensus control, distributed formation control, distributed optimization, etc. Due to its wide use in wireless sensor network, smart power grids, machine learning and so on, distributed optimization has been extensively studied. This article studies a general distributed convex optimization problem for a linear multi-agent system. The global objective function of the multi-agent system is strictly convex, and is defined by the sum of the local objective functions which only associated with each agents. The ob-jective of the agents are to collectively minimize the global obob-jective function. We provide an adaptive protocol to solve the distributed convex optimization problem and show that using the provided protocol, the agents can converge to a common state value which simultaneously optimizes the global objective function. It is worth mentioning that the control gains in the proposed protocol are designed in an adaptive way such that the global information on the objective functions and the network topology is not needed anymore. Moreover, we study the implementation of the protocol with discrete-time communication and provide an upper bound on the discrete-time interval that guarantees the convergence of the protocol. Then, two numerical examples are provided to veri-fy the above-mentioned results. In addition, we consider the perturbation term in the dynamics of the agents which could result from disturbances, uncertainties and mod-eling errors, etc. We propose a neural-network-based protocol for distributed convex optimization to eliminate the influence of the perturbation term in the dynamics. It is shown that using the neural-network-based protocol, the consensus and optimization of the agents will not be affected by the perturbation term.

Key Words: Multi-agent systems; distributed optimization; adaptive control; neu-ral network

III

(10)

(11)

目

录

摘

摘要

要

要 . . . .

I

第

第一

一

一章

章

章绪

绪

绪论

论

论 . . . 1

1.1 研研研究究究背背背景景景及及及意意意义义义 . . . 1 1.1.1 多智能体系统 . . . 1 1.1.2 分布式优化. . . 5 1.2 研研研究究究现现现状状状综综综述述述 . . . 6 1.3 本本本文文文主主主要要要贡贡贡献献献 . . . 8 1.4 论论论文文文结结结构构构 . . . 9

第

第二

二

二章

章

章预

预

预备

备

备知

知

知识

识

识 . . . 11

2.1 符符符号号号定定定义义义 . . . 11 2.2 图图图论论论 . . . 11 2.3 基基基本本本定定定义义义和和和引引引理理理 . . . 12 2.4 本本本章章章小小小结结结 . . . 15

第

第三

三

三章

章

章自

自

自适

适

适应

应

应分

分

分布

布

布式

式

式凸

凸

凸优

优

优化

化

化 . . . 17

3.1 问问问题题题描描描述述述 . . . 17 3.2 连连连续续续时时时间间间的的的自自自适适适应应应分分分布布布式式式凸凸凸优优优化化化算算算法法法 . . . 17 3.3 离离离散散散时时时间间间的的的自自自适适适应应应分分分布布布式式式凸凸凸优优优化化化算算算法法法 . . . 23 V

厦门大学博硕士论文摘要库

(12)

3.4 仿仿仿真真真 . . . 26 3.4.1 连续时间的自适应分布式凸优化算法 . . . 27 3.4.2 离散时间的自适应分布式凸优化算法 . . . 28 3.5 本本本章章章小小小结结结 . . . 28

第

第四

四

四章

章

章基

基于

基

于

于神

神

神经

经

经网

网

网络

络的

络

的

的分

分

分布

布

布式

式

式凸

凸

凸优

优

优化

化

化算

算

算法

法

法. . . 33

4.1 问问问题题题描描描述述述 . . . 33 4.2 神神神经经经网网网络络络 . . . 33 4.3 基基基于于于神神神经经经网网网络络络的的的分分分布布布式式式凸凸凸优优优化化化算算算法法法 . . . 35 4.4 仿仿仿真真真 . . . 39 4.5 本本本章章章小小小结结结 . . . 40

第

第五

五

五章

章

章总

总结

总

结

结与

与

与展

展

展望

望

望 . . . 43

5.1 总总总结结结 . . . 43 5.2 工工工作作作展展展望望望 . . . 43

参

参考

考

考文

文

文献

献

献 . . . 45

攻

攻读

读

读硕

硕

硕士

士

士期

期

期间

间

间发

发

发表

表

表的

的

的学

学

学术

术

术论

论

论文

文

文 . . . 50

致

致谢

谢

谢 . . . 51

VI

厦门大学博硕士论文摘要库

(13)

厦门大学博硕士论文摘要库

(15)

第

第一

一

一章

章

绪

绪论

论

1.1 研

研

研究

究

究背

背

背景

景

景及

及

及意

意

意义

义

1.1.1 多多多智智智能能能体体体系系系统统统传统的控制理论，针对单一系统进行控制，理论已相当成熟，并且发展出了很多控制方法，如PID控制，自适应控制，智能控制，鲁棒控制等。在过去的三十年间，对多个相互关联的系统的控制问题受到越来越多的关注。大到社交网络（如图1.1）、互联网，小到动物的集群（如图1.2）、机器人编队等，都可以看成是多个相互关联的系统。对这些相互关联的系统的研究和控制，形成了一个新兴的研究领域——多智能体系统（Multi-Agent System, MAS）。

图图图 1.1 社社社交交交网网网络络络（（（图图图片片片来来来源源源于于于网网网络络络）））多智能体系统是由多个具有一定智能的、有一定计算能力和通信能力，甚至可以自主运动的智能体（Agent）组成的集合。每个智能体具有以下的特点： • 有一定的感知能力，能通过传感器感知外界环境。 • 有一定的通信能力，能与其他智能体进行通信。 1

厦门大学博硕士论文摘要库

(16)

1.1 研究背景及意义图图图 1.2 动动动物物物集集集群群群（（（图图图片片片来来来源源源于于于网网网络络络））） • 有一定的计算能力，能通过传感器反馈的信息及通信获得的信息调整自己 的行为。 • 有一定的智能，能学习知识，适应新的环境。 在实际应用中，多智能体系统中的智能体可以是一套软件，也可以是无人机、机器人等硬件。通过智能体之间的通信以及对智能体的调度及控制，使之协同合作，形成一个整体，从而完成仅靠单个个体无法完成的复杂任务。对多智能体系统的研究从上个世纪八十年代开始，随后，该技术日益受到重视，到二十世纪末和二十一世纪初，多智能体系统已经是人工智能领域的前沿学科。由于多智能体系统使用分布式的算法，智能体仅仅依靠自身信息以及邻居结点的信息，无需依靠全局信息，能够实现控制目标，完成复杂的任务，所以多智能体系统具有成本低、适应性强、可靠性强、可扩展性强、鲁棒性强以及易维护等特点。由于以上的优点，多智能体系统在军事领域及民用领域得到广泛的应用，例如编队控制（如图1.3）、智能机器人控制、分布式并行计算、机器学习、网络自动化、交通控制等。对多智能体系统的控制有两种主要的方式：集中式和分布式。集中式的控制方法需要有一个中心节点，该节点能与其他所有节点通信，并能控制其他所有的节点。我们将控制策略作用于中心节点上，通过中心节点来控制整个系统。这其实是对传统的基于单一系统的控制方法的直接推广。与集中式控制不同，分布式控制方法不需要中心节点的存在，每个节点仅仅靠自身的信息以及邻居节点的信息，计算出相应的控制策略，实现控制目标。与集中式控制相比，分布式控制的适用范围更广，更适合实际使用场景，例如一些通信受限、 – 2 –

厦门大学博硕士论文摘要库

(17)

Degree papers are in the “Xiamen University Electronic Theses and Dissertations Database”. Full texts are available in the following ways:

1. If your library is a CALIS member libraries, please log on http://etd.calis.edu.cn/ and submit requests online, or consult the interlibrary loan department in your library.

2. For users of non-CALIS member libraries, please mail to [email protected] for delivery details.

Adaptive distributed convex optimization for multi-agent systems

硕

硕

硕 士

士

士 学

学

学 位

位

位 论

论

论 文

文

文

多

多

多智

智

智能

能

能体

体

体的

的

的自

自

自适

适

适应

应

应分

分布

分

布

布式

式

式凸

凸

凸优

优

优化

化

化算

算

算法

法

法研

研

研究

究

究

Adaptive distributed convex optimization for multi-agent

systems

黄 骜 哲

指导教师姓名：

兰 维 瑶

教 授

专 业 名 称：

控 制 理 论 与 控 制 工 程

论文提交日期：

2 0 1 7

年

月

论文答辩时间：

2 0 1 7

年

月

学位授予日期：

2 0 1 7

年

月

答辩委员会主席：

评

阅

人：

2017 年

年

年

月

月

硕士

士学

学位

位论

论文

黄骜哲

兰维瑶

教授

专业名称：

控制理论与控制工程