<acronym id="yasao"></acronym><object id="yasao"></object><sup id="yasao"></sup>
<acronym id="yasao"></acronym>
<sup id="yasao"></sup><sup id="yasao"></sup>
<acronym id="yasao"><center id="yasao"></center></acronym>
<acronym id="yasao"><center id="yasao"></center></acronym>
<acronym id="yasao"><center id="yasao"></center></acronym>

學術講座

首頁 > 通知動態  > 學術講座
2020年10月23日學術報告(柯良軍 教授 西安交通大學)
2020年10月22日10時 人評論

報告題目:基于深度強化學習的無人機集群攻防對抗問題研究

報告時間:20201023日(周五)上午8:30

報告地點:計算機學院B404會議室

報告人:柯良軍 

報告人單位:西安交通大學

報告人簡介: 

柯良軍,西安交通大學自動化學院教授、博士生導師,西安交通大學智能感知與決策研究中心主任,中國仿真學會智能仿真優化與調度專委會委員, 中國自動化學會無人飛行器自主控制專委會委員,《控制理論與應用》編委,出版著作《強化學習》、《蟻群智能優化方法及其應用》。

報告摘要 

本報告考慮一類博弈對抗問題-無人機集群攻防對抗問題。提出了一種新的多智能體強化學習(MARL)算法-協同深度確定性策略梯度(CODDPG),該算法具有以下特點:它采用Actor-Critic框架,Agent共享一個公共網絡。此外,還考慮了無人機之間的合作。為了使其適用于大規模問題,采用平均場理論(MFT),提出了一種新的局部狀態表示和獎勵分配方法。此外,CODDPG有一種新的網絡結構,它考慮了當前狀態下可執行的動作。最后,該算法采用集中訓練和分散執行的框架。這樣,每個代理只要依靠其局部觀察來做出決策。為研究該算法,設計了一個考慮飛行約束和真實無人機環境的大規模無人機群對抗平臺。實驗結果表明,在仿真平臺上,CODDPG算法的性能優于其他幾種主流的MARL算法。

 

邀請人:陳曦 教授、王峰 副教授


版權所有 ?武漢大學計算機學院 | copyright ? 2008-2020 School of Computer Science, Wuhan University. All Rights Reserved.

十一运夺金