亚洲日韩久久|国偷自产一区二区三区蜜臀国|国产一区二区日韩|99热这里只亚洲无码,无码

蘇州醫(yī)工所董建飛課題組在數(shù)據(jù)驅(qū)動的學(xué)習(xí)控制方面取得研究進展

日期:2022-03-18 作者:張云楚閱讀:1004
核心提示:隨著機器學(xué)習(xí)技術(shù)的飛速發(fā)展,各種學(xué)習(xí)方法被提出并成功應(yīng)用于圖像識別、學(xué)習(xí)控制等領(lǐng)域。其中,學(xué)習(xí)控制的典型方法包括迭代學(xué)習(xí)
 隨著機器學(xué)習(xí)技術(shù)的飛速發(fā)展,各種學(xué)習(xí)方法被提出并成功應(yīng)用于圖像識別、學(xué)習(xí)控制等領(lǐng)域。其中,學(xué)習(xí)控制的典型方法包括迭代學(xué)習(xí)控制(ILC)、高斯混合學(xué)習(xí)控制、強化學(xué)習(xí)控制等。比如,迭代學(xué)習(xí)控制方法常被用于控制許多批處理模式的動態(tài)過程,并已被成功應(yīng)用于化工生產(chǎn)和工業(yè)機器人等。然而,理論界之前尚未研究這種控制方法針對從數(shù)據(jù)中獲取的參數(shù)的隨機誤差的魯棒收斂性問題。
 
在其經(jīng)典理論中,迭代學(xué)習(xí)控制基于一個有限維的輸出信號預(yù)測方程來計算每一次迭代的輸出信號軌跡,其中的參數(shù)矩陣是由系統(tǒng)的有限沖擊響應(yīng)系數(shù)(即馬爾可夫參數(shù))決定的。傳統(tǒng)的方法需要根據(jù)系統(tǒng)的狀態(tài)空間模型或傳遞函數(shù)來計算這些馬爾可夫參數(shù)。當(dāng)參數(shù)中存在不確定性時,魯棒迭代學(xué)習(xí)控制方法首先需要對這些參數(shù)的不確定性進行建模,或者建立包絡(luò)其不確定域的凸集;進而根據(jù)經(jīng)典的魯棒控制方法(如H無窮控制)分析其魯棒單調(diào)收斂性(robust monotonic convergence,簡寫為RMC)。盡管文獻中已經(jīng)報道了不少基于模型的魯棒ILC設(shè)計方法,并證明了其RMC特性,但尚無針對系統(tǒng)辨識得到的參數(shù)中的隨機誤差進行魯棒設(shè)計的方法研究。
 
針對這一問題,董建飛研究員提出了一種數(shù)據(jù)驅(qū)動的方法,即從系統(tǒng)的輸入輸出數(shù)據(jù)中辨識馬爾可夫參數(shù)(即從數(shù)據(jù)中估計的系統(tǒng)的輸出相對于輸入信號的梯度信息),進而基于這些估計的參數(shù)構(gòu)造ILC的輸出預(yù)測方程。根據(jù)該方程參數(shù)矩陣的Toeplitz結(jié)構(gòu),分析并推出了隨機參數(shù)誤差與預(yù)測輸出信號序列的關(guān)系;推出了隨機不確定的閉環(huán)ILC學(xué)習(xí)矩陣與其自身轉(zhuǎn)置乘積在數(shù)學(xué)期望意義上的解析表達式;并進而得出了均方差意義上的、保證數(shù)據(jù)驅(qū)動ILC方法對隨機參數(shù)具有魯棒單調(diào)收斂性的充分條件,及其線性矩陣不等式(LMI)設(shè)計方法。該方法首先基于LTI系統(tǒng)研究得出,并被進一步推廣到了非線性的Hammerstein-Wiener系統(tǒng)。圖1為該ILC方法的原理框圖。圖2為該方應(yīng)用于控制一種非線性的酸堿中和反應(yīng)過程(pH neutralization process)的結(jié)果。由圖2可見,該方法既可確保閉環(huán)控制的穩(wěn)定性,又可以顯著提高控制的精度。
圖1 數(shù)據(jù)驅(qū)動迭代學(xué)習(xí)控制的原理框圖
圖2 數(shù)據(jù)驅(qū)動迭代學(xué)習(xí)控制算法應(yīng)用于控制一種非線性的酸堿中和反應(yīng)過程(pH neutralization process)的結(jié)果。其中robust ILC和nominal ILC分別為考慮或不考慮參數(shù)隨機誤差的魯棒ILC算法的結(jié)果。
 
上述研究成果已發(fā)表于控制論和人工智能頂刊IEEE Transactions on Cybernetics(中科院一區(qū),影響因子11.448)。
 
論文鏈接:https://ieeexplore.ieee.org/abstract/document/9523579
 
該研究受到國家自然科學(xué)基金面上項目的資助(F030110:數(shù)據(jù)驅(qū)動控制)。在該項目中,董建飛課題組近年來已開展了兩個方向的數(shù)據(jù)驅(qū)動學(xué)習(xí)技術(shù)研究:數(shù)據(jù)驅(qū)動的迭代學(xué)習(xí)控制理論研究、以及基于深度學(xué)習(xí)和卷積神經(jīng)網(wǎng)絡(luò)的圖像數(shù)據(jù)建模的研究。課題組未來計劃將深度學(xué)習(xí)與數(shù)據(jù)驅(qū)動控制技術(shù)結(jié)合起來,繼續(xù)研究數(shù)據(jù)驅(qū)動的強化學(xué)習(xí)控制、及其在生物系統(tǒng)與光機電系統(tǒng)中的應(yīng)用。

文章來源:中國科學(xué)院蘇州生物醫(yī)學(xué)工程技術(shù)研究所
打賞
聯(lián)系客服 投訴反饋  頂部