亚洲日韩久久|国偷自产一区二区三区蜜臀国|国产一区二区日韩|99热这里只亚洲无码,无码

蘇州醫(yī)工所董建飛課題組在數(shù)據(jù)驅(qū)動(dòng)的學(xué)習(xí)控制方面取得研究進(jìn)展

日期:2022-03-18 作者:張?jiān)瞥?/span>閱讀:1004
核心提示:隨著機(jī)器學(xué)習(xí)技術(shù)的飛速發(fā)展,各種學(xué)習(xí)方法被提出并成功應(yīng)用于圖像識(shí)別、學(xué)習(xí)控制等領(lǐng)域。其中,學(xué)習(xí)控制的典型方法包括迭代學(xué)習(xí)
 隨著機(jī)器學(xué)習(xí)技術(shù)的飛速發(fā)展,各種學(xué)習(xí)方法被提出并成功應(yīng)用于圖像識(shí)別、學(xué)習(xí)控制等領(lǐng)域。其中,學(xué)習(xí)控制的典型方法包括迭代學(xué)習(xí)控制(ILC)、高斯混合學(xué)習(xí)控制、強(qiáng)化學(xué)習(xí)控制等。比如,迭代學(xué)習(xí)控制方法常被用于控制許多批處理模式的動(dòng)態(tài)過(guò)程,并已被成功應(yīng)用于化工生產(chǎn)和工業(yè)機(jī)器人等。然而,理論界之前尚未研究這種控制方法針對(duì)從數(shù)據(jù)中獲取的參數(shù)的隨機(jī)誤差的魯棒收斂性問(wèn)題。
 
在其經(jīng)典理論中,迭代學(xué)習(xí)控制基于一個(gè)有限維的輸出信號(hào)預(yù)測(cè)方程來(lái)計(jì)算每一次迭代的輸出信號(hào)軌跡,其中的參數(shù)矩陣是由系統(tǒng)的有限沖擊響應(yīng)系數(shù)(即馬爾可夫參數(shù))決定的。傳統(tǒng)的方法需要根據(jù)系統(tǒng)的狀態(tài)空間模型或傳遞函數(shù)來(lái)計(jì)算這些馬爾可夫參數(shù)。當(dāng)參數(shù)中存在不確定性時(shí),魯棒迭代學(xué)習(xí)控制方法首先需要對(duì)這些參數(shù)的不確定性進(jìn)行建模,或者建立包絡(luò)其不確定域的凸集;進(jìn)而根據(jù)經(jīng)典的魯棒控制方法(如H無(wú)窮控制)分析其魯棒單調(diào)收斂性(robust monotonic convergence,簡(jiǎn)寫(xiě)為RMC)。盡管文獻(xiàn)中已經(jīng)報(bào)道了不少基于模型的魯棒ILC設(shè)計(jì)方法,并證明了其RMC特性,但尚無(wú)針對(duì)系統(tǒng)辨識(shí)得到的參數(shù)中的隨機(jī)誤差進(jìn)行魯棒設(shè)計(jì)的方法研究。
 
針對(duì)這一問(wèn)題,董建飛研究員提出了一種數(shù)據(jù)驅(qū)動(dòng)的方法,即從系統(tǒng)的輸入輸出數(shù)據(jù)中辨識(shí)馬爾可夫參數(shù)(即從數(shù)據(jù)中估計(jì)的系統(tǒng)的輸出相對(duì)于輸入信號(hào)的梯度信息),進(jìn)而基于這些估計(jì)的參數(shù)構(gòu)造ILC的輸出預(yù)測(cè)方程。根據(jù)該方程參數(shù)矩陣的Toeplitz結(jié)構(gòu),分析并推出了隨機(jī)參數(shù)誤差與預(yù)測(cè)輸出信號(hào)序列的關(guān)系;推出了隨機(jī)不確定的閉環(huán)ILC學(xué)習(xí)矩陣與其自身轉(zhuǎn)置乘積在數(shù)學(xué)期望意義上的解析表達(dá)式;并進(jìn)而得出了均方差意義上的、保證數(shù)據(jù)驅(qū)動(dòng)ILC方法對(duì)隨機(jī)參數(shù)具有魯棒單調(diào)收斂性的充分條件,及其線(xiàn)性矩陣不等式(LMI)設(shè)計(jì)方法。該方法首先基于LTI系統(tǒng)研究得出,并被進(jìn)一步推廣到了非線(xiàn)性的Hammerstein-Wiener系統(tǒng)。圖1為該ILC方法的原理框圖。圖2為該方應(yīng)用于控制一種非線(xiàn)性的酸堿中和反應(yīng)過(guò)程(pH neutralization process)的結(jié)果。由圖2可見(jiàn),該方法既可確保閉環(huán)控制的穩(wěn)定性,又可以顯著提高控制的精度。
圖1 數(shù)據(jù)驅(qū)動(dòng)迭代學(xué)習(xí)控制的原理框圖
圖2 數(shù)據(jù)驅(qū)動(dòng)迭代學(xué)習(xí)控制算法應(yīng)用于控制一種非線(xiàn)性的酸堿中和反應(yīng)過(guò)程(pH neutralization process)的結(jié)果。其中robust ILC和nominal ILC分別為考慮或不考慮參數(shù)隨機(jī)誤差的魯棒ILC算法的結(jié)果。
 
上述研究成果已發(fā)表于控制論和人工智能頂刊IEEE Transactions on Cybernetics(中科院一區(qū),影響因子11.448)。
 
論文鏈接:https://ieeexplore.ieee.org/abstract/document/9523579
 
該研究受到國(guó)家自然科學(xué)基金面上項(xiàng)目的資助(F030110:數(shù)據(jù)驅(qū)動(dòng)控制)。在該項(xiàng)目中,董建飛課題組近年來(lái)已開(kāi)展了兩個(gè)方向的數(shù)據(jù)驅(qū)動(dòng)學(xué)習(xí)技術(shù)研究:數(shù)據(jù)驅(qū)動(dòng)的迭代學(xué)習(xí)控制理論研究、以及基于深度學(xué)習(xí)和卷積神經(jīng)網(wǎng)絡(luò)的圖像數(shù)據(jù)建模的研究。課題組未來(lái)計(jì)劃將深度學(xué)習(xí)與數(shù)據(jù)驅(qū)動(dòng)控制技術(shù)結(jié)合起來(lái),繼續(xù)研究數(shù)據(jù)驅(qū)動(dòng)的強(qiáng)化學(xué)習(xí)控制、及其在生物系統(tǒng)與光機(jī)電系統(tǒng)中的應(yīng)用。

文章來(lái)源:中國(guó)科學(xué)院蘇州生物醫(yī)學(xué)工程技術(shù)研究所
打賞
聯(lián)系客服 投訴反饋  頂部