中文名 | 最優(yōu)控制理論 | 外文名 | optimal control theory |
---|---|---|---|
研究對(duì)象 | 控制系統(tǒng) | 應(yīng)????用 | 綜合和設(shè)計(jì)最速控制系統(tǒng) |
最優(yōu)控制的實(shí)現(xiàn)離不開最優(yōu)化技術(shù),最優(yōu)化技術(shù)是研究和解決最優(yōu)化問題的一門學(xué)科,它研究和解決如何從一切可能的方案中尋找最優(yōu)的方案。也就是說,最優(yōu)化技術(shù)是研究和解決如何將最優(yōu)化問題表示為數(shù)學(xué)模型以及如何根據(jù)數(shù)學(xué)模型盡快求出其最優(yōu)解這兩大問題。一般而言,用最優(yōu)化方法解決實(shí)際工程問題可分為三步進(jìn)行:
①根據(jù)所提出的最優(yōu)化問題,建立最優(yōu)化問題的數(shù)學(xué)模型,確定變量,列出約束條件和目標(biāo)函數(shù);
②對(duì)所建立的數(shù)學(xué)模型進(jìn)行具體分析和研究,選擇合適的最優(yōu)化方法;
③根據(jù)最優(yōu)化方法的算法列出程序框圖和編寫程序,用計(jì)算機(jī)求出最優(yōu)解,并對(duì)算法的收斂性、通用性、簡(jiǎn)便性、計(jì)算效率及誤差等作出評(píng)價(jià)。
這方面的開創(chuàng)性工作主要是由貝爾曼(R.E.Bellman)提出的動(dòng)態(tài)規(guī)劃和龐特里亞金等人提出的最大值原理。這方面的先期工作應(yīng)該追溯到維納(N.Wiener)等人奠基的控制論(Cybernetics)。1948年維納發(fā)表了題為《控制論—關(guān)于動(dòng)物和機(jī)器中控制與通訊的科學(xué)》的論文,第一次科學(xué)的提出了信息、反饋和控制的概念,為最優(yōu)控制理論的誕生和發(fā)展奠定了基礎(chǔ)。
為了解決最優(yōu)控制問題,必須建立描述受控運(yùn)動(dòng)過程的運(yùn)動(dòng)方程,給出控制變量的允許取值范圍,指定運(yùn)動(dòng)過程的初始狀態(tài)和目標(biāo)狀態(tài),并且規(guī)定一個(gè)評(píng)價(jià)運(yùn)動(dòng)過程品質(zhì)優(yōu)劣的性能指標(biāo)。通常,性能指標(biāo)的好壞取決于所選擇的控制函數(shù)和相應(yīng)的運(yùn)動(dòng)狀態(tài)。系統(tǒng)的運(yùn)動(dòng)狀態(tài)受到運(yùn)動(dòng)方程的約束,而控制函數(shù)只能在允許的范圍內(nèi)選取。因此,從數(shù)學(xué)上看,確定最優(yōu)控制問題可以表述為:在運(yùn)動(dòng)方程和允許控制范圍的約束下,對(duì)以控制函數(shù)和運(yùn)動(dòng)狀態(tài)為變量的性能指標(biāo)函數(shù)(稱為泛函)求取極值(極大值或極小值)。解決最優(yōu)控制問題的主要方法有古典變分法、極大值原理和動(dòng)態(tài)規(guī)劃。
研究對(duì)泛函求極值的一種數(shù)學(xué)方法。古典變分法只能用在控制變量的取值范圍不受限制的情況。在許多實(shí)際控制問題中,控制函數(shù)的取值常常受到封閉性的邊界限制,如方向舵只能在兩個(gè)極限值范圍內(nèi)轉(zhuǎn)動(dòng),電動(dòng)機(jī)的力矩只能在正負(fù)的最大值范圍內(nèi)產(chǎn)生等。因此,古典變分法對(duì)于解決許多重要的實(shí)際最優(yōu)控制問題,是無能為力的。
極大值原理,是分析力學(xué)中哈密頓方法的推廣。極大值原理的突出優(yōu)點(diǎn)是可用于控制變量受限制的情況,能給出問題中最優(yōu)控制所必須滿足的條件。
動(dòng)態(tài)規(guī)劃是數(shù)學(xué)規(guī)劃的一種,同樣可用于控制變量受限制的情況,是一種很適合于在計(jì)算機(jī)上進(jìn)行計(jì)算的比較有效的方法。
最優(yōu)控制理論已被應(yīng)用于最省燃料控制系統(tǒng)、最小能耗控制系統(tǒng)、線性調(diào)節(jié)器等。
地暖的選擇 1.長(zhǎng)期居住型 對(duì)于長(zhǎng)期居住的武漢裝修業(yè)主來說,家庭采暖時(shí)主要是從舒適和運(yùn)行成本來考慮。 2.不常住型 有些業(yè)主由于上班無規(guī)律,所以在家里居住的情況也不固定,這樣的情況家庭采暖需求要有明顯...
你好,三藏金蟾最優(yōu)價(jià)500左右。  ...
一般情況下,采用輕型擊實(shí)標(biāo)準(zhǔn)時(shí),土的最佳含水量對(duì)于黏性土約相當(dāng)于塑限的含水量;對(duì)于非黏性土則約相當(dāng)于液限含水量的0.65倍.詳細(xì)范圍值如下: 1、砂土:最佳含水量(按重量計(jì))%...
隨著現(xiàn)代控制理論及其實(shí)際應(yīng)用的不斷發(fā)展,運(yùn)用現(xiàn)代控制理論進(jìn)行電力系統(tǒng)運(yùn)行性能的最優(yōu)化控制的研究工作有了迅速的發(fā)展,對(duì)如何按最優(yōu)化的方法設(shè)計(jì)多參量的勵(lì)磁調(diào)節(jié)器也取得了很大進(jìn)展。
(1)基于非線性最優(yōu)和PID技術(shù)的綜合勵(lì)磁調(diào)節(jié)器
對(duì)于非線性系統(tǒng)的同步發(fā)電機(jī)而言,當(dāng)它偏離系統(tǒng)工作點(diǎn)或系統(tǒng)發(fā)生較大擾動(dòng)時(shí),如果仍然采用基于PID技術(shù)的電力系統(tǒng)穩(wěn)定器,就會(huì)出現(xiàn)誤差。為此,可以將其用基于非線性最優(yōu)控制技術(shù)的勵(lì)磁調(diào)節(jié)器。但是,非線性最優(yōu)控制調(diào)節(jié)器存在著對(duì)電壓控制能力較弱的缺點(diǎn),所以用一種能夠?qū)⒎蔷€性最優(yōu)勵(lì)磁調(diào)節(jié)器和PID技術(shù)的電力系統(tǒng)穩(wěn)定器有機(jī)結(jié)合的新型勵(lì)磁調(diào)節(jié)器的設(shè)計(jì)原理。
此綜合勵(lì)磁調(diào)節(jié)器是利用非線性最優(yōu)控制理論的研究成果,其在非線性的勵(lì)磁控制中采用了精確線性化的數(shù)學(xué)方法,不存在平衡點(diǎn)線性化后的舍入誤差,因此該控制的數(shù)學(xué)模型在理論上對(duì)發(fā)電機(jī)的所有運(yùn)行點(diǎn)都是精確的;同時(shí)針對(duì)非線性的勵(lì)磁控制調(diào)壓能力較弱的特點(diǎn),又增加了PID環(huán)節(jié),使其具有較強(qiáng)的電壓調(diào)節(jié)特性此裝置在小機(jī)組試驗(yàn)中取得非常好的實(shí)驗(yàn)效果,在平衡點(diǎn)附近運(yùn)行和偏離平衡點(diǎn)較多時(shí)都具有很好的調(diào)節(jié)特性。
(2)自適應(yīng)最優(yōu)勵(lì)磁控制器
將自適應(yīng)控制理論與最優(yōu)控制理論相結(jié)合,通過多變量參數(shù)辨識(shí)、最優(yōu)反饋系數(shù)計(jì)算和控制算法運(yùn)算三個(gè)環(huán)節(jié),可以實(shí)現(xiàn)同步發(fā)電機(jī)勵(lì)磁的自適應(yīng)最優(yōu)控制。
此發(fā)電機(jī)自適應(yīng)最優(yōu)勵(lì)磁方案,通過采用由帶可變遺忘因子的最小二乘算法構(gòu)成的多變量實(shí)時(shí)辨識(shí)器,使系統(tǒng)狀態(tài)方程的系數(shù)矩陣A和B中的元素值隨系統(tǒng)運(yùn)行工況的變化而變化,再經(jīng)過最優(yōu)反饋系數(shù)計(jì)算,實(shí)現(xiàn)了同步電機(jī)的自適應(yīng)最優(yōu)勵(lì)磁控制。
雖然使用線性最優(yōu)控制理論求取反饋系數(shù),但由于狀態(tài)方程的系數(shù)矩陣中的元素值隨系統(tǒng)運(yùn)行工況的變化而變化,因而控制作用體現(xiàn)了電力系統(tǒng)的非線性特性,本質(zhì)上是一種非線性控制。
數(shù)字仿真試驗(yàn)結(jié)果表明,該勵(lì)磁控制系統(tǒng)能夠自動(dòng)跟蹤系統(tǒng)運(yùn)行工作狀況,在線辨識(shí)不斷變化的系統(tǒng)參數(shù),使控制作用始終處于最優(yōu)狀態(tài)。從而改善了控制系統(tǒng)的動(dòng)態(tài)品質(zhì),可以提高電力系統(tǒng)運(yùn)行的穩(wěn)定性。
(3)基于神經(jīng)網(wǎng)絡(luò)逆系統(tǒng)方法的非線性勵(lì)磁控制
神經(jīng)網(wǎng)絡(luò)逆系統(tǒng)方法將神經(jīng)網(wǎng)絡(luò)對(duì)非線性函數(shù)逼近學(xué)習(xí)能力和逆系統(tǒng)方法的線性化能力相結(jié)合,構(gòu)造出物理可實(shí)現(xiàn)的神經(jīng)網(wǎng)絡(luò)逆系統(tǒng),從而實(shí)現(xiàn)了對(duì)被控系統(tǒng)的大范圍線性化,能夠在無需系統(tǒng)參數(shù)的情況下構(gòu)造出偽線性復(fù)合系統(tǒng),從而將非線性系統(tǒng)的控制問題轉(zhuǎn)化為線性系的控制問題。
在大干擾情況下,神經(jīng)網(wǎng)絡(luò)逆系統(tǒng)方法的控制器暫態(tài)時(shí)間很短,超調(diào)量很小,有效地改善了系統(tǒng)的暫態(tài)響應(yīng)品質(zhì),提高了電力系統(tǒng)的穩(wěn)定性,此控制器還具有很好的魯棒性能。另外,神經(jīng)網(wǎng)絡(luò)逆系統(tǒng)方法無需知道原系統(tǒng)的數(shù)學(xué)模型以及參數(shù),,也不需要測(cè)量被控系統(tǒng)的狀態(tài)量,僅需要知道被控系統(tǒng)可逆及輸入輸出微分方程的階數(shù),且結(jié)構(gòu)簡(jiǎn)單,易于工程實(shí)現(xiàn)。
(4)基于灰色預(yù)測(cè)控制算法的最優(yōu)勵(lì)磁控制
預(yù)測(cè)控制是一種計(jì)算機(jī)算法,它采用多步預(yù)測(cè)的方式增加了反映過程未來變化趨勢(shì)的信息量,因而能克服不確定性因素和復(fù)雜變化的影響?;疑A(yù)測(cè)控制是預(yù)測(cè)控制的一個(gè)分支,它需建立灰微分方程,能較好地對(duì)系統(tǒng)作全面的分析。應(yīng)用GM(1,N)對(duì)發(fā)電機(jī)的功率偏差、轉(zhuǎn)速偏差、電壓偏差序列值進(jìn)行建模,經(jīng)全面分析后求出各狀態(tài)量的預(yù)測(cè)值,同時(shí)根據(jù)最優(yōu)控制理論求出以預(yù)測(cè)值為狀態(tài)變量的被控勵(lì)磁控制系統(tǒng)的最優(yōu)反饋增益,從而得出具有預(yù)測(cè)信息的最優(yōu)勵(lì)磁控制量。
灰色預(yù)測(cè)控制理論中灰色建模和“超前控制”的思想較好地彌補(bǔ)了線性最優(yōu)控制理論中精確線性化和“事后控制”對(duì)單機(jī)無窮大系統(tǒng)的仿真結(jié)果表明,此勵(lì)磁控制具有響應(yīng)速度快、準(zhǔn)確度高的特點(diǎn),使電力系統(tǒng)在大小擾動(dòng)下均能表現(xiàn)出較好的動(dòng)態(tài)特性。
目前研究最優(yōu)控制理論最活躍的領(lǐng)域有神經(jīng)網(wǎng)絡(luò)優(yōu)化、模擬退火算法、趨化性算法、遺傳算法、魯棒控制、預(yù)測(cè)控制、混沌優(yōu)化控制以及穩(wěn)態(tài)遞階控制等。
(1)Hopfield 神經(jīng)網(wǎng)絡(luò)優(yōu)化
人工神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)一般基于專家的經(jīng)驗(yàn)和實(shí)踐。應(yīng)用最廣泛的是誤差反向傳播神經(jīng)網(wǎng)絡(luò),簡(jiǎn)稱BP網(wǎng)絡(luò),是一種具有3層或3層以上的階層型神經(jīng)網(wǎng)絡(luò)。根據(jù)神經(jīng)網(wǎng)絡(luò)理論,網(wǎng)絡(luò)總是朝著能量函數(shù)遞減的方向運(yùn)動(dòng),并最后到達(dá)系統(tǒng)的平衡點(diǎn)。也就是說:Hopfield能量函數(shù)的極小點(diǎn)就是系統(tǒng)穩(wěn)定的平衡點(diǎn),只要得到系統(tǒng)的平衡點(diǎn)即得到能量函數(shù)的極小點(diǎn)。如果把全局優(yōu)化理論運(yùn)用到控制系統(tǒng)中,則控制系統(tǒng)的目標(biāo)函數(shù)最終到達(dá)的正是所希望的最小點(diǎn)。
(2)模擬退火算法
1983年,Kirkpatrick與其合作者提出了模擬退火(SA)的方法,它是求解單目標(biāo)多變量最優(yōu)化問題的一項(xiàng)Monte-Caula技術(shù)。該法是一種物理過程的人工模擬,它基于液體結(jié)晶或金屬的退火過程。液體和金屬物體在加熱至一定溫度后,它們所有的分子、原子在狀態(tài)空間D中自由運(yùn)動(dòng)。隨著溫度的下降,這些分子、原子逐漸停留在不同的狀態(tài)。當(dāng)溫度降到相當(dāng)?shù)蜁r(shí),這些分子、原子則重新以一定的結(jié)構(gòu)排列,形成了一個(gè)全部由有序排列的原子構(gòu)成的晶體結(jié)構(gòu)。模擬退火法已廣泛應(yīng)用于生產(chǎn)調(diào)度、神經(jīng)網(wǎng)絡(luò)訓(xùn)練、圖像處理等方面。
(3)趨化性算法
趨化性算法(CA)是模擬細(xì)菌生長(zhǎng)過程中的趨光性原理而提出的一種隨機(jī)優(yōu)化方法。它的特點(diǎn)是結(jié)構(gòu)簡(jiǎn)單、使用方便。在搜索過程中,CA只向使解的性能變好的方向搜索,能否跳出局部極小點(diǎn)依賴于方差的大小,其全局搜索能力比模擬退火方法和遺傳算法差,但局部搜索能力較強(qiáng),收斂速度較快。
(4)遺傳算法
遺傳算法(GA)是一種模擬自然選擇和遺傳的隨機(jī)搜索算法,是模擬自然界中按“優(yōu)勝劣汰”法則進(jìn)行進(jìn)化過程的一種高度并行、隨機(jī)和自適應(yīng)的優(yōu)化算法。它將問題的求解表示成“染色體”的適者生存過程,通過“染色體”群的一代代不斷進(jìn)化,包括復(fù)制、交叉和變異等操作,最終收斂于“最適應(yīng)環(huán)境”的個(gè)體,從而求得問題的最優(yōu)解或滿意解。GA是一種通用的優(yōu)化算法,其編碼技術(shù)和遺傳操作比較簡(jiǎn)單,優(yōu)化不受限制型條件的約束,而其2個(gè)最顯著特點(diǎn)則是隱含并行性和全局解空間搜索。隨著計(jì)算機(jī)技術(shù)的發(fā)展,GA愈來愈得到人們的重視,并在機(jī)器學(xué)習(xí)、模式識(shí)別、圖像處理、神經(jīng)網(wǎng)絡(luò)、優(yōu)化控制、組合優(yōu)化、VLSI設(shè)計(jì)、遺傳學(xué)等領(lǐng)域得到了成功應(yīng)用。
(5)魯棒控制
魯棒控制是針對(duì)不確定性系統(tǒng)的控制系統(tǒng)的設(shè)計(jì)方法,其理論主要研究的問題是不確定性系統(tǒng)的描述方法、魯棒控制系統(tǒng)的分析和設(shè)計(jì)方法以及魯棒控制理論的應(yīng)用領(lǐng)域。魯棒控制理論發(fā)展的最突出的標(biāo)志之一是H∞控制。H∞控制從本質(zhì)上可以說是頻域內(nèi)的最優(yōu)控制理論。魯棒控制與最優(yōu)控制結(jié)合解決許多如線性二次型控制、電機(jī)調(diào)速、跟蹤控制、采樣控制、離散系統(tǒng)的鎮(zhèn)定、擾動(dòng)抑制等實(shí)際問題。
(6)預(yù)測(cè)控制
預(yù)測(cè)控制又稱為基于模型的控制,是一類新型計(jì)算機(jī)優(yōu)化控制算法,其本質(zhì)特征是預(yù)測(cè)模型,滾動(dòng)優(yōu)化和反饋校正。滾動(dòng)優(yōu)化反復(fù)在線進(jìn)行,不同時(shí)刻優(yōu)化性能指標(biāo)的時(shí)間區(qū)域及絕對(duì)形式均不同。這種滾動(dòng)優(yōu)化能對(duì)系統(tǒng)因多種因素而引起的不確定性進(jìn)行及時(shí)彌補(bǔ),始終把新的優(yōu)化建立在實(shí)際的基礎(chǔ)之上,使控制系統(tǒng)保持實(shí)際上的最優(yōu)。
(7)混沌優(yōu)化控制
混沌是一種普遍的非線性現(xiàn)象,是指在確定性非線性系統(tǒng)中不需附加任何隨機(jī)因素亦可出現(xiàn)類似隨機(jī)的行為,但存在精致的內(nèi)在規(guī)律性?;煦邕\(yùn)動(dòng)具有隨機(jī)性、遍歷性、規(guī)律性等特點(diǎn)?;煦邕\(yùn)動(dòng)的基本特征是運(yùn)動(dòng)軌道的不穩(wěn)定性,表現(xiàn)為對(duì)初值的敏感依賴性或?qū)π_動(dòng)的極端敏感性?;煦邕\(yùn)動(dòng)在一定的范圍內(nèi)按其自身的規(guī)律不重復(fù)地遍歷所有狀態(tài),這種遍歷性可被用來進(jìn)行優(yōu)化搜索且能避免陷入局部極小。因此,混沌優(yōu)化技術(shù)已成為一種新興的搜索優(yōu)化技術(shù)。
(8)穩(wěn)態(tài)遞階控制
遞階控制是一種計(jì)算機(jī)在線穩(wěn)態(tài)優(yōu)化的控制結(jié)構(gòu),其指導(dǎo)思想是將一大系統(tǒng)分解為若干個(gè)互相關(guān)聯(lián)的子系統(tǒng),即把大系統(tǒng)的最優(yōu)控制問題分解為各子系統(tǒng)的問題。在各個(gè)子系統(tǒng)之上設(shè)置一協(xié)調(diào)器,判斷所得的子系統(tǒng)求解子問題結(jié)果是否適合整個(gè)大系統(tǒng)的最優(yōu)控制,若否,則指示各子系統(tǒng)修改子問題并重新計(jì)算。通過協(xié)調(diào)器的相互迭代求解即可得到最優(yōu)解。
最優(yōu)控制理論在管理科學(xué)方面的應(yīng)用已取得了很多極有價(jià)值的應(yīng)用成果。其中代表性的是美國(guó)學(xué)者S.P.塞申和G.L.湯普生所著的《最優(yōu)化管理》一書 。書中概述了最優(yōu)控制理論在金融中的最優(yōu)投資、生產(chǎn)與庫存、推銷、機(jī)器設(shè)備的保養(yǎng)與更換等問題的應(yīng)用;在經(jīng)濟(jì)方面的應(yīng)用主要是根據(jù)宏觀經(jīng)濟(jì)相互依賴關(guān)系的計(jì)量經(jīng)濟(jì)模型提供經(jīng)濟(jì)預(yù)測(cè),解釋經(jīng)濟(jì)問題的動(dòng)態(tài)行為。朱道立編著的《大系統(tǒng)優(yōu)化理論與應(yīng)用》中運(yùn)用最優(yōu)控制理論建立經(jīng)濟(jì)模型,用GRG算法來解釋經(jīng)濟(jì)問題,形成經(jīng)濟(jì)學(xué)科中的經(jīng)濟(jì)最優(yōu)控制 。許多專家在研究動(dòng)態(tài)最優(yōu)穩(wěn)定性經(jīng)濟(jì)政策中也論證了最優(yōu)控制在經(jīng)濟(jì)方面的突出作用。在自然資源和人口方面可以應(yīng)用最優(yōu)控制理論來分配不可再生資源和可再生資源。此外,最優(yōu)控制在人才分配方面的應(yīng)用也有研究報(bào)道。
基于對(duì)象數(shù)學(xué)模型的離線優(yōu)化方法是一種理想化方法。這是因?yàn)楸M管工業(yè)過程(對(duì)象)被設(shè)計(jì)得按一定的正常工況連續(xù)運(yùn)行,但是環(huán)境的變動(dòng)、觸媒和設(shè)備的老化以及原料成分的變動(dòng)等因素形成了對(duì)工業(yè)過程的擾動(dòng),因此原來設(shè)計(jì)的工況條件就不是最優(yōu)的。
解決此類問題的常見方法。
(1)局部參數(shù)最優(yōu)化和整體最優(yōu)化設(shè)計(jì)方法
局部參數(shù)最優(yōu)化方法的基本思想是:按照參考模型和被控過程輸出之差來調(diào)整控制器可調(diào)參數(shù),使輸出誤差平方的積分達(dá)到最小。這樣可使被控過程和參考模型盡快地精確一致。
此外,靜態(tài)最優(yōu)與動(dòng)態(tài)最優(yōu)相結(jié)合,可變局部最優(yōu)為整體最優(yōu)。整體最優(yōu)由總體目標(biāo)函數(shù)體現(xiàn)。整體最優(yōu)由兩部分組成:一種是靜態(tài)最優(yōu)(或離線最優(yōu)),它的目標(biāo)函數(shù)在一段時(shí)間或一定范圍內(nèi)是不變的;另一種是動(dòng)態(tài)最優(yōu)(或在線最優(yōu)),它是指整個(gè)工業(yè)過程的最優(yōu)化。工業(yè)過程是一個(gè)動(dòng)態(tài)過程,要讓一個(gè)系統(tǒng)始終處于最優(yōu)化狀態(tài),必須隨時(shí)排除各種干擾,協(xié)調(diào)好各局部?jī)?yōu)化參數(shù)或各現(xiàn)場(chǎng)控制器,從而達(dá)到整個(gè)系統(tǒng)最優(yōu)。
(2)預(yù)測(cè)控制中的滾動(dòng)優(yōu)化算法
預(yù)測(cè)控制,又稱基于模型的控制(Model-based Control),是70年代后期興起的一種新型優(yōu)化控制算法。但它與通常的離散最優(yōu)控制算法不同,不是采用一個(gè)不變的全局優(yōu)化目標(biāo),而是采用滾動(dòng)式的有限時(shí)域優(yōu)化策略。這意味著優(yōu)化過程不是一次離線進(jìn)行,而是反復(fù)在線進(jìn)行的。這種有限化目標(biāo)的局部性使其在理想情況下只能得到全局的次優(yōu)解,但其滾動(dòng)實(shí)施,卻能顧及由于模型失配、時(shí)變、干擾等引起的不確定性,及時(shí)進(jìn)行彌補(bǔ),始終把新的優(yōu)化建立在實(shí)際的基礎(chǔ)之上,使控制保持實(shí)際上的最優(yōu)。這種啟發(fā)式的滾動(dòng)優(yōu)化策略,兼顧了對(duì)未來充分長(zhǎng)時(shí)間內(nèi)的理想優(yōu)化和實(shí)際存在的不確定性的影響。在復(fù)雜的工業(yè)環(huán)境中,這比建立在理想條件下的最優(yōu)控制更加實(shí)際有效。
預(yù)測(cè)控制的優(yōu)化模式具有鮮明的特點(diǎn):它的離散形式的有限優(yōu)化目標(biāo)及滾動(dòng)推進(jìn)的實(shí)施過程,使得在控制的全過程中實(shí)現(xiàn)動(dòng)態(tài)優(yōu)化,而在控制的每一步實(shí)現(xiàn)靜態(tài)參數(shù)優(yōu)化。用這種思路,可以處理更復(fù)雜的情況,例如有約束、多目標(biāo)、非線性乃至非參數(shù)等。吸取規(guī)劃中的分層思想,還可把目標(biāo)按其重要性及類型分層,實(shí)施不同層次的優(yōu)化。顯然,可把大系統(tǒng)控制中分層決策的思想和人工智能方法引入預(yù)測(cè)控制,形成多層智能預(yù)測(cè)控制的模式。這種多層智能預(yù)測(cè)控制方法的,將克服單一模型的預(yù)測(cè)控制算法的不足,是當(dāng)前研究的重要方向之一。
(3)穩(wěn)態(tài)遞階控制
對(duì)復(fù)雜的大工業(yè)過程(對(duì)象)的控制常采用集散控制模式。這時(shí)計(jì)算機(jī)在線穩(wěn)態(tài)優(yōu)化常采用遞階控制結(jié)構(gòu)。這種結(jié)構(gòu)既有控制層又有優(yōu)化層,而優(yōu)化層是一個(gè)兩級(jí)結(jié)構(gòu),由局部決策單元級(jí)和協(xié)調(diào)器組成。其優(yōu)化進(jìn)程是:各決策單元并行響應(yīng)子過程優(yōu)化,由上一級(jí)決策單元(協(xié)調(diào)器)協(xié)調(diào)各優(yōu)化進(jìn)程,各決策單元和協(xié)調(diào)器通過相互迭代找到最優(yōu)解。這里必須提到波蘭學(xué)者Findeisen等所作出的重要貢獻(xiàn)。
由于工業(yè)過程較精確的數(shù)學(xué)模型不易求得,而且工業(yè)過程(對(duì)象)往往呈非線性及慢時(shí)變性,因此波蘭學(xué)者Findesien提出:優(yōu)化算法中采用模型求得的解是開環(huán)優(yōu)化解。在大工業(yè)過程在線穩(wěn)態(tài)控制的設(shè)計(jì)階段,開環(huán)解可以用來決定最優(yōu)工作點(diǎn)。但在實(shí)際使用上,這個(gè)解未必能使工業(yè)過程處于最優(yōu)工況,相反還會(huì)違反約束。他們提出的全新思想是:從實(shí)際過程提取關(guān)聯(lián)變量的穩(wěn)態(tài)信息,并反饋至上一層協(xié)調(diào)器(全局反饋)或局部決策單元(局部反饋),并用它修正基于模型求出的的最優(yōu)解,使之接近真實(shí)最優(yōu)解。
(4)系統(tǒng)優(yōu)化和參數(shù)估計(jì)的集成研究方法
穩(wěn)態(tài)遞階控制的難點(diǎn)是,實(shí)際過程的輸入輸出特性是未知的。波蘭學(xué)者提出的反饋校正機(jī)制,得到的只能是一個(gè)次優(yōu)解。但其主要缺點(diǎn)在于一般很難準(zhǔn)確估計(jì)次優(yōu)解偏離最優(yōu)解的程度,而且次優(yōu)解的次優(yōu)程度往往依賴于初始點(diǎn)的選取。一個(gè)自然的想法是將優(yōu)化和參數(shù)估計(jì)分開處理并交替進(jìn)行,直到迭代收斂到一個(gè)解。這樣計(jì)算機(jī)的在線優(yōu)化控制就包括兩部分任務(wù):在粗模型(粗模型通常是能夠得到的)基礎(chǔ)上的優(yōu)化和設(shè)定點(diǎn)下的修正模型。這種方法稱為系統(tǒng)優(yōu)化和參數(shù)估計(jì)的集成研究方法。 (Integrated System Optimizationand Parameter Estimation)
對(duì)于越來越多的復(fù)雜控制對(duì)象,一方面,人們所要求的控制性能不再單純的局限于一兩個(gè)指標(biāo);另一方面,上述各種優(yōu)化方法,都是基于優(yōu)化問題具有精確的數(shù)學(xué)模型基礎(chǔ)之上的。但是許多實(shí)際工程問題是很難或不可能得到其精確的數(shù)學(xué)模型的。這就限制了上述經(jīng)典優(yōu)化方法的實(shí)際應(yīng)用。隨著模糊理論、神經(jīng)網(wǎng)絡(luò)等智能技術(shù)和計(jì)算機(jī)技術(shù)的發(fā)展。
智能式的優(yōu)化方法得到了重視和發(fā)展。
(1)神經(jīng)網(wǎng)絡(luò)優(yōu)化方法
人工神經(jīng)網(wǎng)絡(luò)的研究起源于1943年和Mc Culloch和Pitts的工作。在優(yōu)化方面,1982年Hopfield首先引入Lyapuov能量函數(shù)用于判斷網(wǎng)絡(luò)的穩(wěn)定性,提出了Hopfield單層離散模型;Hopfield和Tank又發(fā)展了Hopfield單層連續(xù)模型。1986年,Hopfield和Tank將電子電路與Hopfield模型直接對(duì)應(yīng),實(shí)現(xiàn)了硬件模擬;Kennedy和Chua基于非線性電路理論提出了模擬電路模型,并使用系統(tǒng)微分方程的Lyapuov函數(shù)研究了電子電路的穩(wěn)定性。這些工作都有力地促進(jìn)了對(duì)神經(jīng)網(wǎng)絡(luò)優(yōu)化方法的研究。
根據(jù)神經(jīng)網(wǎng)絡(luò)理論,神經(jīng)網(wǎng)絡(luò)能量函數(shù)的極小點(diǎn)對(duì)應(yīng)于系統(tǒng)的穩(wěn)定平衡點(diǎn),這樣能量函數(shù)極小點(diǎn)的求解就轉(zhuǎn)換為求解系統(tǒng)的穩(wěn)定平衡點(diǎn)。隨著時(shí)間的演化,網(wǎng)絡(luò)的運(yùn)動(dòng)軌道在空間中總是朝著能量函數(shù)減小的方向運(yùn)動(dòng),最終到達(dá)系統(tǒng)的平衡點(diǎn)——即能量函數(shù)的極小點(diǎn)。因此如果把神經(jīng)網(wǎng)絡(luò)動(dòng)力系統(tǒng)的穩(wěn)定吸引子考慮為適當(dāng)?shù)哪芰亢瘮?shù)(或增廣能量函數(shù))的極小點(diǎn),優(yōu)化計(jì)算就從一初始點(diǎn)隨著系統(tǒng)流到達(dá)某一極小點(diǎn)。如果將全局優(yōu)化的概念用于控制系統(tǒng),則控制系統(tǒng)的目標(biāo)函數(shù)最終將達(dá)到希望的最小點(diǎn)。這就是神經(jīng)優(yōu)化計(jì)算的基本原理。
與一般的數(shù)學(xué)規(guī)劃一樣,神經(jīng)網(wǎng)絡(luò)方法也存在著重分析次數(shù)較多的弱點(diǎn),如何與結(jié)構(gòu)的近似重分析等結(jié)構(gòu)優(yōu)化技術(shù)結(jié)合,減少迭代次數(shù)是今后進(jìn)一步研究的方向之一。
由于Hopfield模型能同時(shí)適用于離散問題和連續(xù)問題,因此可望有效地解決控制工程中普遍存在的混合離散變量非線性優(yōu)化問題。
(2)遺傳算法
遺傳算法和遺傳規(guī)劃是一種新興的搜索尋優(yōu)技術(shù)。它仿效生物的進(jìn)化和遺傳,根據(jù)“優(yōu)勝劣汰”原則,使所要求解決的問題從初始解逐步地逼近最優(yōu)解。在許多情況下,遺傳算法明顯優(yōu)于傳統(tǒng)的優(yōu)化方法。該算法允許所求解的問題是非線性的和不連續(xù)的,并能從整個(gè)可行解空間尋找全局最優(yōu)解和次優(yōu)解,避免只得到局部最優(yōu)解。這樣可以為我們提供更多有用的參考信息,以便更好地進(jìn)行系統(tǒng)控制。同時(shí)其搜索最優(yōu)解的過程是有指導(dǎo)性的,避免了一般優(yōu)化算法的維數(shù)災(zāi)難問題。遺傳算法的這些優(yōu)點(diǎn)隨著計(jì)算機(jī)技術(shù)的發(fā)展,在控制領(lǐng)域中將發(fā)揮越來越大的作用。
研究表明,遺傳算法是一種具有很大潛力的結(jié)構(gòu)優(yōu)化方法。它用于解決非線性結(jié)構(gòu)優(yōu)化、動(dòng)力結(jié)構(gòu)優(yōu)化、形狀優(yōu)化、拓?fù)鋬?yōu)化等復(fù)雜優(yōu)化問題,具有較大的優(yōu)勢(shì)。
(3)模糊優(yōu)化方法
最優(yōu)化問題一直是模糊理論應(yīng)用最為廣泛的領(lǐng)域之一。
自從Bellman和Zadeh在 70年代初期對(duì)這一研究作出開創(chuàng)性工作以來,其主要研究集中在一般意義下的理論研究、模糊線性規(guī)劃、多目標(biāo)模糊規(guī)劃、以及模糊規(guī)劃理論在隨機(jī)規(guī)劃及許多實(shí)際問題中的應(yīng)用。主要的研究方法是利用模糊集的a截集或確定模糊集的隸屬函數(shù)將模糊規(guī)劃問題轉(zhuǎn)化為經(jīng)典的規(guī)劃問題來解決。
模糊優(yōu)化方法與普通優(yōu)化方法的要求相同,仍然是尋求一個(gè)控制方案(即一組設(shè)計(jì)變量),滿足給定的約束條件,并使目標(biāo)函數(shù)為最優(yōu)值,區(qū)別僅在于其中包含有模糊因素。普通優(yōu)化可以歸結(jié)為求解一個(gè)普通數(shù)學(xué)規(guī)劃問題,模糊規(guī)劃則可歸結(jié)為求解一個(gè)模糊數(shù)學(xué)規(guī)劃(fuzzymathematicalprogramming)問題。包含控制變量、目標(biāo)函數(shù)和約束條件,但其中控制變量、目標(biāo)函數(shù)和約束條件可能都是模糊的,也可能某一方面是模糊的而其它方面是清晰的。例如模糊約束的優(yōu)化設(shè)計(jì)問題中模糊因素是包含在約束條件(如幾何約束、性能約束和人文約束等)中的。求解模糊數(shù)學(xué)規(guī)劃問題的基本思想是把模糊優(yōu)化轉(zhuǎn)化為非模糊優(yōu)化即普通優(yōu)化問題。方法可分為兩類:一類是給出模糊解(fuzzysolution);另一類是給出一個(gè)特定的清晰解(crispsolution)。必須指出,上述解法都是對(duì)于模糊線性規(guī)劃(fuzzylinearprogramming)提出的。然而大多數(shù)實(shí)際工程問題是由非線形模糊規(guī)劃(fuzzynonlinearprogramming)加以描述的。于是有人提出了水平截集法、限界搜索法和最大水平法等,并取得了一些可喜的成果。
在控制領(lǐng)域中,模糊控制與自學(xué)習(xí)算法、模糊控制與遺傳算法相融合,通過改進(jìn)學(xué)習(xí)算法、遺傳算法,按給定優(yōu)化性能指標(biāo),對(duì)被控對(duì)象進(jìn)行逐步尋優(yōu)學(xué)習(xí),從而能夠有效地確定模糊控制器的結(jié)構(gòu)和參數(shù)。
最優(yōu)控制理論所研究的問題可以概括為:對(duì)一個(gè)受控的動(dòng)力學(xué)系統(tǒng)或運(yùn)動(dòng)過程,從一類允許的控制方案中找出一個(gè)最優(yōu)的控制方案,使系統(tǒng)的運(yùn)動(dòng)在由某個(gè)初始狀態(tài)轉(zhuǎn)移到指定的目標(biāo)狀態(tài)的同時(shí),其性能指標(biāo)值為最優(yōu)。這類問題廣泛存在于技術(shù)領(lǐng)域或社會(huì)問題中。
例如,確定一個(gè)最優(yōu)控制方式使空間飛行器由一個(gè)軌道轉(zhuǎn)換到另一軌道過程中燃料消耗最少,選擇一個(gè)溫度的調(diào)節(jié)規(guī)律和相應(yīng)的原料配比使化工反應(yīng)過程的產(chǎn)量最多,制定一項(xiàng)最合理的人口政策使人口發(fā)展過程中老化指數(shù)、撫養(yǎng)指數(shù)和勞動(dòng)力指數(shù)等為最優(yōu)等,都是一些典型的最優(yōu)控制問題。最優(yōu)控制理論是50年代中期在空間技術(shù)的推動(dòng)下開始形成和發(fā)展起來的。蘇聯(lián)學(xué)者Л.С.龐特里亞金1958年提出的極大值原理和美國(guó)學(xué)者R.貝爾曼1956年提出的動(dòng)態(tài)規(guī)劃,對(duì)最優(yōu)控制理論的形成和發(fā)展起了重要的作用。線性系統(tǒng)在二次型性能指標(biāo)下的最優(yōu)控制問題則是R.E.卡爾曼在60年代初提出和解決的。
所謂最優(yōu)化問題,就是尋找一個(gè)最優(yōu)控制方案或最優(yōu)控制規(guī)律,使系統(tǒng)能最優(yōu)地達(dá)到預(yù)期的目標(biāo)。在最優(yōu)化問題的數(shù)學(xué)模型建立后,主要問題是如何通過不同的求解方法解決尋優(yōu)問題。一般而言,最優(yōu)化方式有離線靜態(tài)優(yōu)化方式和在線動(dòng)態(tài)優(yōu)化方式,而最優(yōu)化問題的求解方法大致可分為四類:
1.解析法
對(duì)于目標(biāo)函數(shù)及約束條件具有簡(jiǎn)單而明確的數(shù)學(xué)表達(dá)式的最優(yōu)化問題,通常可采用解析法來解決。其求解方法是先按照函數(shù)極值的必要條件,用數(shù)學(xué)分析方法求出其解析解,然后按照充分條件或問題的實(shí)際物理意義間接地確定最優(yōu)解。
這種方法適用于性能指標(biāo)及約束有明顯解析表達(dá)式的情況。其一般步是先用求導(dǎo)方法或變分法求出最優(yōu)控制的必要條件,得到一組方程或不等式,然后求解這組方程或不等式,得到最優(yōu)控制的解析解即為所求的最優(yōu)控制。解析法大致可分為兩大類。第一類,無約束時(shí),采用微分法或變分法。第二類,有約束時(shí),采用極大值原理或動(dòng)態(tài)規(guī)劃。
(1)變分法:當(dāng)控制向量不受約束時(shí),引入哈密頓函數(shù),應(yīng)用變分法可以導(dǎo)出最優(yōu)控制的必要條件,即正則方程、控制方程、邊界條件、橫截條件。
(2)極大值原理:在用變分法求解最優(yōu)控制問題時(shí),是假定控制向量u(O)不受任何限制,即容許控制集合可以看成是整個(gè)P維控制空間開集,控制變分u是任意的,同時(shí)還要求哈密頓出數(shù)H對(duì)u連續(xù)可微,但在實(shí)際工程上,控制變量往往受到一定的限制,這時(shí)可以用極大值原理來求解最優(yōu)控制問題,這種方法其實(shí)是由變分法引申而來的,但由于它能應(yīng)用于控制變量u(t)受邊界限制的情況,并且不要求哈密頓出數(shù)H對(duì)u連續(xù)可微,因此獲得了廣泛的應(yīng)用。
(3)動(dòng)態(tài)規(guī)劃:極大值原理一樣,是處理控制向量限制在一定閉集內(nèi)的最優(yōu)控制問題的有效數(shù)學(xué)方法,它把復(fù)雜的最優(yōu)控制間題變?yōu)槎嗉?jí)決策過程的遞推函數(shù)關(guān)系,其基礎(chǔ)和核心時(shí)最優(yōu)性原理即在一個(gè)多級(jí)決策問題中無論初始狀態(tài)和初始決策如何,當(dāng)把其中的任何一級(jí)和狀態(tài)再作為初始級(jí)和初始狀態(tài)時(shí),如下的決定對(duì)與這一級(jí)開始往后的多級(jí)決策過程的一部分必定仍然是一個(gè)最優(yōu)決策。因此,利用這一最優(yōu)性原理必然可把一個(gè)多級(jí)決策問題化為最優(yōu)的單級(jí)決策問題并且本級(jí)決策與本級(jí)以前的任何決策無關(guān),只與本級(jí)的初始位置和初始決策有關(guān)。對(duì)于連續(xù)系統(tǒng)用動(dòng)態(tài)規(guī)劃法求最優(yōu)控制問題時(shí),可以先把連續(xù)系統(tǒng)離散化,用有限差分方程近似代替連續(xù)方程,然后用離散動(dòng)態(tài)規(guī)劃法求解。
2.數(shù)值解法(直接法)
對(duì)于目標(biāo)函數(shù)較為復(fù)雜或無明確的數(shù)學(xué)表達(dá)式或無法用解析法求解的最優(yōu)化問題,通??刹捎弥苯臃▉斫鉀Q。直接法的基本思想,就是用直接搜索方法經(jīng)過一系列的迭代以產(chǎn)生點(diǎn)的序列,使之逐步接近到最優(yōu)點(diǎn)。直接法常常是根據(jù)經(jīng)驗(yàn)或?qū)嶒?yàn)而得到的。
性能指標(biāo)比較復(fù)雜或不能用變量顯函數(shù)表示時(shí),可以采用直接搜索法,經(jīng)過若干次迭代搜索到最優(yōu)點(diǎn),數(shù)值計(jì)算法可以分為兩大類:
(1)區(qū)間消去法,又稱為一維搜索法,適用于求解單變量極值問題。主要有黃金分割法、多項(xiàng)式插值法等。
(2)爬山法,又稱多維搜索法,適用于求解多變量極值問題。主要有坐標(biāo)輪轉(zhuǎn)法、步長(zhǎng)加速法等。
3.解析與數(shù)值相結(jié)合的尋優(yōu)方法(梯度型法)
是一種解析與數(shù)值計(jì)算相結(jié)合的方法。主要包括兩大類:一種是無約束梯度法,如陡降法、擬牛頓法等。第二類是有約束梯度法,如可行方向法、梯度投影法。
4.網(wǎng)絡(luò)最優(yōu)化方法
這種方法以網(wǎng)絡(luò)圖作為數(shù)學(xué)模型,用圖論方法進(jìn)行搜索的尋優(yōu)方法。
格式:pdf
大小:389KB
頁數(shù): 5頁
評(píng)分: 4.4
考慮系繩質(zhì)量、系統(tǒng)質(zhì)心變化及狀態(tài)、控制約束,基于Lagrange方程給出了圓軌道條件下空間繩系網(wǎng)捕系統(tǒng)三維動(dòng)力學(xué)模型。推導(dǎo)得到了零相對(duì)速度條件下的安全捕獲末端條件,研究了面內(nèi)安全捕獲策略下的非線性能量最優(yōu)控制問題。為保證方法的適用性,基于Legendre偽譜法將連續(xù)時(shí)間最優(yōu)控制問題離散為標(biāo)準(zhǔn)的非線性動(dòng)態(tài)規(guī)劃問題。最后在考慮捕獲控制前初始面外角偏差分別為5°和15°的情況下,通過數(shù)值仿真驗(yàn)證了該方法的有效性。
格式:pdf
大小:389KB
頁數(shù): 未知
評(píng)分: 4.6
本文提出了一種具有未建模動(dòng)態(tài)特性,參數(shù)變化和未知外界干擾等不確定性的電液控制系統(tǒng)魯棒最優(yōu)控制結(jié)構(gòu).該結(jié)構(gòu)包括最優(yōu)控制和輔助控制兩部分,其中最優(yōu)控制用來確定系統(tǒng)的性能,輔助控制用來克服系統(tǒng)的不確定,兩部分的設(shè)計(jì)相互獨(dú)立.對(duì)液壓電梯速度系統(tǒng)的仿真和實(shí)驗(yàn)結(jié)果表明了該方法的有效性.
目前,較為流行的近似最優(yōu)控制求解方法主要有以下幾類:
冪級(jí)數(shù)展開方法通過一個(gè)冪級(jí)數(shù)來構(gòu)造控制律,得到序列形式的近似最優(yōu)解,或者將系統(tǒng)中的非線性項(xiàng)以冪級(jí)數(shù)形式分解,或者通過引進(jìn)一個(gè)臨時(shí)變量并圍繞它展開。
將上式代入HJB方程求得級(jí)數(shù)近似解,也可利用Adomian分解將非線性項(xiàng)進(jìn)行分解。由此尋求非線性HJB方程級(jí)數(shù)的近似解。
由動(dòng)態(tài)規(guī)劃得到的一般性偏微分HJB方引入一個(gè)迭代過程來求解一般非線性HJB方程的一個(gè)近似解序列
其主要思想是將最優(yōu)控制問題中的狀態(tài)變量,控制輸入,性能指標(biāo)和各個(gè)參數(shù)分別用廣義正交多項(xiàng)式展開,利用廣義正交多項(xiàng)式的積分、乘積運(yùn)算陣
將描述系統(tǒng)的微分方程轉(zhuǎn)化為一系列的代數(shù)方程X=MU N。然后,得到TU=V,當(dāng)T非奇異時(shí),由U=T-1V得到的控制律是一個(gè)多項(xiàng)式級(jí)數(shù)解u(t)=θ(t)U。該方法將最優(yōu)控制問題轉(zhuǎn)化為代數(shù)極值問題,從而避免了求解時(shí)變非線性Riccati方程
經(jīng)典的有限差分和有限元方法可以用來近似求解非線性HJB方程近年來,這類方法用來近似求取非線性HJB方程的粘性解。
這種方法適用的模型是仿射非線性系統(tǒng)。通過極大值原理假設(shè)最優(yōu)控制律具有如下形式。
其中P(x)為下式所述里卡提方程的解
這樣,問題的關(guān)鍵歸結(jié)于近似求解P(x)。狀態(tài)相關(guān)里卡提方程方法通過在P(x)中引入靈敏度參數(shù)變量ε,在ε=o鄰域內(nèi)將P(x)展為冪級(jí)數(shù)
通過比較冪級(jí)數(shù)同次項(xiàng)系數(shù)將狀態(tài)相關(guān)里卡提方程分解為一組矩陣微分方程序列,由此求得其近似解狀態(tài)相關(guān)里卡提方程方法所設(shè)計(jì)的近似最優(yōu)控制律是一種級(jí)數(shù)形式的狀態(tài)反饋控制律
該方法對(duì)非線性系統(tǒng)構(gòu)造線性時(shí)變序列以及相應(yīng)的線性二次型時(shí)變性能指標(biāo),得到線性時(shí)變序列的最優(yōu)反饋控制序列
此方法計(jì)算量較大,但是當(dāng)系統(tǒng)的維數(shù)不是很大時(shí),較里卡提方程近似序列方法具有很快的收斂速度,并表現(xiàn)出很好的魯棒性。
該方法是針對(duì)非線性的一次項(xiàng)和高次項(xiàng)可分離的一類非線性系統(tǒng)進(jìn)行近似最優(yōu)控制問題的求解,給出了一種逐次逼近的近似求解方法該方法針對(duì)由極大值原理導(dǎo)致的兩點(diǎn)邊值問題,構(gòu)造近似的等價(jià)序列將其轉(zhuǎn)化為一組線性非齊次兩點(diǎn)邊值問題序列,通過迭代求解一系列的向量微分方程,包括狀態(tài)向量方程序列和共態(tài)向量方程序列,得到原非線性系統(tǒng)近似最優(yōu)控制問題的解該方法被廣泛應(yīng)用到各類非線性系統(tǒng),其最大優(yōu)點(diǎn)是在迭代過程中每次計(jì)算的不是矩陣微分或代數(shù)方程,而是向量微分或代數(shù)方程,計(jì)算量大大減少,而且實(shí)時(shí)性很高。
解決最優(yōu)控制問題最大的難點(diǎn)在于HJB方程的求解,只有當(dāng)系統(tǒng)模型是低階線性模型時(shí),才有可能給出具有顯式表達(dá)式的最優(yōu)控制解。在實(shí)際系統(tǒng)里,乃至自然界中,幾乎絕大多數(shù)系統(tǒng)都是非線性的系統(tǒng),想得到具有顯式表達(dá)式的控制量幾乎不可能,這就需要借助計(jì)算機(jī),以及選擇合適的最優(yōu)的數(shù)值解法,以得到最優(yōu)解。一般的,最優(yōu)控制問題的求解方法為數(shù)值算法。極大值原理和動(dòng)態(tài)規(guī)劃從理論方面研究了最優(yōu)控制所應(yīng)遵循的方程和條件,而最優(yōu)控制的數(shù)值算法則是從計(jì)算方面來確定最優(yōu)控制量的具體方法和步驟。
評(píng)價(jià)最優(yōu)控制數(shù)值算法優(yōu)劣的三個(gè)主要方面是算法的收斂性、計(jì)算復(fù)雜性以及數(shù)值穩(wěn)定性。算法的收斂性是保證計(jì)算過程能達(dá)到正確結(jié)果的前提。算法的計(jì)算復(fù)雜性也尤其重要,這對(duì)實(shí)時(shí)控制具有特別重要的意義。一個(gè)好的算法應(yīng)使計(jì)算量和存儲(chǔ)量盡可能小,以便能由盡可能簡(jiǎn)單的計(jì)算機(jī)來實(shí)現(xiàn)計(jì)算。好的算法還應(yīng)具有較好的數(shù)值穩(wěn)定性,即計(jì)算的結(jié)果對(duì)初始數(shù)據(jù)和運(yùn)算過程的誤差不能過于敏感,同時(shí)具有處理病態(tài)問題的能力。典型的最優(yōu)控制數(shù)值算法包括:求解由極大值原理導(dǎo)出的微分或差分方程的兩點(diǎn)邊值問題的各種算法,對(duì)動(dòng)態(tài)規(guī)劃中的貝爾曼方程進(jìn)行數(shù)值求解_的算法,求解線性二次型最優(yōu)控制問題的黎卡提方程的各種算法,處理控制或狀態(tài)受約束問題的懲罰函數(shù)法,在控制策略的函數(shù)空間中利用搜索尋優(yōu)或梯度尋優(yōu)技術(shù)和牛頓一拉夫森方法等直接求解非線性系統(tǒng)最優(yōu)控制問題的算法等。其中,針對(duì)非線性系統(tǒng)的開環(huán)最優(yōu)控制問題和線性二次型最優(yōu)控制問題展開的數(shù)值算法研究尤多。
在間接法中,我們依靠最小值原理和其它一些必要條件得到一個(gè)兩點(diǎn)邊值問題,然后通過數(shù)值求解該問題得到相應(yīng)的最優(yōu)軌跡。在幾種基于打靶法求解兩點(diǎn)邊值問題的方法中,多重打靶法是最引人矚目的。而其它的一些間接數(shù)值求解法,比如伴隨方程的向前一向后積分法、函數(shù)空間梯度法等,在過去的幾年中應(yīng)用并不十分廣泛。間接法的主要優(yōu)點(diǎn)是解的精度高,同時(shí)方法保證了求解滿足最優(yōu)條件。然而間接法常常會(huì)遇到比較嚴(yán)重的解的收斂性問題。如果在求解中,沒有關(guān)于系統(tǒng)初始值的一個(gè)好的選取,或是沒有關(guān)于約束和非約束下系統(tǒng)運(yùn)動(dòng)軌跡的先驗(yàn)知識(shí),收斂過程可能需要花費(fèi)很長(zhǎng)的計(jì)算時(shí)間,甚至可能根本無法找到最優(yōu)解。
在直接法中,連續(xù)性的最優(yōu)控制問題通過參數(shù)化的過程被轉(zhuǎn)化為了一個(gè)有限維的優(yōu)化問題。轉(zhuǎn)化后的問題可以通過一些已有的比較成熟的約束優(yōu)化算法進(jìn)行數(shù)值求解。相對(duì)于間接法而言,直接法無需考慮最優(yōu)化條件,而是直接求解問題本身。直接法不易受到收斂問題的影響,但估計(jì)的精度不如間接法。最優(yōu)的必要條件不是直接滿足的,而且伴隨量的估計(jì)精度有時(shí)也會(huì)很差?,F(xiàn)在比較常用的幾種直接求解方法包括最優(yōu)參數(shù)控制法,有限差分方法,配點(diǎn)法,微分包含方法和偽譜方法。在最優(yōu)參數(shù)控制法中,控制量被單獨(dú)參數(shù)化,同時(shí)數(shù)值積分方法被用來求解微分方程;在有限差分方法中,原微分方程和邊界條件被近似為有限差分方程組:在配點(diǎn)法中,狀態(tài)量和控制量同時(shí)被參數(shù)化,在各個(gè)節(jié)點(diǎn)處,局部分段多項(xiàng)式被用來近似微分方程;微分包含方法只是將狀態(tài)量參數(shù)化,并使用由速端曲線定義的狀態(tài)變化率;在偽譜方法中,通過全局多項(xiàng)式將狀態(tài)量和控制量同時(shí)參數(shù)化,積分方程和微分方程通過求積法被近似。配點(diǎn)法和偽譜方法的一個(gè)重要的特點(diǎn)就是伴隨量的相合估計(jì)。
冪級(jí)數(shù)展開方法要求系統(tǒng)關(guān)于狀態(tài)向量X解析,才能夠進(jìn)行展開,這在實(shí)際工程應(yīng)用中是不現(xiàn)實(shí)的Galcrkin逐次逼近法的收斂性過于依賴系統(tǒng)的初值,收斂性在很多情祝下是無法保證的廣義正交多項(xiàng)式級(jí)數(shù)展開法和有限差分、有限元方法都是采用不同的數(shù)學(xué)工具來解決近似求解非線性系統(tǒng)的最優(yōu)控制問題,但這兩種方法的計(jì)算收斂性不好,所需的巨大計(jì)算量也使得它們離工程實(shí)際應(yīng)用有很大一段距離狀態(tài)相關(guān)里卡提方程適用于一類仿射非線性系統(tǒng)里卡提方程近似序列方法同樣適用于一類仿射非線性系統(tǒng),當(dāng)處理高維系統(tǒng)時(shí),其計(jì)算量將很大而逐次逼近法,從計(jì)算復(fù)雜度看,是對(duì)向量迭代,得到的最優(yōu)控制律是由精確的線性反饋項(xiàng)和非線性補(bǔ)償項(xiàng)組成,將最優(yōu)控制的求解轉(zhuǎn)化為非線性補(bǔ)償向量序列的求極限過程,大大減少了計(jì)算量,容易被實(shí)際工程所應(yīng)用簡(jiǎn)言之,逐次逼近法通過較為簡(jiǎn)單的計(jì)算設(shè)計(jì)得到系統(tǒng)的近似最優(yōu)控制律,具有計(jì)算量少,易于工程實(shí)現(xiàn)的優(yōu)點(diǎn),有很好的工程應(yīng)用前景然而,逐次逼近法的缺點(diǎn)在于其對(duì)外部擾動(dòng)和系統(tǒng)內(nèi)部參數(shù)攝動(dòng)以及未建模動(dòng)態(tài)敏感,因此提高最優(yōu)控制的魯棒性是非常必要的。2100433B