• 隨機控制

    編輯
    本詞條由“匿名用戶” 建檔。

    隨機控制

    編輯

    隨機控制或隨機最優控制是控制理論的一個子領域,它處理觀察中或驅動系統演化的噪聲中存在的不確定性。 系統設計者以貝葉斯概率驅動的方式假設,具有已知概率分布的隨機噪聲會影響狀態變量的演化和觀察。 隨機控制旨在設計受控變量的時間路徑,盡管存在這種噪聲,但仍以最小的成本執行所需的控制任務,以某種方式定義。 上下文可以是離散時間或連續時間。

    確定性等價

    編輯

    隨機控制中一個研究得非常透徹的公式是線性二次高斯控制。 這里的模型是線性的,目標函數是二次型的期望值,擾動是純加性的。 僅具有附加不確定性的離散時間集中系統的基本結果是確定性等價性質:在這種情況下的最優控制解決方案與在沒有附加干擾的情況下獲得的最優控制解決方案相同。 此屬性適用于所有具有線性演化方程、二次成本函數和僅相加進入模型的噪聲的集中式系統; 二次假設允許遵循確定性等價特性的最優控制法則是控制器觀測值的線性函數。

    與上述假設的任何偏差——非線性狀態方程、非二次目標函數、模型乘法參數中的噪聲或控制的分散——都會導致確定性等價性不成立。

    離散時間

    編輯

    在離散時間上下文中,決策者在每個時間段內觀察狀態變量,可能帶有觀察噪聲。 目標可能是優化非線性(可能是二次)目標函數在從當前到最后一個關注時期的所有時間段內的期望值之和,或者僅優化目標函數的截至最后一個時期的值 . 在每個時間段進行新的觀察,并對控制變量進行最佳調整。 找到當前時間的最優解可能涉及從上一期到當前期在時間上向后迭代矩陣 Riccati 方程。

    在轉移矩陣中參數值不確定的離散時間情況下(給出狀態變量的當前值對其自身演化的影響)和/或狀態方程的控制響應矩陣,但仍具有線性狀態 方程和二次目標函數,即使確定性等價性不適用,仍然可以得到一個 Riccati 方程,用于向后迭代到每個周期的解。ch.13 非二次損失函數的離散時間情況,但只有加性擾動 也可以處理,盡管有更多的并發癥。

    例子

    離散時間隨機線性二次控制問題的典型規范是最小化

    隨機過程

    其中E1為以y0為條件的期望值算子,上標T表示矩陣轉置,S為時間范圍,

    其中 y 是一個 n × 1 的可觀察狀態變量向量,u 是一個 k × 1 的控制變量向量,At 是隨機 n × n 狀態轉移矩陣的時間 t 實現,Bt 是隨機 n × n 的時間 t 實現 k矩陣控制乘數,Q(n×n)和R(k×k)是已知的對稱正定成本矩陣。 我們假設 A 和 B 的每個元素在時間上都是聯合獨立同分布的,因此期望值操作不需要是時間條件的。

    內容由匿名用戶提供,本內容不代表www.gelinmeiz.com立場,內容投訴舉報請聯系www.gelinmeiz.com客服。如若轉載,請注明出處:http://www.gelinmeiz.com/193609/

    (1)
    詞條目錄
    1. 隨機控制
    2. 確定性等價
    3. 離散時間
    4. 例子

    輕觸這里

    關閉目錄

    目錄
    91麻精品国产91久久久久