目錄
數據同化
編輯(了解如何以及何時刪除此模板消息)
數據同化是一門數學學科,旨在將理論(通常以數值模型的形式)與觀察結果最佳地結合起來。 可能會尋求許多不同的目標——例如,確定系統的最佳狀態估計,確定數值預測模型的初始條件,使用被觀察系統的(例如物理)知識對稀疏觀察數據進行插值, 根據觀察數據訓練模型來設置數值參數。 根據目標,可以使用不同的解決方法。 數據同化不同于其他形式的機器學習、圖像分析和統計方法,因為它利用了被分析系統的動態模型。
數據同化最初發展于數值天氣預報領域。 數值天氣預報模型是描述大氣動力學行為的方程式,通常編碼為計算機程序。 為了使用這些模型進行預測,模型需要與當前大氣狀態非常相似的初始條件。 簡單地將逐點測量插入數值模型并不能提供令人滿意的解決方案。 由于儀器的質量和測量位置的已知準確度,現實世界的測量包含誤差。 這些錯誤會導致模型不穩定,從而消除預測中任何水平的技能。 因此,需要更復雜的方法來使用所有可用數據初始化模型,同時確保保持數值模型的穩定性。 此類數據通常包括測量結果以及在進行測量的同時有效的先前預測。 如果反復應用,此過程開始將過去觀察中的信息積累到所有后續預測中。
由于數據同化是從數值天氣預報領域發展出來的,因此它最初在地球科學中受到歡迎。 事實上,在所有地球科學中被引用最多的出版物之一是應用數據同化來重建大氣的觀測歷史。
數據同化過程的細節
編輯傳統上,數據同化已應用于使用簡單的外推方法難以預測的混沌動力系統。 造成這種困難的原因是初始條件的微小變化會導致預測精度的巨大變化。 這有時被稱為蝴蝶效應 - 對初始條件的敏感依賴性,在這種情況下,確定性非線性系統的一種狀態的微小變化可能導致后來狀態的巨大差異。
在任何更新時間,數據同化通常會進行預測(也稱為xxx次猜測或背景信息),并根據一組觀測數據和觀測和預測中存在的估計誤差對預測進行修正 本身。 預測與當時觀測值之間的差異稱為偏離或創新(因為它為數據同化過程提供了新信息)。 將加權因子應用于創新,以確定應根據觀察到的新信息對預測進行多少修正。 基于對由加權因子乘以創新確定的預測的修正,對系統狀態的最佳估計稱為分析。 在一個維度上,計算分析可以像形成預測值和觀察值的加權平均值一樣簡單。 在多個維度上,問題變得更加困難。 數據同化的大部分工作都集中在根據對系統錯誤的復雜了解來充分估計適當的加權因子。
測量通常來自真實世界的系統,而不是模型對該系統的不完整表示,因此稱為觀察算子的特殊函數(通常用 h() 表示非線性算子或 H 表示其非線性算子) 線性化)需要將建模變量映射到可以直接與觀察值進行比較的形式。
數據同化作為統計估計
編輯一種常見的數學哲學觀點是將數據同化視為貝葉斯估計問題。 從這個角度來看,分析步驟是貝葉斯定理的應用,整個同化過程是遞歸貝葉斯估計的一個例子。 然而,概率分析通常被簡化為計算上可行的形式。 在一般情況下,可以通過 Fokker-Planck 方程及時推進概率分布,但這對于高維系統是不可行的; 因此,取而代之的是使用對概率分布的簡化表示進行操作的各種近似值。
內容由匿名用戶提供,本內容不代表www.gelinmeiz.com立場,內容投訴舉報請聯系www.gelinmeiz.com客服。如若轉載,請注明出處:http://www.gelinmeiz.com/193452/