概率數據庫
編輯大多數真實的數據庫包含正確性不確定的數據。為了處理這些數據,有必要對數據的完整性進行量化。這可以通過使用概率數據庫來實現。概率數據庫是一個不確定的數據庫,其中可能的世界有相關的概率。概率數據庫管理系統目前是一個活躍的研究領域。雖然目前還沒有商業化的概率數據庫系統,但存在一些研究原型。概率數據庫區分了邏輯數據模型和數據的物理表示,就像ANSI-SPARC架構中的關系數據庫一樣。在概率數據庫中,這一點更加關鍵,因為這種數據庫必須簡潔地表示非常多的可能世界,往往是一個世界(經典數據庫)的指數級大小。
概率數據庫的術語
編輯在概率論數據庫中,每個元組都與0和1之間的概率相關聯,0代表數據肯定不正確,1代表數據肯定正確。
可能的世界
編輯一個概率數據庫可以存在于多種狀態。例如,如果數據庫中某個元組的存在是不確定的,那么數據庫對于該元組可能處于兩個不同的狀態--xxx個狀態包含該元組,而第二個狀態不包含該元組。同樣地,如果一個屬性可以取x、y或z中的一個值,那么數據庫就該屬性而言可以處于三種不同的狀態。這些狀態中的每一個都被稱為一個可能的世界。考慮下面這個數據庫。(這里{b3,b3′,b3′′}表示該屬性可以取b3,b3′或b3′′中的任何一個值)假設xxx個元組存在不確定性,第二個元組存在確定性,第三個元組中屬性B的值存在不確定性。那么數據庫的實際狀態可能包含也可能不包含xxx個元組(取決于它是否正確)。同樣地,屬性B的值可能是b3、b3′或b3′′。因此,對應于數據庫的可能世界如下。
不確定性的類型
編輯在概率數據庫中可能存在的不確定性基本上有兩種,如下表所述。通過給與數據項有關的隨機變量賦值,可以表示不同的可能世界。
內容由匿名用戶提供,本內容不代表www.gelinmeiz.com立場,內容投訴舉報請聯系www.gelinmeiz.com客服。如若轉載,請注明出處:http://www.gelinmeiz.com/170622/