• 數據擴散

    編輯
    本詞條由“匿名用戶” 建檔。

    什么是數據擴散

    編輯

    數據擴散是指企業和政府以前所未有的速度繼續生成大結構化和非結構化數據,以及嘗試存儲和管理這些數據導致的可用性問題。雖然最初涉及與紙質文檔相關的問題,但數據擴散已成為計算機上一級和二級數據存儲的主要問題。

    雖然數字存儲變得更便宜,但從原始電力維護以及從元數據搜索引擎的相關成本并沒有跟上數據的激增。盡管維護一個數據單元所需的功率已經下降,但容納數字存儲的設施成本卻趨于上升。

    在最簡單的層面上,公司電子郵件系統會產生大量數據。商務電子郵件——有些對企業很重要,有些則不那么重要——估計每年以25-30%的速度增長。無論是否相關,系統的負載都被多重尋址和附加大文本、音頻甚至視頻文件等做法放大。

    IBM全球技術服務

    自1971年8月以來,數據擴散一直是美國軍方面臨的一個問題,特別是在采購主要武器系統期間提交的過多文件方面。減輕數據擴散和與之相關的問題的努力正在進行中。

    數據擴散引起的問題

    編輯

    由于相對便宜的數據存儲設備的可用性,數據擴散問題正在影響所有商業領域。這使得在其可用性窗口過去后立即將數據轉儲到輔助存儲變得非常容易。這掩蓋了可能嚴重影響企業盈利能力和衛生服務、警察和安全部隊、地方和國家政府以及許多其他類型組織的有效運作的問題。數據擴散存在問題有幾個原因:

    • 嘗試查找和檢索信息時遇到困難。在施樂,員工平均每周需要一個多小時才能找到硬拷貝文件,管理和存儲這些文件每年要花費2,152美元。對于擁有10名以上員工的企業,這將增加到每周近兩個小時,每年5,760美元。在主要和輔助數據存儲的大型網絡中,查找電子數據的問題類似于查找硬拷貝數據的問題。
    • 數據雜亂無章、未正確復制或無法及時找到時的數據丟失和法律責任。2005年4月,Ameritrade控股公司告訴200,000名當前和過去的客戶,包含機密信息的磁帶在運輸過程中丟失或損壞。同年5月,時代華納公司報告稱,包含600,000名現任和前任員工個人數據的40盤磁帶在運往存儲設施的途中丟失。2005年3月,佛羅里達州的一名法官在審理針對摩根士丹利的27億美元訴訟時,發布了“不利推論”命令”針對該公司“故意和嚴重濫用其發現義務。”法官援引摩根士丹利的說法,在該公司聲稱已將所有此類磁帶移交給法院很久之后,摩根士丹利一再發現錯誤放置的電子郵件磁帶。
    • 管理日益混亂的數據存儲資源的人力需求增加。
    • 用戶搜索并再次搜索他們需要的材料時,由于流量過多而導致網絡和應用程序性能變慢。

    數據擴散

    • 運行存儲硬件所需的能源成本很高。一個100TB的系統每年的運行成本高達35,040美元——這還不包括冷卻成本。

    建議的解決方案

    編輯
    • 更好地利用現代技術的應用程序
    • 減少重復數據(尤其是由數據移動引起的)
    • 元數據結構的改進
    • 文件和存儲傳輸結構的改進
    • 用戶教育和紀律
    • 實施信息生命周期管理解決方案,以盡早消除低價值信息,然后將其余信息放入主動管理的長期存儲中,以便快速、廉價地訪問這些信息。

    內容由匿名用戶提供,本內容不代表www.gelinmeiz.com立場,內容投訴舉報請聯系www.gelinmeiz.com客服。如若轉載,請注明出處:http://www.gelinmeiz.com/132207/

    (3)
    詞條目錄
    1. 什么是數據擴散
    2. IBM全球技術服務
    3. 數據擴散引起的問題
    4. 建議的解決方案

    輕觸這里

    關閉目錄

    目錄
    91麻精品国产91久久久久