大數據定義
編輯大數據一詞自1990年代開始使用,有人稱贊John Mashey推廣了該術語。大數據通常包含的數據集的大小超出了常用軟件工具在可容忍的經過時間內捕獲、整理、管理和處理數據的能力。大數據哲學包含非結構化,半結構化和結構化數據,但是主要關注于非結構化數據。大數據“大小”是一個不斷移動的目標,如2012的范圍從幾十兆兆字節到許多澤字節的數據。大數據需要一套具有新的集成形式的技術和技術,以揭示來自多樣化,復雜且大規模的數據集的見解。
2018年的一個定義指出“大數據是需要并行計算工具處理數據的地方”,并指出,“這表示通過并行編程理論對所使用的計算機科學進行了明顯而明確的更改,并且損失了一些保證和保證。功能通過由Codd的關系模型?“。
該概念的日趨成熟更加清晰地描繪了“大數據”與“?商業智能?”?之間的區別:
- 商業智能使用應用數學工具和具有高信息密度的數據的描述性統計信息來衡量事物,檢測趨勢等。
- 大數據使用數學分析、優化、歸納統計和非線性系統識別中的概念,從信息密度低的大數據集中推斷定律(回歸,非線性關系和因果關系)以揭示關系和依存關系,或執行結果和行為的預測。
大數據的應用
編輯大數據極大地增加了信息管理專家的需求,以至于Software AG、Oracle Corporation、IBM、Microsoft、SAP、EMC、HP和Dell在專門從事數據管理和分析的軟件公司上花費了超過150億美元。2010年,該行業的價值超過1000億美元,并且每年以近10%的速度增長:大約是整個軟件業務的兩倍。
發達經濟體越來越多地使用數據密集型技術。全球有46億手機用戶,有10億至20億人訪問互聯網。在1990年至2005年之間,全世界有超過10億人進入中產階級,這意味著更多的人變得更加識字,這反過來又導致了信息的增長。世界上通過電信網絡交換信息的有效能力在1986年為281?PB,在1993?年為471?PB,在2000年為2.2 EB,在2007?年為65?EB ,并且預測到2014年每年的互聯網流量為667 EB。根據一項估計,全球存儲的信息的三分之一是字母數字文本和靜止圖像數據的形式,對于大多數大數據應用而言,這是最有用的格式。這也顯示出尚未使用的數據(即視頻和音頻內容形式)的潛力。
盡管許多供應商都提供大數據的現成解決方案,但專家建議開發量身定制的內部解決方案,以解決公司具有足夠技術能力的問題。
政府
在政府流程中使用和采用大數據可以提高生產力和創新效率,但并非沒有缺陷。數據分析通常需要政府的多個部門(中央和地方)進行協作,并創建新的創新流程以實現期望的結果。
國際發展
關于有效利用信息和通信技術促進發展的研究(也稱為ICT4D)表明,大數據技術可以做出重要貢獻,但也給國際發展帶來獨特挑戰。大數據分析的進步提供了具有成本效益的機會,可以改善關鍵發展領域的決策,例如衛生保健、就業、經濟生產力、犯罪、安全以及自然災害和資源管理。此外,用戶生成的數據還提供了新的機會來讓人們聽到未曾聽到的聲音。但是,發展中地區的長期挑戰(例如技術基礎設施不足以及經濟和人力資源稀缺)加劇了對大數據的現有擔憂,例如隱私,方法不完善以及互操作性問題。
制造業
根據TCS 2013全球趨勢研究,供應計劃和產品質量的改進為制造業提供了大數據的xxx利益。大數據為制造行業的透明度提供了基礎架構,這是解決不確定性(如組件性能和可用性不一致)的能力。預測性制造作為接近零停機時間和透明度的一種適用方法,需要大量數據和高級預測工具,才能將數據系統化為有用信息。預測制造的概念框架從數據獲取開始,在數據獲取中,可以獲取不同類型的感官數據,例如聲學,振動,壓力,電流,電壓和控制器數據。除了歷史數據外,大量的感官數據還構成了制造業中的大數據。生成的大數據可作為預測工具和預防策略(如預測和健康管理(PHM))的輸入。
醫療保健
大數據分析通過提供個性化的醫學和處方分析,臨床風險干預和預測分析,減少浪費和護理變異性,自動對患者數據進行內部和外部報告,標準化醫學術語和患者注冊表以及零散點解決方案,幫助醫療保健領域取得了進步。一些改進領域比實際實施更令人向往。在醫療保健系統內生成的數據水平并非無關緊要。隨著mHealth,eHealth和可穿戴技術的更多采用,數據量將繼續增加。這包括電子健康記錄數據,成像數據,患者生成的數據,傳感器數據以及其他難以處理的數據形式。現在,對此類環境的需求更大,它們將更加關注數據和信息質量。“大數據通常意味著“?臟數據?”,并且數據不準確率隨數據量的增長而增加。”?不可能在大數據規模上進行人工檢查,并且在醫療服務領域迫切需要智能工具,以實現準確性和可信度控制以及對丟失信息的處理。雖然醫療保健中的大量信息現在都可以電子化,但由于大多數都是非結構化且難以使用的,因此它適合大數據領域。在醫療保健中使用大數據帶來了重大的道德挑戰,從個人權利,隱私和自治權的風險到透明和信任的風險。
就探索性生物醫學研究而言,健康研究中的大數據尤其有希望,因為數據驅動的分析可以比假設驅動的研究更快地前進。然后,可以在傳統的,假設驅動的后續生物學研究以及最終的臨床研究中檢驗數據分析中看到的趨勢。
在醫療保健領域中,一個非常依賴大數據的相關應用子領域是醫學中的計算機輔助診斷領域。 只需回顧一下,例如,對于癲癇監測,習慣每天創建5到10 GB的數據。 同樣,乳房斷層合成的單個未壓縮圖像平均包含450 MB數據。 這些只是計算機輔助診斷使用大數據的眾多示例中的少數幾個。因此,大數據已被認為是計算機輔助診斷的七個關鍵挑戰之一。系統需要克服才能達到更高的性能水平。
教育
一個麥肯錫全球研究所研究發現,150萬名訓練有素的數據專業人員和管理人員短缺和一些大學包括田納西大學和加州大學伯克利分校,創造了碩士課程,以滿足這種需求。私人新兵訓練營還開發了滿足該需求的程序,包括免費程序(例如The Data Incubator)或付費程序(例如General Assembly)。在特定的行銷領域,Wedel和Kannan強調的問題之一市場營銷有幾個子域(例如:廣告、促銷、產品開發、品牌),它們都使用不同類型的數據。由于不希望采用一種千篇一律的分析解決方案,因此商學院應讓營銷經理做好對這些子領域中使用的所有不同技術的廣泛了解,從而獲得全面了解并與分析師有效合作。
媒體
要了解媒體如何利用大數據,首先必須在用于媒體處理的機制中提供一些上下文。Nick Couldry和Joseph Turow曾建議從業者媒體和廣告領域的研究人員采用大數據作為數百萬個人的許多可行信息點。該行業似乎正在擺脫使用特定媒體環境(例如報紙,雜志或電視節目)的傳統方法,而是利用可在最佳時間,在最佳位置到達目標人群的技術來吸引消費者。最終目的是提供或傳達與消費者的心態相符的消息或內容(從統計意義上來說)。例如,發布環境越來越多地定制消息(廣告)和內容(文章)以吸引通過各種數據挖掘活動專門收集的消費者。
英國公共電視臺廣播公司第四頻道是大數據和數據分析領域的領導者。
保險
健康保險提供者正在收集有關社會“健康決定因素”的數據,例如食物和電視消費、婚姻狀況、衣著大小和購買習慣,并據此對健康成本進行預測,以便發現客戶中的健康問題。這些預測當前是否用于定價尚有爭議。
物聯網(IoT)
大數據和物聯網協同工作。從物聯網設備提取的數據提供了設備互連性的映射。媒體行業,公司和政府已使用此類映射來更準確地定位其受眾并提高媒體效率。物聯網也越來越多地被用作收集感官數據的手段,并且這種感官數據已用于醫療,制造和運輸上下文中。
數字創新專家凱文·阿什頓(Kevin Ashton)創造了這個名詞,[91]在這句話中對物聯網進行了定義:“如果我們的計算機知道物聯網的全部知識,那就是使用它們收集的數據而無需我們的任何幫助。 -我們將能夠跟蹤和計算所有內容,并xxx減少浪費,損失和成本。我們會知道什么時候需要更換,修理或召回,以及它們是新鮮的還是過時的。”
信息技術
特別是自2015年以來,大數據已成為企業運營中的重要工具,可幫助員工更有效地工作并簡化信息技術(IT)的收集和分配。使用大數據解決企業內部的IT和數據收集問題稱為IT運營分析(ITOA)。通過將大數據原理應用到機器智能和深度計算的概念中,IT部門可以預測潛在問題,并在問題發生之前采取行動以提供解決方案。這一次,ITOA業務也開始在系統管理中發揮重要作用通過提供將各個數據孤島集合在一起并從整個系統(而不是孤立的數據袋)中產生見解的平臺。
內容由匿名用戶提供,本內容不代表www.gelinmeiz.com立場,內容投訴舉報請聯系www.gelinmeiz.com客服。如若轉載,請注明出處:http://www.gelinmeiz.com/19573/