機房專用空調組織如何管理PB級數(shù)據(jù)?
眾所周知,,處理PB級數(shù)據(jù)要比處理TB級數(shù)據(jù)要難的多,。而假如處理不當,可能會為組織帶來很大的丟掉,,更糟糕的是假如主導數(shù)據(jù)丟掉,,甚至可以讓組織可能丟掉上百萬美元。關于TB級數(shù)據(jù),,組織可以疏忽或選用暴力破解技術,,而這在處理PB級數(shù)據(jù)時將會成為不可逾越的阻礙。處理這一等級數(shù)據(jù)的關鍵是了解所面臨的阻礙是什么,,并以專心的處理方法為他們做好預備,。
許多數(shù)據(jù)中心面臨的最大應戰(zhàn)對錯結構化數(shù)據(jù)的極大增加。盡管結構化數(shù)據(jù)在以前10至20年間有所增加,,但在以前幾年中,,非結構化數(shù)據(jù)的來歷以及人們運用所述數(shù)據(jù)的才能現(xiàn)已明顯增加。非結構化數(shù)據(jù)處理面臨的應戰(zhàn)之一是,,一般很難判定何時刪去它,。
例如,從以往的會計年度選擇全部財務記載,,將其歸檔并從主存儲系統(tǒng)中刪去對錯常簡略的,。用非結構化數(shù)據(jù)來做這個并不是那么簡略。會計所面臨的其間一個應戰(zhàn)對錯結構化數(shù)據(jù)一般由無數(shù)人具有的,,而不是一個共同的應用程序,。
組織的業(yè)務環(huán)境中可能存在數(shù)千個用戶和數(shù)百個應用程序,,用于創(chuàng)建非結構化數(shù)據(jù),并且當一條非結構化數(shù)據(jù)變得有用時,,一般對此并不清楚,,因此沒有人想要刪去任何內容。短少具體的問責制導致大部分數(shù)據(jù)處于非活動情況,,而這與數(shù)據(jù)占用空間無關,。只需組織依托數(shù)據(jù)創(chuàng)建者來辨認和搬家那些陳腐的和未運用的數(shù)據(jù),那么非活動數(shù)據(jù)將始終是一個問題,。
當人們檢查備份系統(tǒng)的問題,,主存儲系統(tǒng)日益脹大的問題就會變得更加令人重視。因為大多數(shù)備份系統(tǒng)都處理全部非結構化數(shù)據(jù),,因此都會運用相同的戰(zhàn)略來備份非常重要的數(shù)據(jù)和非活動數(shù)據(jù),。因為數(shù)據(jù)是混合的,所以根柢無法處理全部數(shù)據(jù),。許多人每周進行全面?zhèn)浞?,然后進行每日增量備份,保存至少六個月,,或許可能是一年或更長時間,。
假如保存至少90天的每周無缺備份,就會看到12份無人重視的數(shù)據(jù)副本,。假如存儲該數(shù)據(jù)的現(xiàn)場和非現(xiàn)場副本,,就會檢查到該數(shù)據(jù)的24個副本,其間大部分對錯活動的,。關于一個2TB的組織數(shù)據(jù)來說,,這將會存儲48TB的數(shù)據(jù),當然許多數(shù)據(jù)是可處理的,。而這種存儲的作業(yè)數(shù)據(jù),,48TB數(shù)據(jù)大約選用十幾個磁帶介質或硬盤驅動器進行存儲。但關于1PB客戶來說,,每年24,000TB的數(shù)據(jù)或大約選用6000個存儲介質進行存儲,。
存儲在備份系統(tǒng)上的非活動數(shù)據(jù)的額外副本會發(fā)作許多不必要的結果。假如組織正在運用磁盤存儲,,則此數(shù)據(jù)的存儲和仿制具有與之相關的本錢,。假如組織的存儲不運用重復數(shù)據(jù)刪去,那么存儲這些額外的數(shù)據(jù)副本的本錢可能是個天文數(shù)字,。假如組織運用重復數(shù)據(jù)刪去技術,,這些本錢將會有點混雜。盡管組織的重復數(shù)據(jù)刪去存儲系統(tǒng)可以在存儲一個副本的空間中存儲20個副本,,但是這些會收取必定費用,,此外組織還需為額外的存儲空間付費,,只是以不同的方法付出。有些人這么說:重復數(shù)據(jù)刪去系統(tǒng)使1TB存儲看起來像20TB的存儲空間,,但是它們只收取10TB的存儲空間,。這意味著他們現(xiàn)已弄清楚怎樣收取10TB的存儲空間的費用,而供給的卻是1TB的存儲空間,。
在備份系統(tǒng)中運用重復數(shù)據(jù)刪去的大多數(shù)組織也在方程式的政策端履行,,這意味著對非活動數(shù)據(jù)的重復徹底備份仍會在備份客戶端發(fā)作問題。徹底備份對正在備份的系統(tǒng)和發(fā)送備份的網(wǎng)絡具有功用方面影響,,因此,,重復的非活動數(shù)據(jù)的徹底備份會使組織的花費更多,因為需求購買更健壯的服務器和更快的網(wǎng)絡,。
在數(shù)據(jù)恢復過程中也會呈現(xiàn)備份非活動數(shù)據(jù)的應戰(zhàn),。考慮一個具有PB級數(shù)據(jù)的數(shù)據(jù)中心的場景,,其間900TB數(shù)據(jù)是活動的,。恢復1PB的數(shù)據(jù)是一項嚴峻的任務,,需求恰當長的時間。夢想一下,,假如只需求恢復組織實踐運用的100TB數(shù)據(jù),,那么這種恢復是不是要快得多?
用戶從不刪去任何東西所帶來的另一個應戰(zhàn)是,,的確正需求的時分很難找到任何東西,。這使全部的存儲數(shù)據(jù)就是像屋子里放滿雜物的抽屜,很難找到想要找的東西,。就會發(fā)現(xiàn)不再運用的手機充電器,,回形針,舊電池,,發(fā)夾等雜暢所欲言,,什么都有,但就沒有所要找的東西,。主存儲系統(tǒng)也選用這種相同的方法,,因此當填充大多數(shù)不活動的數(shù)據(jù)時,很難找到活動的數(shù)據(jù)文件,。
此外,,即使一個用戶在筆記本電腦中企圖查找文件也會存在這個問題。夢想一下,,當人們議論數(shù)千個用戶和PB級數(shù)據(jù)時,,這個問題是多么的巨大,。這可以導致重要的文件丟掉,使它們質上毫無價值,。結果是用戶將重復他們的極力,,偏重新創(chuàng)建文件,因此這讓非結構化數(shù)據(jù)問題的增加變得更加糟糕,。
具有PB級數(shù)據(jù)的規(guī)劃更大的企業(yè)同樣也存在這樣的問題,,他們一般面臨不同的用戶在多個方位創(chuàng)建和運用不同的文件中的問題。他們可能希望可以共享一些數(shù)據(jù),,但是關所以PB級數(shù)據(jù)來說,,這是恰當困難的。這也加劇了“廢物抽屜”問題,。在廢物抽屜里找到什么東西很難,,但假如不判定在哪個廢物抽屜來找時,那就更難了,。
招認寬和決非結構化數(shù)據(jù)問題
處理非結構化數(shù)據(jù)問題的僅有方法就是招認它的存在,。招認在大環(huán)境中很難找到文件,甚至更難同享,。招認核算,、網(wǎng)絡和存儲資源的很大一部分用于存儲、仿制和備份非活動數(shù)據(jù),。
處理這些問題的一個方法是創(chuàng)建一個全局共同的文件系統(tǒng),,將全部上述問題考慮在內。這并不能處理用戶創(chuàng)建數(shù)百萬個文件并將它們永久留在那里的問題,,但它至少把問題放在一個可以會合處理和處理問題的保護傘下,。呈現(xiàn)一次問題,就處理一次,,而不是在企業(yè)中屢次處理這些問題,。
是吊銷存檔的時分嗎?
規(guī)劃這么大的文件系統(tǒng)應該通過高檔元數(shù)據(jù)進行集成查找,。用戶可以通過許多不同的元數(shù)據(jù)輕松地查找,,以便找到他們正在處理的文件。他們當然會持續(xù)具有一般運用的文件系統(tǒng)語義,,使它們可以創(chuàng)建目錄或子目錄來幫忙他們拾掇他們的文件,。具有聯(lián)合查找的單個文件系統(tǒng)還將容許他們查找其他人正在處理與他們感興趣的元數(shù)據(jù)相匹配的文件。
最重要的是,,為處理這個問題而規(guī)劃的文件系統(tǒng)有必要了解活動和非活動的數(shù)據(jù),,它有必要以不同的方法處理。最明顯的做法是主動辨認并將非活動數(shù)據(jù)搬家到本錢更低的自我保護方針存儲,。這將處理上述一些問題,,包括在主存儲和備份存儲中的空間糟蹋,。了解活動和非活動數(shù)據(jù)之間的差異的文件系統(tǒng)也有助于更簡略地查找文件,因為這是可以用于查找的元數(shù)據(jù)之一,。
一個單一的全局文件系統(tǒng)也可以幫忙世界各地的用戶同享數(shù)據(jù),。多個辦公室的用戶可以查找同一個全局文件系統(tǒng),找到他們正在尋找的數(shù)據(jù)類型,,并當即拜訪它,,假如他們具有恰當?shù)臋嘞薜脑挕R驗槿治募到y(tǒng)了解非活動數(shù)據(jù)的概念,,所以查找(假如用戶需求的話)也可以包括非活動數(shù)據(jù),。
將非活動數(shù)據(jù)搬家到本錢更低的方針存儲的簡略行為也釋放了備份系統(tǒng)的壓力。它使備份和恢復更快,,因為它們不必處理非活動數(shù)據(jù),,因此也節(jié)省了許多的存儲空間。有些人認為存儲在自保護方針存儲中的數(shù)據(jù)根柢不需求備份,。假如用戶決議備份,,可以這樣做,以辨認其性質,,并在備份系統(tǒng)中存儲少得多的非活動數(shù)據(jù)副本,。
這個問題現(xiàn)已存在多年。企業(yè)如同關于非結構化數(shù)據(jù)的巴望是永無止境的,,IT應用程序開發(fā)人員正在開發(fā)利用非結構化數(shù)據(jù)的新方法,,使得具有這樣的數(shù)據(jù)更具吸引力。非結構化數(shù)據(jù)的增加不太可能很快消失,,所以用戶最好的方法就是處理問題。一個很好的方法是選用一個全局文件系統(tǒng),,用于處理問題,,這包括了解元數(shù)據(jù)以及將非活動數(shù)據(jù)主動搬家到本錢較低的方針存儲。
文章來源:精密空調foleader.com