English

備份工(gōng)作的核心是恢複

數據備份的根本目的,是重新利用,這也就是說,備份工(gōng)作的核心是恢複,一(yī)個無法恢複的備份,對任何系統來說都是毫無意義的。在實際情況中(zhōng),廠商(shāng)或集成商(shāng)更多的是向用戶吹噓,自己的産品在備份過程中(zhōng)如何的巧妙。然而,作爲最終用戶,一(yī)定需要清醒的認識到,能夠安全、方便而又(yòu)高效的恢複數據,才是備份系統的真正生(shēng)命所在。也許很多人會以爲,既然備份系統已經把需要的數據備份下(xià)來了,恢複應該不成什麽問題。這就大(dà)錯而特錯了,事實上,無論是在金融電(diàn)信行業的數據中(zhōng)心,還是在普通的桌面級系統中(zhōng),備份數據無法恢複,從而導緻數據丢失的例子實在太多了。就在日前,我(wǒ)國西北(běi)地區的一(yī)個省級電(diàn)信運營商(shāng)還糟此劫難,系統數據遺失殆盡,該運營商(shāng)的聲譽和衆多用戶的利益都受到了重大(dà)損害。這次事故的主要責任者之一(yī),就是一(yī)個全球知(zhī)名的備份軟件廠商(shāng),因爲其提供的備份産品沒能正常恢複系統數據。

衆所周知(zhī),建造大(dà)樓時一(yī)定會配備消防系統,但是,并非有了消防系統就能高枕無憂。人們經常獲悉,有的樓房突遭火(huǒ)災時,消防系統卻無故癱瘓了,或者消防栓裏沒有水,或者消防通道被堵塞,以緻火(huǒ)勢蔓延,造成巨大(dà)的生(shēng)命财産損失。因此,并非所有的消防系統,在遭遇火(huǒ)災時都能起作用。一(yī)樣的道理,數據備份設施之于IT系統,就相當于消防系統之于樓房,它是保護IT系統的最後一(yī)道防線。即使配備了數據備份設施,并不表明在IT系統遇到問題時一(yī)定能将丢失的數據成功恢複。

爲了進一(yī)步闡明恢複的重要性,讓我(wǒ)們再來對比一(yī)下(xià)備份和恢複操作的區别。

一(yī).備份是計劃内的工(gōng)作,而恢複則是計劃外(wài)的工(gōng)作。

對于IT技術人員(yuán)來說,備份是按照既定的備份策略,每隔一(yī)定時間,按部就班地操作即可。而恢複,則是隻有當發生(shēng)數據丢失時,或者要查找曆史數據時,才會進行的操作。通常情況下(xià),實施恢複操作時,往往都是十萬火(huǒ)急,越快越好,同時還希望恢複後的數據可用。

由于備份對系統的影響比較大(dà),所以備份的工(gōng)作往往是在特定的時間内完成的,也即所謂的“備份窗口”,這時生(shēng)産系統通常不工(gōng)作。而恢複,因爲是計劃外(wài)的工(gōng)作,對生(shēng)産系統肯定會産生(shēng)影響。下(xià)面以電(diàn)子郵件數據的備份和恢複爲例,來說明恢複對系統的影響。

假定您對電(diàn)子郵件系統的備份策略是每晚八點定時備份到磁帶,備份完成後磁帶裏就會保存有昨天晚上八點之前收到的所有電(diàn)子郵件。當然,收發電(diàn)子郵件是一(yī)個連續的動作,晚上八點後,郵箱仍然在不停地收郵件。假設到了今天中(zhōng)午12點,您發現某一(yī)個重要的郵件不小(xiǎo)心被删掉了,如果這個郵件是昨天晚上八點前收到的,那麽您還是有可能從磁帶裏恢複該郵件。這時就要啓動恢複操作了。

如果備份軟件能夠實現郵件一(yī)級的恢複(恢複顆粒是單個郵件)的話(huà),您隻要能找到那封丢失的郵件,直接将它恢複到郵箱就可以了,恢複的過程對整個郵件系統沒有任何影響;但是,如果您的備份軟件隻能做到郵箱級的恢複(恢複顆粒是一(yī)個郵箱),那麽如果您想恢複該郵件的話(huà),就不得不把整個郵箱恢複到昨晚八時的狀态,造成的後果就是昨天晚上八點到今天上午12點收進的郵件會全部被覆蓋。可見,如果從備份的角度來說,兩者沒什麽區别;但是從恢複的角度來講,兩者差别很大(dà)。

二. 備份是大(dà)批量的數據移動過程,往往需要将所有數據或所有增量數據全部拷貝到備份設備,而恢複往往是少量的數據移動過程,隻需将需要恢複的數據從備份設備拷貝回主服務器。

現在市場上流行的很多備份軟件,基本上都是在上世紀80年代設計的,那時的數據量相對較小(xiǎo)(幾十兆到幾百兆)。當進行備份操作的時候,備份軟件會把所需要備份的數據文件打包成一(yī)個備份集(backup set),然後将它拷貝至備份設備中(zhōng),并且針對該備份集形成相對應的索引,但一(yī)般不會對備份集裏的内容建立詳細的索引。那麽當需要恢複該備份集中(zhōng)的某一(yī)個文件時,備份軟件就必須從備份集中(zhōng)搜索到該文件,然後進行恢複。這在隻有幾百兆數據量的IT環境下(xià)完全可行,然而來到我(wǒ)們目前所處的海量數據的時代,由于數據量已經高達幾十甚至幾百TB,如果繼續沿用這種方式,勢必産生(shēng)許多問題:從浩如煙淼的備份數據裏,找到并恢複您需要的那一(yī)個,難度無異于大(dà)海撈針!例如,有的用戶去(qù)電(diàn)信公司要求查詢自己的曆史話(huà)單(如兩年前的某一(yī)個月的通話(huà)記錄),今天,很多電(diàn)信公司無法滿足用戶的這一(yī)需求,因爲很多情況下(xià)明知(zhī)該曆史話(huà)單一(yī)定存在于原先的備份介質中(zhōng),但由于數據量實在太大(dà),幾乎沒有可操作性。這種情況下(xià),備份雖然是成功的,但是恢複的成功率卻很低。

META Group在2004年4月的一(yī)份題爲“Proactive Data Protection”的調查揭示了數據恢複的真相:

  1. 恢複作業的平均成功率隻有70%左右;

  2. 主要的恢複需求是恢複單個文件或單個表空間,而不是整個卷;

  3. 而恢複單個文件至少要花1個小(xiǎo)時, 有時甚至要接近1天。

所以,當考慮數據保護時,應着眼于“恢複”,需着重考慮以下(xià)幾點:

1.确保數據能夠恢複

2.恢複速度要盡量快

3.恢複操作對系統的影響要盡可能小(xiǎo)

4.能夠恢複到用戶指定的時間點

5.恢複的數據是可以使用的

當然,恢複是在備份的基礎上進行的,如果備份失敗,恢複肯定不會成功。爲了确保能達到恢複的目的,對備份操作有以下(xià)幾點基本要求:

1.提高備份成功率

備份過程中(zhōng),當備份介質、備份設備和網絡出現問題時,備份作業就會中(zhōng)斷,要提高備份的成功率,備份系統就應具有容錯機制。如果是備份介質或備份設備出現問題,可以将備份自動切換到其他的備份介質、設備或路徑上,并能确保從中(zhōng)斷處繼續備份操作。另外(wài),“備份的斷點續傳”也很重要,當網絡發生(shēng)阻塞時,備份也會中(zhōng)斷;一(yī)旦網絡恢複正常,備份能從中(zhōng)斷處自動重啓并繼續進行。

2.精細的備份數據索引

當用戶希望恢複數據時,絕大(dà)多數情況下(xià)并不需要恢複整個系統,而隻要恢複部分(fēn)數據,甚至隻是一(yī)個文件或郵件。索引做得足夠精細,有利于在恢複時能快速查找并定位所需要恢複的數據,實現小(xiǎo)顆粒恢複,同時将對系統的影響降到最小(xiǎo),恢複速度大(dà)幅提高。

3.能産生(shēng)多個數據副本

爲了防止備份數據意外(wài)損壞,産生(shēng)多個備份副本是必要的,也很有效。産生(shēng)數據副本的方法有兩種:同步和異步。同步的方法是,在備份時,同時把備份數據寫入到兩個不同的介質中(zhōng);異步的做法是,先把備份數據寫入一(yī)個介質,然後再利用空閑時段,将備份數據複制到其他介質上。當然也可以通過網絡将其複制到異地,達到數據容災的目的。

4.離(lí)場保護

如果數據備份是爲了恢複而進行的,就應該考慮到萬一(yī)數據中(zhōng)心遭遇災難時,怎樣進行恢複。這時“離(lí)場保護”中(zhōng)保存的數據副本就會起到很大(dà)的作用。

5.操作界面應足夠簡單

用戶界面應該面向恢複,而非面向備份。在面向數據恢複的用戶界面,所有的備份數據是按照數據原先的結構來組織的,需要恢複哪個數據,很快就能找到,輕松點擊一(yī)下(xià)就能恢複該數據了。

聯系我(wǒ)們