沃信數(shù)據(jù)容災(zāi)方案實施步驟如下:
1. 通過沃信數(shù)據(jù)遷移工具將某個時間點的數(shù)據(jù)從生產(chǎn)數(shù)據(jù)庫遷移到備份數(shù)據(jù)庫,當(dāng)然,也可以采用冷備份方式(磁帶備份恢復(fù))進行數(shù)據(jù)遷移。見上圖中第一步。
2. 數(shù)據(jù)遷移完成后,沃信數(shù)據(jù)同步工具將從備份點往后開始數(shù)據(jù)同步,按照生產(chǎn)系統(tǒng)上交易發(fā)生順序,將生產(chǎn)數(shù)據(jù)庫的變化同步到備份數(shù)據(jù)庫,并保證兩端數(shù)據(jù)一致性。這也是最經(jīng)常的應(yīng)用方式,見上圖中第二步(綠色線路)。
3. 正常情況下,上圖中第三步的紅色線路是不會啟用的,這是一個反向同步操作,只有當(dāng)生產(chǎn)數(shù)據(jù)庫故障或需要進行滾動維護升級時,才需要啟動紅色線路,此時步驟如下:
ü 生產(chǎn)系統(tǒng)故障時:
a) 首先備份數(shù)據(jù)庫將數(shù)據(jù)同步到故障發(fā)生時的最后數(shù)據(jù),然后停止綠色線路,由備份數(shù)據(jù)庫繼續(xù)提供服務(wù),啟動紅色線路,進行反向數(shù)據(jù)同步。如果是生產(chǎn)數(shù)據(jù)庫和備份數(shù)據(jù)庫是負(fù)載均衡模式,那么不需要進行切換,如果是其他模式,則需要將備份數(shù)據(jù)庫切換為生產(chǎn)數(shù)據(jù)庫。
b) 沃信數(shù)據(jù)同步工具從備份數(shù)據(jù)庫中獲取Redo Log來跟蹤備份數(shù)據(jù)庫的變化,并進行正常的日志分析。
c) 如果生產(chǎn)數(shù)據(jù)庫恢復(fù)正常,沃信數(shù)據(jù)同步工具將分析出的SQL語句在生產(chǎn)數(shù)據(jù)庫上重做,讓生產(chǎn)數(shù)據(jù)庫的數(shù)據(jù)與備份數(shù)據(jù)庫一致。
d) 當(dāng)數(shù)據(jù)同步后,如果生產(chǎn)數(shù)據(jù)庫和備份數(shù)據(jù)庫是負(fù)載均衡的,那么可以開放生產(chǎn)數(shù)據(jù)庫,開始提供業(yè)務(wù)服務(wù)。否則,需要停止紅色線路,讓生產(chǎn)數(shù)據(jù)庫對外提供服務(wù),然后恢復(fù)綠色線路,恢復(fù)到正常工作模式。
ü 滾動維護升級時:除了因故障導(dǎo)致必須被動停止綠色線路,改成主動停止生產(chǎn)數(shù)據(jù)庫對外服務(wù),再停止綠色線路,然后進行生產(chǎn)數(shù)據(jù)庫維護升級,并且在備份數(shù)據(jù)庫維護升級前需要停止備份數(shù)據(jù)庫對外服務(wù)外,其他步驟與生產(chǎn)故障時的步驟相同。
a) 首先主數(shù)據(jù)庫的對外服務(wù),將備份數(shù)據(jù)庫數(shù)據(jù)同步到主數(shù)據(jù)庫的最后數(shù)據(jù),然后停止綠色線路,進行數(shù)據(jù)庫切換,由備份數(shù)據(jù)庫繼續(xù)提供服務(wù),進行主數(shù)據(jù)庫硬件維護或軟件升級,同時啟動紅色線路,進行反向數(shù)據(jù)同步。
b) 沃信數(shù)據(jù)同步工具從備份數(shù)據(jù)庫中獲取Redo Log來跟蹤備份數(shù)據(jù)庫的變化,并進行正常的日志分析。
c) 等生產(chǎn)數(shù)據(jù)庫維護升級完成,正常啟動后,沃信數(shù)據(jù)同步工具將分析出的SQL語句在生產(chǎn)數(shù)據(jù)庫上重做,讓生產(chǎn)數(shù)據(jù)庫的數(shù)據(jù)與備份數(shù)據(jù)庫一致。
d) 當(dāng)數(shù)據(jù)同步后,如果生產(chǎn)數(shù)據(jù)庫和備份數(shù)據(jù)庫是負(fù)載均衡的,那么可以開放生產(chǎn)數(shù)據(jù)庫,開始提供業(yè)務(wù)服務(wù)。否則,需要停止紅色線路,進行數(shù)據(jù)庫切換,讓生產(chǎn)數(shù)據(jù)庫對外提供服務(wù),然后恢復(fù)綠色線路,恢復(fù)到正常工作模式。
4. 備份數(shù)據(jù)庫故障:當(dāng)備份數(shù)據(jù)庫大面積故障時,可以停止裝載進程,進行備份數(shù)據(jù)庫維護,修復(fù)故障后,重啟裝載進程,恢復(fù)到正常同步過程。如果備份數(shù)據(jù)庫單個表發(fā)生故障,導(dǎo)致針對該表的裝載步驟出錯時,沃信容災(zāi)系統(tǒng)允許跳過該表的部分交易,繼續(xù)進行后續(xù)交易同步,不影響整體容災(zāi)過程。同時,可以利用數(shù)據(jù)遷移工具和數(shù)據(jù)校驗工具補充跳過部分的交易數(shù)據(jù),使整個數(shù)據(jù)庫恢復(fù)正常。
5. 沃信容災(zāi)系統(tǒng)故障:沃信容災(zāi)系統(tǒng)相關(guān)進程均可獨立重啟,一旦某個進程發(fā)生故障,重新啟動該進程,系統(tǒng)會保證數(shù)據(jù)一致性,并從故障前最后的正常數(shù)據(jù)開始進行后續(xù)處理,除了故障階段的時間延遲外,不會影響容災(zāi)過程的正確性和數(shù)據(jù)一致性、完整性。