企業的數據要轉向云存儲,首先要做的就是明確被轉移的數據范圍。不能簡單的把各個服務器數據庫照搬放入云數據中心,這樣會增加數據轉移耗費的時間、增大企業的運營成本, 同時,數據冗余大、垃圾數據多會對系統造成很大的隱患,導致系統工作異常。這里建議各個企業把重要的核心數據保留在傳統的煙囪式體系架構之中,對于一些類似于歸檔、提供查詢等不是很重要的信息, 則可以放入云存儲中心。這樣,各機構就可以有效利用云存儲按需付費的操作模式,將原本在固定數據存儲設備上的投入轉變為可以預算評估的運營成本,節約投入。
其次,云的網絡連接能力將是對數據云遷移操作的重要考驗。企業與云數據中心之間數PB的數據的來回切換是比較困難的。根據企業數據量大小不同以及網絡連接能力的高低,初次的數據遷移可能會持續相當長一段時間。這里,我建議各個機構在做數據云遷移前仔細檢查本機構的網絡情況并對內部網絡的安全現狀進行評估。雖然有些云供應商提出了用物理遷移的方法來代替網絡傳輸數據,但是我們要看到, 由于工作性質的原因, 有些類似于病人病歷、企業核心數據等敏感數據是不能被復制或采取物理遷移的方法帶走的。鑒于此,這里我推薦兩種方法: 當企業的數據吞吐量較大但是數據量不是特別多, 對傳輸延遲也沒過多要求時, 云供應商可以提供從企業到供應商某個存儲節點之間的私人鏈接, 方便企業遷移數據。企業可以根據自己的時間,在不影響公司正常運行的情況下做數據的轉移安排; 當企業的數據可以提供拷貝, 那么我們可以采用sneakernet的方式,即:人工網絡模式。將數據通過磁盤、移動存儲設備等從企業服務器拷入到云數據中心或者從云數據中心拷貝出米, 目前一些云供應商為了加快數據的轉移, 在給企業進行數據轉移時會采取一些切實有效的人工網絡模式, 例如某公司在給客戶進行數據轉移時會提供一個配置了雙干兆級以太網接口的存儲服務器, 當客戶的數據拷貝完畢, 公司就會帶走服務器并將數據拷貝到云數據中心。
再者, 為了將數據倉庫有效地轉移到云端,我們得適當結構化數據并使用正確的數據分析工具及遷移方法。目前,數據遷移主要有三種方式,即:系統切換前通過工具遷移、系統切換前采用手工錄入、系統切換后通過新系統生成。結合目前各個機構的情況, 我們采用“系統切換前通過工具遷移”方式居多。傳統關系型數據庫中的數據要轉移到云端非關系型數據庫需要面臨很多的問題,一是要解決如何從關系型數據庫中快速有效地抽取大量的數據到云文件系統和數據庫, 二是數據的轉換問題。不管采用什么方法和策略,數據遷移后一定要對數據進行校驗,檢查數據的完整性、一致性等。
接下來, 我們要關心數據云遷移過程中的安全性問題,制定一套安全有效的數據遷移方案對數據遷移進行安全管理是十分重要的。不管企業采用什么安全性數據轉移方案, 都必須注意數據的丟失和備份。對于敏感數據, 很多云供應是缺乏長期處理的經驗的。況且數據在云服務中采用的是共享存儲的方式,這會使得原本在傳統煙囪式架構中很易于實現的安全策略在云環境下變得具有風險性。這里建議企業在選擇云存儲服務商時應仔細評估, 認真查看云供應商提供的安全防護措施和采用的標準,并結合自己的實際情況提出適當的調整和修改。再者,數據的備份工作都是必不可少的。還應該對備份的數據進行測試,確保當出現一些異常情況時備份的數據可以使用。雖然一些云供應商會做這一步操作, 我們還是建議企業自己備份,企業可以利用云供應商提供的備份或數據導出功能來做這個操作。不管備份在什么地方, 我們都必須確保在數據轉移過程中受到嚴密的保護。并且要求云供應商提供監控功能,監控訪問數據的人員以及對核心數據的加密。
最后,如果企業對當前云供應商提供的服務不滿意需要更換服務商,如何在兩個服務商的云之間轉移數據?這應該是當前一一個很棘手的問題。由于目前云存儲還處在初級階段, 各個云供應商都采用自己的加密或傳輸機制以區別其它廠商。因此沒有一個規范和約束的統一標準。很多云存儲供應商無法直接將客戶數據遷移到另 一家供應商, 當服務出現故障時,數據將返還給客戶, 然后客戶要冉找另一家云供應商, 或者將數據存儲在本地服務器。這樣會無形中增加很多繁瑣的工作量。這里建議各個云供應商提供一組云數據管理的應用編程接口API, 可以實現不同云供應商之間的數據傳輸, 讓數據遷移更為便捷。