欧美日韩日日夜夜,成人做爰视频www网站小优视频,精品成人自拍视频,国产成人aaaa

推廣 熱搜: 系統(tǒng)  弱電系統(tǒng)  無線覆蓋  WMS  信息  弱電  網(wǎng)絡(luò)  解決方案  行業(yè)  息系統(tǒng) 

HACMP的概念和原理

   日期:2015-03-31     瀏覽:393    評論:0    
核心提示:容災(zāi)冗余,災(zāi)備

 HACMP的概念和原理

關(guān)鍵業(yè)務(wù)的連續(xù)性可以通過以下三個層次的方法實(shí)現(xiàn):

磁帶備份

磁帶備份是實(shí)現(xiàn)基本的業(yè)務(wù)連續(xù)的通用方法。信息先備份到磁帶上,然后送到另外的地點(diǎn)保存。這種方法的問題在于磁帶備份往往需要較長的時間來記錄數(shù)據(jù)。另外,在數(shù)據(jù)備份過程中或者做數(shù)據(jù)備份前的系統(tǒng)或環(huán)境故障很可能造成數(shù)據(jù)丟失。而且,從備份磁帶上恢復(fù)數(shù)據(jù)也需要很長的時間,數(shù)據(jù)存儲得越多,恢復(fù)的時間越長。

高可用系統(tǒng)

高可用系統(tǒng)一般是在一個地點(diǎn),通過高可用軟件將一組服務(wù)器連接在一起,組成一個群集。IBM的HACMP for AIX和HP的MC/ServiceGuard就是這樣的群集產(chǎn)品,通過快速地將用戶、應(yīng)用和數(shù)據(jù)從發(fā)生硬件或軟件故障的機(jī)器切換至其它機(jī)器來提供高可用計(jì)算環(huán)境。

容錯系統(tǒng)

容錯系統(tǒng)依賴于冗余的硬件設(shè)備和軟件來實(shí)現(xiàn)關(guān)鍵業(yè)務(wù)的連續(xù)性。雖然容錯系統(tǒng)是避免宕機(jī)和數(shù)據(jù)丟失的有效方法,但是購買、操作和維護(hù)容錯系統(tǒng)都是非常昂貴的。另外,系統(tǒng)的升級也需要很大的代價。
用戶可以根據(jù)自己的應(yīng)用情況選擇適合自己的方法實(shí)現(xiàn)關(guān)鍵業(yè)務(wù)的連續(xù)性。

HACMP簡介

IBM公司的HACMP for AIX軟件是基于AIX平臺的,在高可用系統(tǒng)層次實(shí)現(xiàn)關(guān)鍵性任務(wù)計(jì)算環(huán)境的工具軟件。HACMP應(yīng)用于RS/6000系列的單處理器機(jī)型、對稱多處理器機(jī)型或SP的節(jié)點(diǎn),可以檢測系統(tǒng)故障并快速恢復(fù)服務(wù),使最終用戶只感受到很小的中斷時間。HACMP(High Availability Cluster Multi-Processing)有兩個主要的組成部分:高可用技術(shù)(HA)和群集多處理技術(shù)(CMP)。

高可用技術(shù)(HA)
在HA產(chǎn)品出現(xiàn)之前,在UNIX領(lǐng)域?qū)崿F(xiàn)高可用性的最有效途徑是通過容錯技術(shù)。容錯技術(shù)依靠專門的硬件設(shè)備檢測到硬件的故障,然后立即切換至冗余的硬件設(shè)備上,不管故障設(shè)備是處理器、內(nèi)存板、電源、I/O子系統(tǒng)還是存儲子系統(tǒng)。盡管這種切換能夠無縫地提供不間斷的服務(wù),但卻在硬件費(fèi)用和性能上付出了很高的代價,因?yàn)槿哂嗟脑O(shè)備不能處理事務(wù)。更重要的是,容錯系統(tǒng)不能處理軟件故障,而這卻是宕機(jī)的最常見的原因。
高可用技術(shù)并不是通過將可用性當(dāng)作一系列重復(fù)的物理設(shè)備來實(shí)現(xiàn)高可用性,它將高可用性看作是一個全系統(tǒng)范圍的、共享的資源的集合,這些資源相互協(xié)作來保證關(guān)鍵的服務(wù)。高可用技術(shù)將軟件和工業(yè)標(biāo)準(zhǔn)的硬件結(jié)合起來,在系統(tǒng)、設(shè)備或應(yīng)用發(fā)生故障時通過快速恢復(fù)關(guān)鍵服務(wù)來使宕機(jī)時間減至最小。盡管不能立即切換,恢復(fù)服務(wù)也是很快的,通常在1分鐘之內(nèi)。
容錯技術(shù)和高可用技術(shù)的區(qū)別在于服務(wù)中斷的時間。當(dāng)硬件發(fā)生故障時,容錯環(huán)境沒有宕機(jī)時間,而高可用環(huán)境有很小的宕機(jī)時間。但是,在容錯環(huán)境中,由于軟件故障無法被檢測,有可能造成系統(tǒng)的嚴(yán)重破壞。而在高可用環(huán)境中,軟件故障只會造成很小的宕機(jī)時間。
現(xiàn)在,大多數(shù)的公司都愿意忍受一小段的宕機(jī)時間,采用高可用技術(shù),而不愿意花費(fèi)高得多的代價采用只能檢測硬件故障的容錯技術(shù)。另外,在高可用配置中,備份機(jī)還可承擔(dān)其他應(yīng)用。

群集多處理技術(shù)(CMP)
群集多處理技術(shù)是指一組松散耦合的機(jī)器,通過網(wǎng)絡(luò)連接在一起,共享磁盤資源。在群集中,多個服務(wù)器協(xié)同工作,為用戶提供一組服務(wù)或資源。
將兩個或多個服務(wù)器組成群集來備份關(guān)鍵應(yīng)用是一個劃算的高可用性解決方案。用戶可以使用更多的技術(shù)能力,同時確保關(guān)鍵應(yīng)用在硬件或軟件故障后能夠快速恢復(fù)正常工作。
群集多處理技術(shù)還為客戶提供了靈活的擴(kuò)展途徑??蛻艨梢院苋菀椎卦谌杭性黾犹幚砥饕苑謸?dān)不斷增加的工作量,還可以對群集中的處理器進(jìn)行升級。而在容錯環(huán)境中,則必須同時增加兩個處理器,其中一個作為冗余備份,在正常工作時不進(jìn)行任何處理。

1.1 HACMP中術(shù)語的定義

群集(Cluster):
多個服務(wù)器節(jié)點(diǎn)一起工作,使用TCP/IP進(jìn)行通訊,每個節(jié)點(diǎn)上運(yùn)行Cluster Manager進(jìn)程。

節(jié)點(diǎn)(Node):
群集中的每個運(yùn)行Cluster Manager進(jìn)程的獨(dú)立的機(jī)器。節(jié)點(diǎn)是HACMP的核心部分,節(jié)點(diǎn)上運(yùn)行AIX操作系統(tǒng)和HACMP for AIX軟件。在HACMP群集中,每個節(jié)點(diǎn)有一個唯一的節(jié)點(diǎn)名。一個節(jié)點(diǎn)可能擁有一組資源??――磁盤、卷組、文件系統(tǒng)、網(wǎng)絡(luò)、網(wǎng)絡(luò)地址和應(yīng)用。節(jié)點(diǎn)上一般運(yùn)行著訪問共享磁盤上數(shù)據(jù)的“后臺”應(yīng)用。

資源(Resources):
由一個節(jié)點(diǎn)控制的實(shí)體,當(dāng)節(jié)點(diǎn)發(fā)生故障時能夠被其它節(jié)點(diǎn)接管。可以被當(dāng)作資源的實(shí)體有:
1、磁盤、卷組、文件系統(tǒng)
2、NFS輸出的文件系統(tǒng)
3、IP地址
4、應(yīng)用程序

關(guān)鍵應(yīng)用(Critical Application):
由HACMP控制其啟動和停止的應(yīng)用程序,例如數(shù)據(jù)庫的后臺進(jìn)程。

事件(Event):
群集中發(fā)生的一些事情,即群集狀態(tài)的改變,包括節(jié)點(diǎn)up/down,網(wǎng)絡(luò)up/down,網(wǎng)卡故障等等。

行為(Behavior):
事件發(fā)生時群集的響應(yīng)動作。事件是由shell腳本控制的。

重聚(Reintegration):
將故障節(jié)點(diǎn)、網(wǎng)絡(luò)、網(wǎng)卡重新帶回群集的過程。

1.3  HACMP群集的硬件組成

節(jié)點(diǎn)、共享磁盤設(shè)備、網(wǎng)絡(luò)和網(wǎng)卡、客戶機(jī)

節(jié)點(diǎn)機(jī)型:

HACMP for AIX軟件支持RS/6000單處理器和SMP機(jī)型作為群集的節(jié)點(diǎn)。在HACMP中,SMP系統(tǒng)和單處理器機(jī)型一樣,都被當(dāng)作單一節(jié)點(diǎn)。采用SMP系統(tǒng)是提高整個群集吞吐量的有效途徑。群集中的每個節(jié)點(diǎn)都可以是一個大的SMP系統(tǒng),使得群集系統(tǒng)遠(yuǎn)遠(yuǎn)超過單個系統(tǒng)的處理能力,可以支持成千上萬個客戶機(jī)連接到單一的數(shù)據(jù)庫系統(tǒng)。

共享磁盤設(shè)備

群集中的每個節(jié)點(diǎn)都需要配置內(nèi)置硬盤來存儲AIX操作系統(tǒng)、HACMP軟件和應(yīng)用程序。另外,每個節(jié)點(diǎn)都應(yīng)連接到一個或多個外置的共享磁盤上。
共享磁盤是指物理上連接到多個節(jié)點(diǎn)的磁盤設(shè)備,共享磁盤上存放著關(guān)鍵任務(wù)的數(shù)據(jù),通常采用鏡像或RAID技術(shù)來提供數(shù)據(jù)的冗余保護(hù)。
HACMP的共享磁盤設(shè)備支持SCSI-2 Differential磁盤、SCSI-2 Differential磁盤陣列和串行磁盤。
HACMP支持兩種對共享磁盤的訪問方式:非并發(fā)訪問和并發(fā)訪問。
在非并發(fā)訪問環(huán)境中,每個時間點(diǎn)上只能有一條活動的連接,保持活動連接的節(jié)點(diǎn)擁有磁盤,當(dāng)此節(jié)點(diǎn)離開群集時,它擁有的磁盤被其他節(jié)點(diǎn)接管。
在并發(fā)訪問環(huán)境中,共享磁盤同時與多個節(jié)點(diǎn)保持活動連接,因此當(dāng)節(jié)點(diǎn)故障時,不需要接管磁盤。并發(fā)訪問要求SSA或RAID作為外置共享磁盤。
共享硬盤應(yīng)該單獨(dú)放在一個機(jī)柜中,不應(yīng)和機(jī)器混放。

網(wǎng)卡
一個節(jié)點(diǎn)至少應(yīng)有兩塊網(wǎng)卡連接每個網(wǎng)絡(luò):一塊服務(wù)網(wǎng)卡(service adapter)和一塊備份網(wǎng)卡(standby adapter)。如果配置IP地址接管,還應(yīng)配置啟動網(wǎng)卡(boot adapter)。啟動網(wǎng)卡并不需要單獨(dú)的物理網(wǎng)卡,而是配置在服務(wù)網(wǎng)卡上的不同的IP地址。
HACMP for AIX采用網(wǎng)卡標(biāo)識(adapter label)來識別網(wǎng)卡。對于TCP/IP網(wǎng)絡(luò),網(wǎng)卡標(biāo)識是在文件/etc/hosts中關(guān)聯(lián)某一IP地址的名字。一個節(jié)點(diǎn)可以定義多個網(wǎng)卡標(biāo)識和IP地址。

網(wǎng)絡(luò)

HACMP使用LAN來監(jiān)視網(wǎng)絡(luò),網(wǎng)卡和其它節(jié)點(diǎn)的狀態(tài),HACMP支持AIX支持的大多數(shù)基于TCP/IP 的網(wǎng)絡(luò),如 Ethernet、Token-Ring、FDDI、ATM等等。HACMP中定義了三種類型的網(wǎng)絡(luò):公用網(wǎng)絡(luò)(public network)、私用網(wǎng)絡(luò)(private network)和串行網(wǎng)絡(luò)(serial network)。

公用網(wǎng)絡(luò)
在HACMP環(huán)境中,公用網(wǎng)絡(luò)連接多個節(jié)點(diǎn)并允許客戶機(jī)服務(wù)群集節(jié)點(diǎn)。Ethernet、Token-Ring、FDDI、ATM等網(wǎng)絡(luò)可以被定義為公用網(wǎng)絡(luò)。

私用網(wǎng)絡(luò)
HACMP群集中的節(jié)點(diǎn)必須相互通訊以實(shí)現(xiàn)對數(shù)據(jù)的連續(xù)訪問。私用網(wǎng)絡(luò)提供兩個節(jié)點(diǎn)之間的點(diǎn)到點(diǎn)通訊,但不允許客戶機(jī)訪問。HACMP使用私用網(wǎng)絡(luò)來傳輸鎖的信息,只有在沒有定義私用網(wǎng)絡(luò)時才使用公用網(wǎng)絡(luò)來傳輸鎖的信息。
私用網(wǎng)絡(luò)一般用于并發(fā)訪問磁盤的情況。Ethernet、Token-Ring、FDDI、ATM等網(wǎng)絡(luò)可以被定義為私用網(wǎng)絡(luò)。

串行網(wǎng)絡(luò)
串行網(wǎng)絡(luò)是兩個節(jié)點(diǎn)之間的點(diǎn)到點(diǎn)連接。HACMP在TCP/IP子系統(tǒng)發(fā)生故障時,使用串行網(wǎng)絡(luò)來傳輸控制信息和心跳信息。串行網(wǎng)絡(luò)可以是一條SCSI-2 Differential總線或一條RS232串行線。

網(wǎng)絡(luò)名稱
網(wǎng)絡(luò)名稱用于標(biāo)識HACMP群集中的網(wǎng)絡(luò),群集進(jìn)程使用網(wǎng)絡(luò)名稱信息來確定哪些網(wǎng)卡連接在同一物理網(wǎng)絡(luò)上。網(wǎng)絡(luò)的命名是任意的,但必須保持一致。如果多個網(wǎng)卡連接在同一物理網(wǎng)絡(luò)上,定義這些網(wǎng)卡時必須使用相同的網(wǎng)絡(luò)名稱。

客戶機(jī)

客戶機(jī)是指能夠訪問群集中節(jié)點(diǎn)的機(jī)器。客戶機(jī)通過公用局域網(wǎng)絡(luò)與節(jié)點(diǎn)通訊,其上運(yùn)行“前端”程序或客戶機(jī)應(yīng)用來訪問群集節(jié)點(diǎn)上的服務(wù)器應(yīng)用。HACMP for AIX為群集節(jié)點(diǎn)上的關(guān)鍵性的數(shù)據(jù)和應(yīng)用提供高可用性環(huán)境,但不負(fù)責(zé)客戶機(jī)的高可用性。


1.3  AIX與HACMP

AIX是第一個,也是最為成熟的第二代UNIX操作系統(tǒng),具有很多先進(jìn)的特征,保證UNIX系統(tǒng)的可靠性和高性能,IBM公司引入到UNIX中的LVM邏輯卷管理和JFS日志文件系統(tǒng),使AIX更容易使用和管理。AIX滿足幾乎所有的工業(yè)標(biāo)準(zhǔn)和事實(shí)標(biāo)準(zhǔn),是真正的開放系統(tǒng)。
AIX包含許多承襲IBM大主機(jī)等級的優(yōu)異特性,諸如系統(tǒng)集成性、系統(tǒng)管理及系統(tǒng)可用性。除了具有當(dāng)系統(tǒng)損毀時可以快速修復(fù)的文件系統(tǒng)外,IBM運(yùn)用自身在計(jì)算機(jī)領(lǐng)域45年的經(jīng)驗(yàn),增加了邏輯卷管理和日志文件系統(tǒng)等功能,支持三份能夠同步寫入及錯誤區(qū)塊重新配置的系統(tǒng)鏡像功能,用以確保您高價值的數(shù)據(jù)。
IBM在設(shè)計(jì)RISC/6000的AIX操作系統(tǒng)時,針對UNIX系統(tǒng)的弱點(diǎn),重新改寫了UNIX的內(nèi)核,清除200個編程缺陷。在系統(tǒng)功能穩(wěn)定性、可靠性和可管理性方面做了極大的改進(jìn),使UNIX從一個主要面向科技市場的操作系統(tǒng),發(fā)展成為能夠承擔(dān)關(guān)鍵任務(wù)的成熟的操作系統(tǒng)。
AIX具有動態(tài)可擴(kuò)展內(nèi)核,用戶裝卸設(shè)備時可聯(lián)機(jī)動態(tài)配置,無須關(guān)機(jī)和重新啟動,具有實(shí)時的擴(kuò)展功能。所有硬件設(shè)備均可隨時動態(tài)增加、更換而不影響文件系統(tǒng)及其數(shù)據(jù)。
AIX中的許多功能和HACMP緊密配合,為用戶提供更高的可用性。以下介紹AIX中與HACMP相關(guān)的幾項(xiàng)功能:LVM、JFS、ODM、SMIT和SRC。

邏輯卷管理器LVM(Logical Volume Manager)
LVM邏輯上將多個硬盤當(dāng)作單一實(shí)體進(jìn)行管理。使用LVM可將存儲空間分區(qū)為“邏輯卷”,可以指定其存放位置,以獲得優(yōu)化的性能和可用性。邏輯卷(文件系統(tǒng))可以動態(tài)擴(kuò)展而不需重新配置整個邏輯硬盤子系統(tǒng)。邏輯卷可以鏡像,避免磁盤的單點(diǎn)故障。
LVM使磁盤資源很容易被其他節(jié)點(diǎn)接管。

日志文件系統(tǒng)JFS(Journaled File System)
在傳統(tǒng)Unix中,文件系統(tǒng)恢復(fù)需要很長時間且文件系統(tǒng)的完整性不能得到保證。AIX使用日志文件系統(tǒng),所有對文件系統(tǒng)的更新在寫到文件系統(tǒng)之前先記入一個日志之中,當(dāng)系統(tǒng)故障后JFS日志可以被重新執(zhí)行,文件系統(tǒng)的更新可以根據(jù)日志前滾或回滾(roll forward/back)。AIX很少用到fsck命令進(jìn)行整個文件系統(tǒng)的恢復(fù),所以故障后恢復(fù)文件系統(tǒng)的時間大大減少,也就大大減少了文件系統(tǒng)接管的時間。

ODM(Object Data Manager)
ODM是一個面向?qū)ο蟮臄?shù)據(jù)庫,其中存放著系統(tǒng)的配置信息。采用ODM管理使配置信息更加安全,可以免受偶然的或故意的損壞。ODM庫一般通過SMIT、高級命令或應(yīng)用程序進(jìn)行訪問。
所有的HACMP配置信息都存放于ODM庫中。
HACMP for AIX使用“Global ODM”,可以在一個節(jié)點(diǎn)上做配置,然后傳到群集內(nèi)的所有節(jié)點(diǎn)。這樣可以減少配置的工作量,并保證各個節(jié)點(diǎn)上配置信息的一致性。

SMIT(System Management Interface Tool)
AIX中絕大部分系統(tǒng)管理功能都可以通過SMIT完成(95%以上)。使用SMIT減少了偶然使用錯誤命令或錯誤選項(xiàng)的可能性,增加了系統(tǒng)的可用性。
HACMP全部用SMIT管理,快捷路徑是smit hacmp

SRC(System Resource Controller)
SRC是一個AIX進(jìn)程,用來管理其它的進(jìn)程。使用startsrc和stopsrc命令來啟動、停止由SRC控制的一組進(jìn)程。如果SRC控制的一個進(jìn)程非正常終止,SRC會自動執(zhí)行一個特定的程序來響應(yīng)。
HACMP的進(jìn)程都是由SRC控制和監(jiān)視的。

1.5 HACMP群集的軟件結(jié)構(gòu)

HACMP for AIX軟件由以下部分組成:

Cluster Manager、Event Scripts、Cluster Lock Manager、Clinfo、Clsmuxpd

Cluster Manager
Cluster Manager運(yùn)行在群集中的所有節(jié)點(diǎn)上。它的主要任務(wù)是監(jiān)視和響應(yīng)群集狀態(tài)的變化,包括:節(jié)點(diǎn)故障和恢復(fù)、網(wǎng)絡(luò)故障和恢復(fù)、網(wǎng)卡故障和恢復(fù)。它負(fù)責(zé)同步和協(xié)調(diào)群集內(nèi)部的動作,發(fā)現(xiàn)錯誤征兆,診斷問題,并做出適當(dāng)?shù)姆磻?yīng)。它還負(fù)責(zé)執(zhí)行Event Scripts(事件腳本)來影響群集狀態(tài)的變化 。

Event Scripts
Event Scripts 定義了為響應(yīng)群集事件所需執(zhí)行的動作。HACMP包括了大多數(shù)情況下的Event Scripts,這些Event Scripts是用標(biāo)準(zhǔn)shell編寫的,使用標(biāo)準(zhǔn)AIX命令和HACMP功能,且可以客戶化。

Cluster Lock Manager
用于并發(fā)訪問環(huán)境,使多個節(jié)點(diǎn)可以同時訪問相同的數(shù)據(jù)。應(yīng)用程序必須用Cluster Lock Manager API來登記、申請、釋放鎖。Lock Manager協(xié)調(diào)和排序?qū)蚕頂?shù)據(jù)的訪問,防止數(shù)據(jù)的不一致和錯誤。

Clinfo & Clsmuxpd
Clinfo是Cluster Information進(jìn)程。Clinfo API允許應(yīng)用程序來確定群集現(xiàn)在的狀態(tài)和釋放動作響應(yīng)變化,每當(dāng)群集內(nèi)有事件發(fā)生時Clinfo發(fā)布信息。
Clinfo的通訊基于SNMP依靠SNMP的代理(clsmuxpd)接收群集狀態(tài)的改變。
Clinfo是可選的。

1.6  HACMP群集資源

HACMP for AIX軟件通過以下途徑提供高可用性環(huán)境:
定義一組必須的群集資源,資源可以是硬件,也可以是軟件。
定義群集節(jié)點(diǎn)訪問這些資源的關(guān)系。這些關(guān)系確定哪個節(jié)點(diǎn)控制資源以及當(dāng)該節(jié)點(diǎn)放棄資源的控制權(quán)后哪個節(jié)點(diǎn)接管資源。當(dāng)一個節(jié)點(diǎn)離開群集時,Cluster Manager能夠?qū)⑦@個節(jié)點(diǎn)的資源轉(zhuǎn)移到群集中的其它節(jié)點(diǎn)上。

資源的類型
應(yīng)用、磁盤、卷組、文件系統(tǒng)、NFS文件系統(tǒng)、IP地址

資源怎樣做到高可用
應(yīng)用:
由HACMP啟動,如果節(jié)點(diǎn)發(fā)生故障,則在另一節(jié)點(diǎn)重新啟動。

磁盤、卷組、文件系統(tǒng):
磁盤物理上與多個節(jié)點(diǎn)相連。在非并發(fā)環(huán)境中,一個節(jié)點(diǎn)控制磁盤資源,如果該節(jié)點(diǎn)發(fā)生故障,它控制的磁盤資源由其它節(jié)點(diǎn)接管。在并發(fā)環(huán)境中,多個節(jié)點(diǎn)同時控制磁盤資源,一個節(jié)點(diǎn)發(fā)生故障并不影響其它節(jié)點(diǎn)。

IP地址:
如果服務(wù)網(wǎng)卡發(fā)生故障,由本機(jī)的備份網(wǎng)卡接管其地址,稱為“網(wǎng)卡切換”。如果整個節(jié)點(diǎn)故障,由另一個群集節(jié)點(diǎn)的備份網(wǎng)卡接管其地址,稱為“IP地址接管”。

 資源組
每個HACMP的高可用資源都必須被分配在某個資源組中。資源組允許您將相關(guān)的資源結(jié)合成一個單一的實(shí)體,便于配置和管理。
HACMP共有三種類型的資源組,分別是Cascading資源組、Rotating資源組和Concurrent資源組。在一個群集中可以有多個不同類型的資源組。定義資源組的類型實(shí)際上就是定義了群集的故障恢復(fù)策略。

Cascading資源組可以被一個或多個節(jié)點(diǎn)接管:
所有被指定參與接管一個資源組的節(jié)點(diǎn)都是該資源組的資源鏈的一部分,每個參與的節(jié)點(diǎn)都被指定了接管優(yōu)先級,優(yōu)先級代表了接管可用資源的順序。
當(dāng)接管發(fā)生時,具有最高優(yōu)先級的活動節(jié)點(diǎn)將獲得資源組。如果該節(jié)點(diǎn)不可用,則由具有次高優(yōu)先級的節(jié)點(diǎn)獲得資源組,依此類推。
當(dāng)對該資源組具有更高優(yōu)先級的節(jié)點(diǎn)重新回到群集后,它將取回它的資源組。

一個Rotating 資源組和一組節(jié)點(diǎn)相關(guān)聯(lián)。資源組在所有被定義的節(jié)點(diǎn)之間輪轉(zhuǎn)。每個節(jié)點(diǎn)可以擁有一個資源組。
開始時,第一個加入群集的節(jié)點(diǎn)獲得第一個資源組,第二個加入群集的節(jié)點(diǎn)獲得第二個資源組,依此類推,直到所有的資源組都被節(jié)點(diǎn)獲得。剩余的節(jié)點(diǎn)作為備份節(jié)點(diǎn)。
當(dāng)一個控制資源的節(jié)點(diǎn)故障時,可用節(jié)點(diǎn)中對資源組具有最高優(yōu)先級的節(jié)點(diǎn)將接管資源組。當(dāng)故障節(jié)點(diǎn)重新加入群集后,成為備份節(jié)點(diǎn),不再取回資源組。

Concurrent 資源組由多個節(jié)點(diǎn)共享。所有并發(fā)訪問資源組的節(jié)點(diǎn)在加入群集后都獲得該資源組。節(jié)點(diǎn)之間沒有優(yōu)先級的區(qū)別。
由于AIX JFS 不支持并發(fā)訪問,應(yīng)用就必須用生設(shè)備(邏輯卷)。因此Concurrent 資源組的資源只能有應(yīng)用、磁盤和卷組。
Concurrent 資源組的共享磁盤必須是SSA盤或RAID盤。

資源鏈
每個能訪問資源組的節(jié)點(diǎn)都必須被列為參與節(jié)點(diǎn),參與節(jié)點(diǎn)的列表就建立了資源組的資源鏈。這樣,這幾個節(jié)點(diǎn)都可以參與維護(hù)資源組的可用性。
對于Cascading資源組或Rotating 資源組來說,這也就建立了資源鏈中各節(jié)點(diǎn)的優(yōu)先級。
對于Cascading資源組,當(dāng)前在資源鏈中具有最高優(yōu)先級的活動節(jié)點(diǎn)將從故障節(jié)點(diǎn)處獲得資源組。
對于Rotating資源組,當(dāng)前在資源鏈中具有最高優(yōu)先級且具有可用連接(網(wǎng)絡(luò)、網(wǎng)卡、IP地址)的節(jié)點(diǎn)將從故障節(jié)點(diǎn)處獲得資源組。接管節(jié)點(diǎn)可能是已經(jīng)擁有資源的節(jié)點(diǎn),也可能是備份節(jié)點(diǎn)。

HACMP對資源組的位置有如下假定:
Cascading:具有最高優(yōu)先級的活動節(jié)點(diǎn)控制資源組。
Rotating :具有與Rotating資源組相關(guān)的服務(wù)地址的節(jié)點(diǎn)控制資源組。
Concurrent:所有活動節(jié)點(diǎn)都擁有資源組。

1.6 建立高可用系統(tǒng)——避免單點(diǎn)故障

高可用系統(tǒng)的主要特點(diǎn)是具有檢測和響應(yīng)可能影響到關(guān)鍵服務(wù)的事件的能力。HACMP for AIX軟件使群集在遇到系統(tǒng)的關(guān)鍵組件(例如網(wǎng)卡)發(fā)生故障的情況下仍能繼續(xù)對外提供服務(wù)。
HACMP for AIX軟件通過避免單點(diǎn)故障的方式建立高可用的和可擴(kuò)展的群集。單點(diǎn)故障點(diǎn)是指一個關(guān)鍵的群集功能只由單一的組件提供,當(dāng)這個組件故障時,群集沒有其它的途徑提供關(guān)鍵的服務(wù)。
在群集中,有可能出現(xiàn)單點(diǎn)故障的群集組件是:
節(jié)點(diǎn)、網(wǎng)絡(luò)和網(wǎng)卡、磁盤和磁盤控制卡、應(yīng)用
HACMP可以檢測和響應(yīng)三種類型的故障:節(jié)點(diǎn)故障、網(wǎng)卡故障和網(wǎng)絡(luò)故障。

 節(jié)點(diǎn)故障
指處理器硬件或操作系統(tǒng)故障。當(dāng)發(fā)生節(jié)點(diǎn)故障上,其它節(jié)點(diǎn)可以配置為:
接管共享磁盤、Vary-on卷組、Mount文件系統(tǒng)、Export NFS文件系統(tǒng)、接管IP地址、重啟應(yīng)用。
磁盤物理上與多個節(jié)點(diǎn)相連。在非并發(fā)環(huán)境中,一個節(jié)點(diǎn)控制磁盤資源,如果該節(jié)點(diǎn)發(fā)生故障,它控制的磁盤資源(包括卷組、文件系統(tǒng)等)由其它節(jié)點(diǎn)接管。在并發(fā)環(huán)境中,多個節(jié)點(diǎn)同時控制磁盤資源,因此不需要磁盤接管。
IP地址接管使另一節(jié)點(diǎn)可以獲得故障節(jié)點(diǎn)的網(wǎng)絡(luò)地址。當(dāng)提供給客戶機(jī)的服務(wù)綁定到一個特定的IP地址時,必須配置IP地址接管。如果只接管磁盤,客戶機(jī)將無法訪問服務(wù)器的IP地址。
當(dāng)關(guān)鍵應(yīng)用的節(jié)點(diǎn)離開群集時,接管節(jié)點(diǎn)重新啟動這個關(guān)鍵應(yīng)用,使服務(wù)得以繼續(xù)。

 網(wǎng)卡故障
HACMP軟件能夠處理服務(wù)網(wǎng)卡和備份網(wǎng)卡的故障。當(dāng)服務(wù)網(wǎng)卡故障時,Cluster Manager將同一節(jié)點(diǎn)的服務(wù)網(wǎng)卡和備份網(wǎng)卡進(jìn)行切換,服務(wù)網(wǎng)卡的故障是透明的。Cluster Manager檢測到備份網(wǎng)卡故障時只是記入日志,并不進(jìn)行其它操作。

 網(wǎng)絡(luò)故障
當(dāng)群集中連接所有節(jié)點(diǎn)的網(wǎng)絡(luò)故障時,由于網(wǎng)絡(luò)配置各不相同,所以HACMP無法定義響應(yīng)動作。此時系統(tǒng)在主控臺上顯示信息,事件被記入日志。用戶可以根據(jù)實(shí)際情況自己編寫腳本程序來響應(yīng)網(wǎng)絡(luò)故障。
在大多數(shù)配置中,網(wǎng)絡(luò)都是單點(diǎn)故障點(diǎn)。為避免發(fā)生網(wǎng)絡(luò)單點(diǎn)故障,建議在配置HACMP時配置雙網(wǎng)絡(luò)。

 其它類型的故障

 磁盤和磁盤控制卡故障
HACMP自己不能直接處理磁盤和磁盤控制卡故障。但是數(shù)據(jù)可通過AIX的LVM 鏡像或磁盤陣列的RAID功能處理。
如果共享磁盤使用SCSI-2 Differential磁盤或SSA磁盤,磁盤故障可通過AIX的LVM 鏡像處理。此時需要跨磁盤進(jìn)行LVM鏡像。單一磁盤故障就不會影響數(shù)據(jù)的可用性。如果磁盤配置卡發(fā)生故障,數(shù)據(jù)可通過跨總線的LVM鏡像來復(fù)制。
如果共享磁盤使用磁盤陣列,磁盤陣列自己負(fù)責(zé)數(shù)據(jù)的冗余保護(hù)。在連接RAID磁盤陣列時應(yīng)采用多總線,避免磁盤配置卡的單點(diǎn)故障。

 其他硬件故障
在HACMP中沒有直接支持,但可通過AIX Error Notification功能來捕獲特定錯誤并執(zhí)行響應(yīng)命令,例如:當(dāng)發(fā)生關(guān)鍵硬件故障時可以shutdown,由另一個節(jié)點(diǎn)接管。

 應(yīng)用程序錯誤
可以自己編寫應(yīng)用監(jiān)視程序監(jiān)視應(yīng)用程序的錯誤信息或進(jìn)程狀態(tài),也可以通過AIX的SRC功能進(jìn)行管理。

HACMP錯誤
HACMP的主進(jìn)程發(fā)生錯誤時,可升級為節(jié)點(diǎn)故障進(jìn)行處理。

 電源故障
不要將同一設(shè)備的電源連接到一個電源上,最好使用UPS。

1.7 哪些情況下不適合使用HACMP

HACMP并不是萬能的,以下應(yīng)用環(huán)境不適于采用HACMP來實(shí)現(xiàn)高可用性:
應(yīng)用程序不在檢查點(diǎn)(Check-Point)時將數(shù)據(jù)寫入磁盤。這樣會造成節(jié)點(diǎn)故障時,無法保證數(shù)據(jù)的完整性。
系統(tǒng)崩潰后,應(yīng)用程序不能自動恢復(fù)其數(shù)據(jù)。
哪怕幾秒鐘的巖機(jī)時間都是不可接受的。
內(nèi)存里的內(nèi)容不能丟失
對于最后兩種情況,建議采用容錯系統(tǒng)。

 
打賞
 
更多>同類方案
0相關(guān)評論

 
最新方案
點(diǎn)擊排行
?
網(wǎng)站首頁  |  付款方式  |  版權(quán)隱私  |  使用協(xié)議  |  聯(lián)系方式  |  關(guān)于我們  |  網(wǎng)站地圖  |  排名推廣  |  廣告服務(wù)  |  RSS訂閱  |  違規(guī)舉報(bào)  |  京ICP備11008917號-2  | 
 
主站蜘蛛池模板: 云梦县| 本溪市| 河池市| 仪陇县| 内乡县| 内黄县| 威远县| 额敏县| 内丘县| 湘乡市| 寻乌县| 临泽县| 南涧| 正阳县| 正镶白旗| 图木舒克市| 开封市| 康平县| 平凉市| 桐乡市| 台东市| 城口县| 资兴市| 安宁市| 喀喇沁旗| 贡山| 探索| 安新县| 南投市| 上高县| 河源市| 孙吴县| 林周县| 武鸣县| 乌鲁木齐县| 龙游县| 黑水县| 昌黎县| 临猗县| 武义县| 泽州县|