興迪資訊科技有限公司
New Design Information Technologies Ltd.
Power High Availability
PowerHA for AIX® 是 HACMP (High Availability Cluster Multiprocessing) 的新名稱。HACMP 應用程序讓系統能夠應付故障,減少應用程序的停機時間。本文介紹 PowerHA,詳細解釋如何配置兩節點集群。考慮到許多客戶都需要這種配置,本文對于理解 PowerHA 和建立兩節點集群非常有用。
簡介
随着業務需求日益增加,關鍵的應用程序必須一(yī)直可用,系統必須對故障有容忍能力。但是,這些有容錯能力的系統的成本很高。因此,需要通過應用程序提供這些能力,同時這個應用程序還應該是經濟有效的。
高可用性解決方案可以确保解決方案的任何組件的故障都不會導緻用戶無法使用應用程序及其數據。實現這一(yī)目标的方法是通過消除單一(yī)故障點消除或掩蓋計劃内和計劃外(wài)停機。另外(wài),保持應用程序高可用性并不需要特殊的硬件。PowerHA 不執行備份等管理任務、時間同步和任何與應用程序相關的配置。
圖 1 是故障轉移功能的示意圖。當一(yī)個服務器停機時,另一(yī)個服務器接管。
圖 1. 故障轉移功能
PowerHA 的概述
PowerHA 和 HACMP 這兩個詞可以互換使用。正如前面提到的,它會消除單一(yī)故障點 (SPOF)。下(xià)表列出可能存在的 SPOF:
集群對象 |
消除 SPOF 的方法 |
節點 |
使用多個節點 |
電源 |
使用多條電路或不間斷電源 |
網絡适配器 |
使用冗餘的網絡适配器 |
網絡 |
使用多個網絡連接節點 |
TCP/IP 子系統 |
使用非 IP 網絡連接相鄰節點和客戶機 |
磁盤适配器 |
使用冗餘的磁盤适配器或多路徑硬件 |
磁盤 |
使用多個磁盤以及鏡像或 raid |
應用程序 |
添加用于接管的節點;配置應用程序監視器 |
VIO 服務器 |
實現雙 VIO 服務器 |
站點 |
添加額外(wài)站點 |
主要目标是,當兩個服務器中(zhōng)的一(yī)個發生(shēng)故障時,讓另一(yī)個服務器接管。 PowerHA 集群技術通過提供冗餘實現故障轉移保護,同時通過并發/并行訪問支持水平擴展。
PowerHA 術語
PowerHA 使用許多術語。它們可以分(fēn)爲拓撲組件和資源組件兩類。
拓撲組件基本上是物(wù)理組件。它們包括:
· 節點:System p 服務器可以是單獨的分(fēn)區或 VIOS 客戶機
· 網絡:IP 網絡和非 IP 網絡
· 通信接口:令牌環網或以太網适配器
· 通信設備:RS232 或磁盤的心跳機制
資源組件是需要保持高可用性的邏輯實體。它們包括:
· 應用服務器:它涉及應用程序的啓動/停止腳本。
· 服務 IP 地址:最終用戶一(yī)般通過 IP 地址連接應用程序。這個 IP 地址映射到實際運行應用程序的節點。因爲 IP 地址需要保持高可用性,所以它屬于資源組。
· 文件系統:許多應用程序需要挂載文件系統。
· 卷組:許多應用程序需要高可用的卷組。
所有資源一(yī)起組成資源組實體。PowerHA 把資源組當作單一(yī)單元處理。它會保持資源組高可用性。資源組有與其相關聯的策略。這些策略包括:
1. 啓動策略:這決定資源組應該激活哪個節點。
2. 故障轉移策略:當發生(shēng)故障時,這決定故障轉移目标節點。
3. 故障恢複策略:這決定資源組是否執行故障恢複。
當發生(shēng)故障時,PowerHA 尋找這些策略并執行相應的操作。
PowerHA 的子系統
圖 2. PowerHA 的子系統
上圖說明 PowerHA 由許多軟件組件組成:
· 集群管理器 clstrmgr 是核心進程,它監視集群成員關系。集群管理器包含管理拓撲組件的拓撲管理器、管理資源組的資源管理器、通過 RMC 設施起作用的事件管理器和事件腳本以及對故障做出反應的 RSCT。
· clinfo 進程提供用于在集群管理器和應用程序之間進行通信的 API。clinfo 還提供遠程監視功能,可以在集群狀态發生(shēng)變化時運行腳本。
在 PowerHA 5 中(zhōng),clcomdES 使集群管理器能夠以安全的方式進行通信,不需要使用 rsh 和 /.rhost 文件。四川省興迪資訊科技有限公司
Copyright 2002-2017 www.nditc.com All Rights Reserved