2024-01-10 分類: 網站建設
故障轉移群集是一組協同工作以提供高可用性 (HA) 或連續可用性 (CA) 的計算機服務器。如果其中一臺服務器出現故障,集群中的另一個節點可以通過稱為故障轉移的過程以最短或沒有停機時間來承擔其工作負載。一些故障轉移群集僅使用物理服務器,而其他群集則涉及虛擬機(VM)。
故障轉移集群的主要目的是為應用程序和服務提供 CA 或 HA。CA 集群也稱為容錯 (FT) 集群,允許最終用戶在服務器出現故障時繼續使用應用程序和服務,而不會出現任何超時。HA集群可能會導致客戶服務的短暫中斷,但系統會自動恢復,不會丟失數據,停機時間最短。
集群由兩個或多個節點(或服務器)組成,它們通過物理電纜或專用安全網絡傳輸數據和軟件以處理數據。其他類型的集群技術可用于負載平衡、存儲以及并發或并行處理。一些實現將故障轉移集群與其他集群技術相結合。
故障轉移集群的工作原理雖然 CA 故障轉移群集旨在實現 100% 的可用性,但 HA 群集嘗試 99.999% 的可用性 — 也稱為“五個九”。這種停機時間每年不超過 5.26 分鐘。CA 集群提供更高的可用性,但它們需要更多的硬件來運行,這增加了它們的總體成本。
高可用性故障轉移集群
在高可用性集群中,獨立服務器組在整個系統中共享資源和數據。故障轉移集群中的所有節點都可以訪問共享存儲。高可用性集群還包括一個監控連接,服務器使用它來檢查其他服務器的“心跳”或健康狀況。在任何時候,集群中至少有一個節點是活動的,而至少一個是被動的。
在簡單的雙節點配置中,例如,如果節點 1 發生故障,節點 2 會使用心跳連接來識別故障,然后將自己配置為活動節點。安裝在集群中每個節點上的集群軟件可確保客戶端連接到活動節點。
較大的配置可能使用專用服務器來執行集群管理。集群管理服務器不斷發出心跳信號以確定是否有任何節點發生故障,如果是,則指示另一個節點承擔負載。
一些集群管理軟件通過將機器和它們所在的物理服務器匯集到一個集群中來為虛擬機 (VM) 提供 HA。如果發生故障,故障主機上的虛擬機將在備用主機上重新啟動。
共享存儲確實存在潛在單點故障的風險。但是,將 RAID 6 與 RAID 10 一起使用可以幫助確保即使兩個硬盤驅動器發生故障,服務也能繼續。
如果所有服務器都插入同一個電網,則電力可能代表另一個單點故障。可以通過為每個節點配備單獨的不間斷電源 (UPS) 來保護節點。
連續可用性故障轉移集群
與 HA 模型相比,容錯集群由共享計算機操作系統的單個副本的多個系統組成。一個系統發出的軟件命令也在其他系統上執行。
CA 要求組織使用格式化的計算機設備和備用 UPS。在 CA 故障轉移集群中,操作系統 (OS) 有一個接口,軟件程序員可以在其中檢查事務中預定點的關鍵數據。CA 只能通過使用運行服務的物理機或虛擬機的連續可用且幾乎精確的副本來實現。這種冗余模型稱為 2N。
CA 系統可以補償許多不同類型的故障。容錯系統可以自動檢測故障
一個硬盤 計算機處理器單元 AI/O 子系統 一個電源 一個網絡組件可以立即識別故障點,并且備份組件或程序可以立即取代它,而不會中斷服務。
群集軟件可用于將兩臺或多臺服務器組合在一起以充當單個虛擬服務器,或者您可以創建許多其他 CA 故障轉移設置。例如,可以配置一個集群,以便如果其中一個虛擬服務器發生故障,其他虛擬服務器會通過臨時從集群中刪除虛擬服務器來做出響應。然后,它會自動在其余服務器之間重新分配工作負載,直到停機的服務器準備好再次上線。
CA 故障轉移集群的替代方案是使用“雙”硬件服務器,其中所有物理組件都是復制的。這些服務器在單獨的硬件系統上獨立并同時執行計算。這些“雙”硬件系統通過使用監控來自兩個物理服務器的結果的專用節點來執行同步。雖然這提供了安全性,但此選項可能比其他選項更昂貴。Stratus 是這些專用容錯硬件服務器的制造商,它承諾每年的系統停機時間不會超過 32 秒。然而,為每個同步模塊配備雙 CPU 的 Stratus 服務器的成本估計約為每個同步節點 160,000 美元。
故障轉移集群的實際應用任務關鍵型應用程序的持續可用性
容錯系統是在線事務處理 (OLTP) 系統中使用的計算機的必需品。例如,要求 100% 可用性的 OLTP 用于航空公司預訂系統、電子股票交易和 ATM 銀行業務。
許多其他類型的組織也將 CA 集群或容錯計算機用于關鍵任務應用程序,例如制造、物流和零售領域的企業。應用包括電子商務、訂單管理和員工時鐘系統。對于只需要“五個九”正常運行時間的集群應用程序和服務,通常認為高可用性集群就足夠了。
災難恢復
災難恢復是故障轉移集群的另一個實際應用。當然,如果發生火災或洪水等災難導致主數據中心中的所有物理硬件和軟件失效,非常建議將故障轉移服務器安裝在遠程站點。
例如,在 Windows Server 2016 和 2019 中,Microsoft 提供了 Storage Replica,這是一種在服務器之間復制卷以進行災難恢復的技術。該技術包括跨兩個地理站點的故障轉移集群的延伸故障轉移功能。
通過擴展故障轉移集群,組織可以在多個數據中心之間進行復制。如果災難發生在一個位置,所有數據將繼續存在于其他站點的故障轉移服務器上。
數據庫復制
據微軟稱,該公司最初在 Windows Server 2016 中引入了 Windows Server Failover Cluster (WSFC),以保護其 SQL Server 數據庫和 Microsoft Exchange 通信服務器等“關鍵任務”應用程序。
其他數據庫提供商為數據庫復制提供故障轉移集群技術。例如,MySQL Cluster 包含一個心跳機制,用于即時檢測故障,通常在一秒鐘內檢測到集群中的其他節點,而不會中斷客戶端的服務。地理復制功能使數據庫能夠鏡像到遠程位置。
故障轉移群集類型VMWare 故障轉移集群
在可用的 虛擬化產品 中,VMware 為 VM 集群提供了多種虛擬化工具。vSphere vMotion 提供了一種 CA 架構,可在物理數據中心網絡之間精確復制 VMware 虛擬機及其網絡。
第二個產品 VMware vSphere HA 通過將虛擬機及其主機匯集到一個集群中以實現自動故障轉移,從而為虛擬機提供 HA。該工具也不依賴于 DNS 等外部組件,從而減少了潛在的故障點。
Windows 服務器故障轉移群集 (WSFC)
您可以使用 WFSC 創建 Hyper-V 故障轉移服務器,WFSC 是 Windows 2016 和 2019 中的一項功能,用于監控集群物理服務器,并在需要時提供故障轉移。WFSC 還監視集群角色,以前稱為集群應用程序和服務。如果集群角色不能正常工作,它要么重新啟動,要么移動到另一個節點。
WFSC 包括 Microsoft 以前的集群共享卷 (CSV) 技術,以提供一致的分布式命名空間,用于從所有節點訪問共享存儲。此外,WSFC 支持 SQL Server 和 Microsoft Hyper-V 群集 VM 的 CA 文件共享存儲。它還支持在物理服務器和 Hyper-V 集群 VM 上運行的 HA 角色。
SQL Server 故障轉移群集
在 SQL Server 2017 中,微軟推出了 Always On,這是一種使用 WSFC 作為平臺技術的 HA 解決方案,將 SQL Server 組件注冊為 WSFC 集群資源。根據微軟的說法,相關資源被組合成一個依賴于其他 WSFC 資源的角色。然后,WSFC 可以識別并傳達重新啟動 SQL Server 實例或自動將其故障轉移到不同節點的需求。
紅帽 Linux 故障轉移集群
微軟以外的操作系統制造商也提供他們自己的故障轉移集群技術。例如,Red Hat Enterprise Linux (RHEL) 用戶可以使用 High Availability Add-On 和 Red Hat Global File System (GFS/GFS2) 創建 HA 故障轉移集群。為跨多個站點的單集群延伸集群以及“容災”集群的多站點提供支持。多站點集群通常使用支持存儲區域網絡 (SAN) 的數據存儲復制。
網頁題目:故障轉移群集的類型和應用以及工作原理
分享網址:http://m.newbst.com/news49/312999.html
成都網站建設公司_創新互聯,為您提供動態網站、云服務器、域名注冊、網站建設、虛擬主機、外貿網站建設
聲明:本網站發布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創新互聯
猜你還喜歡下面的內容