1.什么是 Synology High Availability?
術(shù)語“high-availability”是指專為減少因服務(wù)器故障造成服務(wù)中斷的情況而設(shè)計(jì)的一種服務(wù)器布局解決方案。Synology High Availability (SHA) 部署 2 臺服務(wù)器組成“high-availability 集群”,其中一個(gè)服務(wù)器作為“活動(dòng)服務(wù)器”,另一個(gè)服務(wù)器作為待機(jī)“無源服務(wù)器”。?
在 high-availability 集群中,活動(dòng)服務(wù)器中的數(shù)據(jù)將連續(xù)復(fù)制到無源服務(wù)器,因此,這兩臺服務(wù)器中有所有文件的鏡像副本。這樣,在發(fā)生活動(dòng)服務(wù)器損毀或故障的情況下,無源服務(wù)器可接管所有的服務(wù),最大程度地降低系統(tǒng)服務(wù)中斷的時(shí)間。
2.嘗試創(chuàng)建 high-availability 集群前請仔細(xì)閱讀以下部分。
硬件要求:
SHA 需要兩臺相同的 Synology 服務(wù)器作為活動(dòng)和無源服務(wù)器。
兩個(gè)不同的 Synology 服務(wù)器可起到活動(dòng)服務(wù)器和無源服務(wù)器的作用,但有限制。
系統(tǒng)需求:
活動(dòng)和無源服務(wù)器必須為相同型號,并都支持 Synology High Availability。
兩臺服務(wù)器上必須都安裝同樣版本的 DSM。
注:上圖僅供參考。您的型號和 DSM 版本可能有所不同。
卷和硬盤:
兩臺服務(wù)器的硬盤容量必須完全相同以避免數(shù)據(jù)不一致的情況發(fā)生。
活動(dòng)和無源服務(wù)器都必須有同樣數(shù)量的硬盤。此外,硬盤的位置必須相同。
這兩臺服務(wù)器都不能包含任何 SHR 格式的卷。進(jìn)入存儲(chǔ)管理器 > 卷以確保不存在 SHR 卷。
注:上圖僅供參考。您環(huán)境中的硬盤數(shù)量和大小可能不同。
網(wǎng)絡(luò)環(huán)境:
兩臺服務(wù)器必須指派為靜態(tài) IP 地址。請確保兩臺服務(wù)器的 IP 地址皆可訪問并屬于同一子網(wǎng),否則在初始化到無源服務(wù)器的轉(zhuǎn)換時(shí)可能發(fā)生錯(cuò)誤。要更改網(wǎng)絡(luò)設(shè)置,請登錄各服務(wù)器并進(jìn)入控制面板 > 網(wǎng)絡(luò) > 網(wǎng)絡(luò)接口,選擇網(wǎng)絡(luò)接口然后單擊編輯。
兩臺服務(wù)器必須有相同數(shù)量的局域網(wǎng)端口。如果兩臺服務(wù)器都配備了更多的網(wǎng)卡,則這些網(wǎng)卡都將被視作額外的局域網(wǎng)端口。
Synology High Availability 不支持:代理服務(wù)器、DHCP、DHCP 服務(wù)器、IPv6、PPPoE 以及 Wi-Fi。請確保在創(chuàng)建 high-availability 集群之前將上述功能全部關(guān)閉。
注:一旦創(chuàng)建 high-availability 集群,SSH 和 NTP 服務(wù)器將在活動(dòng)服務(wù)器上自動(dòng)創(chuàng)建。
3. 連接服務(wù)器
本節(jié)將介紹如何連接兩臺服務(wù)器以創(chuàng)建 high-availability 集群。請參閱以下步驟:
1>>請使用網(wǎng)線將兩臺服務(wù)器相互連接起來。此連接將作為兩臺服務(wù)器之間的“Heartbeat”連接,以加快通信并將數(shù)據(jù)從活動(dòng)服務(wù)器復(fù)制到無源服務(wù)器。此連接必須滿足以下條件:
兩臺服務(wù)器上使用相同的網(wǎng)絡(luò)接口。例如,如果其中一端連接到服務(wù)器的 LAN 1 接口,則另一端也必須連接到另一臺服務(wù)器的 LAN 1 接口。
兩臺服務(wù)器皆使用最快的網(wǎng)絡(luò)接口。如果兩臺服務(wù)器都配置了 10GbE 附加網(wǎng)卡,則該連接必須使用該網(wǎng)卡。
兩臺服務(wù)器之間采用直接連接而無需通過任何交換器或路由器。
2>>使用網(wǎng)線將這兩臺服務(wù)器連接到剩余的網(wǎng)絡(luò)接口。 請確認(rèn)這些連接有效且都屬同一個(gè)網(wǎng)絡(luò)。
注:為防止服務(wù)因網(wǎng)絡(luò)故障而中斷,我們建議在您的網(wǎng)絡(luò)環(huán)境中部署多個(gè)交換機(jī),以使 high-availability 集群中的各服務(wù)器能夠連接到獨(dú)立的交換機(jī)。
3>>服務(wù)器現(xiàn)在可組合為一個(gè) high-availability 集群。請按照下列步驟繼續(xù)。
4. 合并服務(wù)器并創(chuàng)建 high-availability 集群
兩臺服務(wù)器正確連接后,您可按以下步驟將其組合為一個(gè) high-availability 集群。
1>>登錄您要以屬于 administrators 群組的帳戶承擔(dān)活動(dòng)服務(wù)器作用的服務(wù)器。
2>>打開High Availability Manager。
3>>單擊創(chuàng)建 HA 集群來啟動(dòng)設(shè)置向?qū)А?/p>
4>>單擊下一步。
5>>指定您要將其用作無源服務(wù)器的 IP 地址、域用戶名和密碼。(要找到 IP 地址,登錄到其它服務(wù)器并進(jìn)入控制面板 > 網(wǎng)絡(luò) > 網(wǎng)絡(luò)接口。記得確認(rèn)兩臺服務(wù)器都使用靜態(tài) IP 地址。)然后單擊下一步。
選擇要用于 high-availability 集群 Heartbeat 連接的網(wǎng)絡(luò)接口。(此選項(xiàng)應(yīng)與您用于將兩臺服務(wù)器進(jìn)行相互連接的網(wǎng)絡(luò)適配器相同。)然后單擊下一步。
指定 high-availability 集群的名稱。此外,選擇用于連接到數(shù)據(jù)網(wǎng)絡(luò)的網(wǎng)絡(luò)接口,然后為 high-availability 集群指定 IP 地址和子網(wǎng)掩碼。您可用在此指定的名稱和 IP 地址訪問 high-availability 集群資源。然后單擊下一步。
確認(rèn)設(shè)置。然后單擊應(yīng)用。
設(shè)置向?qū)㈤_始創(chuàng)建 high-availability 集群。創(chuàng)建時(shí)間根據(jù)系統(tǒng)環(huán)境而有所不同。
完成后,您將在概述頁面中看到集群狀態(tài)。
5. 發(fā)生故障后解決問題
發(fā)生某些錯(cuò)誤時(shí),系統(tǒng)會(huì)自動(dòng)將服務(wù)從活動(dòng)服務(wù)器轉(zhuǎn)移到無源服務(wù)器。這情況稱為“故障轉(zhuǎn)移”。在下列情況下,系統(tǒng)可能啟動(dòng)故障轉(zhuǎn)移。
5.1 損毀的存儲(chǔ)空間
活動(dòng)服務(wù)器上的存儲(chǔ)空間 (例如存儲(chǔ)卷、iSCSI LUN) 處于損毀狀態(tài),但無源服務(wù)器上相應(yīng)的存儲(chǔ)空間運(yùn)行正常時(shí),將會(huì)出現(xiàn)故障轉(zhuǎn)移。例如:如果服務(wù)器 A 為活動(dòng)服務(wù)器,而服務(wù)器 B 為無源服務(wù)器。當(dāng)服務(wù)器 A 上的存儲(chǔ)空間損毀但服務(wù)器 B 上的相應(yīng)存儲(chǔ)空間仍良好時(shí),系統(tǒng)將執(zhí)行故障轉(zhuǎn)移。
注:如果已損毀的存儲(chǔ)空間上沒有卷或 iSCSI LUN (段落分塊),則系統(tǒng)不會(huì)啟動(dòng)故障轉(zhuǎn)移。
故障轉(zhuǎn)移過程完成后,請進(jìn)行以下操作:
1>>進(jìn)入硬盤狀態(tài)頁面并識別服務(wù)器 A (現(xiàn)在為無源服務(wù)器) 上丟失或損毀的硬盤。
如果有硬盤丟失,請?jiān)谙鄳?yīng)的插槽上安裝硬盤,這樣,兩臺服務(wù)器就有相同的硬盤數(shù)量。
如果有損壞的硬盤,請進(jìn)行更換。
2>>確認(rèn)兩臺服務(wù)器都含有相同的硬盤配置,所有硬盤的狀態(tài)均為正常或未初始化。
3>>進(jìn)入存儲(chǔ)空間狀態(tài)頁面并單擊修復(fù)以修復(fù)存儲(chǔ)空間。
5.2 服務(wù)出錯(cuò)
當(dāng)監(jiān)控的服務(wù)出現(xiàn)錯(cuò)誤,會(huì)出現(xiàn)故障轉(zhuǎn)移。例如:如果在服務(wù)器 A (活動(dòng)服務(wù)器) 上監(jiān)控的服務(wù)發(fā)生故障,系統(tǒng)將向服務(wù)器 B 實(shí)施故障轉(zhuǎn)移。在此情況下,請?jiān)诠收限D(zhuǎn)移完成后執(zhí)行以下操作。
1>>前往總覽頁面。
2>>服務(wù)器 A 現(xiàn)在應(yīng)為無源服務(wù)器,單擊管理 > 關(guān)閉無源服務(wù)器。
3>>服務(wù)器 A 完成關(guān)閉后,再次啟動(dòng)。
5.3 電源故障
當(dāng)活動(dòng)服務(wù)器關(guān)閉、重啟、兩個(gè)電源組件失效或外部電源斷電時(shí)將出現(xiàn)故障轉(zhuǎn)移。例如:如果服務(wù)器 A 為活動(dòng)服務(wù)器且其電源失效,系統(tǒng)將對服務(wù)器 B 實(shí)施故障轉(zhuǎn)移。電源恢復(fù)后,請將服務(wù)器 A (其現(xiàn)在為無源服務(wù)器) 開機(jī)。
6. 維護(hù) high-availability 集群
要了解日常維護(hù)的程序,請參見以下說明。
程序 |
說明 |
---|---|
移動(dòng)這兩臺服務(wù)器到其他位置 |
|
升級兩臺服務(wù)器上的 RAM 或 NIC |
|
更換無源服務(wù)器上的故障組件 (如 RAM、風(fēng)扇或 NIC) |
|
更換活動(dòng)服務(wù)器上的故障組件 (如 RAM、風(fēng)扇或 NIC) |
|
將活動(dòng)服務(wù)器切換為無源服務(wù)器 |
|
取消無源服務(wù)器與集群的綁定 |
|
綁定新無源服務(wù)器 |
|
刪除 high-availability 集群并將服務(wù)器恢復(fù)到獨(dú)立狀態(tài) |
|
更新系統(tǒng) |
|