中小銀行私有云建設實踐研究

時間:2022-03-19 03:45:15

導語:中小銀行私有云建設實踐研究一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。

中小銀行私有云建設實踐研究

摘要:本文總結了中小銀行私有云需求及建設經驗,并對未來發展方向進行試驗性探索。一是通過虛擬化建設,解決資源利用率低、空間能耗大、資源成孤島、資源提供慢、運維人員“救火式”工作、操作風險大等問題;二是通過云管理平臺及自動化運維平臺建設,實現IT資源的自動化、服務化、自服務的“云”管理,將企業管理理念、流程落地到平臺中,降低操作性及合規風險;三是對私有云帶來的能耗及空間占用的減少、資源及風險管理的趨嚴、高可用性及容災建設的提高、開發運維關系的變化進行分析;四是在新技術新理念的支撐下,提出私有云未來應向業務能力服務化的服務云平臺建設轉變,融合多種技術進一步支撐、引領業務發展。

關鍵詞:虛擬化;私有云;云管理平臺;自動化運維平臺

當前,云計算相關技術已經成熟,成為各行各業IT建設的主流。本文對中小銀行多年的私有云建設經驗進行總結,并分享筆者對新方向、新課題的探索。

一、挑戰與機遇

近年來,隨著農信規模不斷擴大、業務不斷增長,應用系統及設備的數量不斷增加、數據中心能耗增加,IT建設面臨種種挑戰。一是煙囪式的建設造成設備眾多、資源利用率低。二是設備占用空間大,用電、制冷等能耗高,無法做到綠色節能。三是IT資源形成孤島,在業務高峰期,資源無法靈活調配。四是資源從規劃到上線,需要3-6個月以上,影響了新業務開發進度。五是高可用性、災備架構不適應新的需求,建設及改造難度大。六是運維壓力大,存在大量“救火式”的重復勞動,運維人員無法提升自我和系統架構,造成了操作性風險大、多部門溝通協作困難等問題。七是各縣域法人行社有大量的特色業務,其效率、安全性、隔離性、資源彈性要求較高,無法有效支撐。這些問題造成了運維成本高,阻礙了業務的進一步發展。IT運維部門迫切需要改革,實現從成本中心向價值中心的轉變。

二、私有云基礎架構

虛擬化將物理設備虛擬成虛擬設備,并整合成資源池,分享給使用者。從使用者角度看,這些虛擬設備和物理設備是沒有區別的,實現了IT資源的動態分配、靈活調度、跨域共享,提高資源利用率。采用虛擬服務器代替物理服務器無須調整應用架構,是運維部門在難以獲得其他部門支持時,可獨立實施、平滑過渡的方案。實現IT資源的資源池化,應從數據中心全局角度考慮IT基礎軟硬件的高可用性架構。一是需要從整體考慮資源隔離,虛擬資源池應分布于防水、防火、供電、制冷系統相隔離、具有高可用性的不同機房。二是網絡、計算、存儲資源充分冗余,計算資源池還應設計30%冗余,滿足虛機故障遷移需求。三是用傳統高可用性技術在故障發生后恢復應用對外服務,實現應用高可用性,虛擬化技術用于故障發生后遷移故障虛機,恢復應用高可用性。要實現應用系統從物理機到虛擬資源池的平滑、安全、快速遷移。一方面,要利用虛擬化平臺提供的P2V工具,實現物理機到虛擬機的遷移;另一方面,為減少系統停機時間,應結合應用高可用架構,進行應用拆半遷移(集群設備逐一停機遷移到虛機),其中采用主備架構應用需要一次不到半個小時的停機窗口,多活集群會造成部分連接中斷或延時響應,但不會造成停機。

三、云管理平臺及自動化運維平臺建設

云計算是將IT資源作為一種服務,通過網絡,隨時、隨地、不限設備、不限方式、不限渠道地按需供給用戶的模式。因此,私有云需在虛擬化基礎上,通過云管理平臺(以下簡稱“云管”)及自動化運維平臺建設,落地企業管理理念和云理念。(一)云管理平臺建設。云管至少應包含用戶管理、資源管理、服務交付及管理、容量及成本管理、運維功能及外部系統集成等模塊,并應具有跨地域多數據中心統一管理能力。1.虛擬化資源的共享特性造成了隔離性、安全性、合規性的問題,因此在傳統用戶管理外,需增加租戶管理模塊。一是采用多租戶技術,遵循一定的規范,實現租戶間資源、數據、接口的隔離,租戶內共享資源、數據、接口,并使用統一的服務等級(SLA)、資源等級(RLA)管理。二是設置租戶管理員,采用配額管理的方式,在配額內,租戶管理員可以自行分配、管理資源,實現用戶管理的自服務,進一步降低運維壓力。2.資源管理是云管對接虛擬化工具提供的接口,實現對網絡、存儲、計算、安全、負載等資源進行統一自動化的配置、分配、監控、計量、存量納管等功能,以實現云管的其他模塊對資源的交付、展示、管理等。3.服務交付及管理要實現資源按需、定制化、自服務式交付。一是通過資源管理模塊實現單一資源的用戶定制、自動化生成并交付。二是對多種資源進行服務編排,將多種資源按用戶需求有機整合、共同交付。三是將經常使用的服務編排做成應用藍圖。四是將單資源、服務編排、應用藍圖等做成服務目錄,在用戶門戶上,用戶可以通過服務目錄的“菜單”去“點菜”,實現資源獲取的自服務。五是提供SLA,RLA管理、服務期限配置、日志留存、命名規范等合規管理及服務報告等功能。4.容量與成本管理是運維走向運營的重要一步,通過對資源使用情況及趨勢進行分析,跟蹤、分析、預測容量使用情況,提供容量管理功能,為資源池化管理提供支撐;通過對資源使用進行計量計費,實現對項目及產品的成本控制及收支計量等管理。5.運維提供了工單、流程、監控、配置、容量、報表、日志等管理功能,并提供報表統計、大屏展示等項目,輔助私有云的運維工作。6.外部系統集成對接用戶認證系統(SSO)、運維、項目管理和OA系統,使得私有云在管理上和規范上向全行看齊,如圖1所示。(二)自動化運維平臺建設。一是實現作業調度,實現將開發、運維、測試的腳本、作業等,按照一定條件、順序和編排在指定的系統中執行,實現自動化運維、巡檢、系統備份、業務系統維護等操作。二是實現自動應用部署,按照編寫好的事務,自動化地調用私有云接口、系統腳本、應用腳本及相關介質,自動化部署應用。三是實現應用的資源動態、靈活分配,在突發業務高峰中新增應用節點、配置負載均衡,在故障中按既定程序啟、停節點,防止業務壓力奔潰的“雪崩”效應。四是實現自動化的應急切換、自動恢復高可用性集群,以及自動化的災備切換等,實現業務連續性。

四、帶來的改變

(一)大幅提高資源效率,做到綠色節能。從多年建設情況看,資源使用率提高了6倍,物理機減少85%,空間占用減少了5倍,每年可節約50%的電費。(二)大幅提高效率、靈活性、可用性。實現IT資源的按需獲取,資源提供從原3-6個月縮短至2個小時內,實現了靈活、動態分配資源,經受住了多個業務高峰的考驗,減輕了運維壓力,降低了操作風險,也為法人行社的特色業務開展提供了科技支撐。(三)極大地提高了高可用性。一是提供了可用于實現高可用性及災備的新工具。二是虛擬化與自動化運維相結合,提高了高可用性。三是改善災備建設方式,信息系統可通過配置數據快速在災備端恢復。(四)改變了IT資源管理方式。一是原煙囪式建設變成基于容量分析、資源統籌的資源池管理方式。二是需要進行自動化、智能化運維工具建設,輔助人員管理資源、分析問題。三是在監控方面,需要應用、網絡、虛擬機與物理機等全方位聯合監控、關聯分析,否則會出現虛機監控指標正常,但實際物理機資源耗盡、業務失敗的情況。(五)改變了開發、運維的關系,迫切需要實現。DevOps一方面,開發需了解運維工具,以及資源的動態、靈活調度、自動化多中心部署等,復用自動化運維工具調整應用架構的實現。另一方面,運維需要前移到開發,需要培訓新工具、討論應用架構、提出系統自動化及智能化運維的功能需求等工作。

五、啟示

隨著我國經濟發展進入新常態,移動互聯網時代來臨,金融科技浪潮的進一步沖擊需要科技與業務之間進行聯合創新來適應新環境。科技部門應利用微服務、中臺等新理念新工具,實現業務服務能力的云化,提供快速創新和容錯試錯的能力。業務服務能力的云化建設,是一個需要從體制機制改革、科技組織配套建設、業務梳理到科技建設的全局性全行級戰略的“一把手工程”。一是云化銀行客戶、數據、存、貸、匯等業務功能。一方面,為前臺業務提供可編排、受管理、自動化、自服務、靈活動態的基礎服務能力,如客戶管理、信用管理、資金管理、貸款管理、支付清算、外聯服務、流程管理、檢索服務、數據服務、報表服務等一系列公共的基礎服務能力。另一方面,通過服務編排,快速整合成完整的金融服務場景,實現敏捷開發。服務化可以通過以下6步方法論來實現:第一抽象化,定義企業所提供服務的本質,找到核心的業務服務能力;圖1 IaaS云架構SDNHypervisor虛擬化層用戶管理資源管理服務交付運維功能外部集成安全合規云管理平臺物理資源池網絡計算和存儲安全負載均衡第二虛擬化,通過包括信息技術在內的各種技術,改造、改進企業科技架構,建設大平臺,使之適合云化的服務供給方式;第三標準化,將服務標準化,降低推廣難度、統一服務質量,奠定服務自動化提供的基礎;第四資源池化,對服務資源進行集中控制、管理、供給、擴容、回收等;第五自動化,實現自動、高效、可靠、可擴展的服務供給方式;第六服務化,建設管理平臺,有機整合資源、貫徹管理理念,提供對業務能力的云化管理,實現通過服務編排、發現及調度,快速定制行業務系統,各業務的資源自動化調度、高可用性、容災也都作為一種服務,由平臺編排、發現及調度,實現業務快速創新。二是以分布式的理念,對業務進行梳理,保障業務的多個子業務按照既定的業務規則并行同方向執行,保障數據一致性,提高系統性能及用戶體驗。進行業務的梳理分析,整理全行的業務、業務場景及目標客戶、業務間的關聯關系及業務內部使用到的服務等;對業務每一個環節的一致性、可用性的要求進行分析;基于以上分析結果,結合BASE的方法論,進行業務系統、流程的設計,設計統一的接口、調用及調度標準;結合異步、同步機制,進行分布式服務接口冪等性(同一事務多次執行結果和一次執行相同)、會話、鎖、事務、搜索、緩存、消息隊列、負載均衡、統一配置中心、存儲、數據庫分庫分表、限流、熔斷、降級等設計,最終達到一致性、可靠性、性能、分區容忍性及客戶體驗的有機統一。三是加強CD/CI及DevOps能力建設,實現在線的測試、驗證、部署、回退能力,提供試錯容錯能力。四是建設貫穿全業務生命周期、自動化、智能化的一體化監控,為故障的自動定位與排除,資源、高可用性及容災的自動化調度提供支撐。五是建立從科技管理、科技運維到科技運營轉變的體系,更好地支撐業務,實現成本管理。

參考文獻:

[1]鄧厚.云計算數據中心中的虛機部署優化研究[D].合肥:中國科學技術大學,2018.

[2]NengHuang.ConstructionofHigh-AvailabilityBankSysteminVirtualizedEnvironments[C].IEEEInternationalconferenceondatascienceincyberspace,2017:561-568.

[3]喻德祿,郭世龍,丁樹晶.中小銀行基于微服務架構的應用服務體系研究與實踐[J].中國金融電腦,2018(3):30-33.

作者:黃能 單位:福建省農村信用社聯合社