了解最新公司動態及行業資訊
本發明專利技術涉及集群服務故障預警技術領域,公開了一種基于RPC服務監控的集群服務故障預警系統,包括:運行集群服務服務器軟件的云服務器故障預警系統,部署在遠程云計算服務器,計算機終端,運行集群服務故障預警系統客戶端軟件,用于執行集群服務器的運維管理任務,計算機終端與云計算服務器通過網絡通信設備進行相互通信;集群服務故障預警系統包括數據采集代理節點CNi、網關服務器和數據計算中心。數據計算中心與網關服務器相互通信,網關服務器與采集代理節點CNi相互通信。本發明專利技術解決了如何通過遠程服務調用服務的監控操作實現集群系統的監控預警的技術難題。
下載所有詳細的技術數據
【技術實現步驟總結】
一種基于RPC服務監控的集群服務故障預警系統
專利技術涉及集群服務故障預警
,具體來說是一個基于RPC服務監控的集群服務故障預警系統。
技術介紹
隨著計算機制造技術和網絡通信技術的不斷發展,集群系統以其可擴展性好、性價比高等優勢服務器運維技術,逐漸取代了傳統的大型機和超級計算機,在眾多工業領域得到了廣泛的應用。然而,集群系統往往由普通的計算機節點組成,無法保證始終穩定可靠的運行。節點故障或網絡問題,甚至流量突然增加,都可能導致集群服務中斷。因此,集群監控成為保障集群穩健服務的關鍵技術。集群系統的節點通常通過遠程服務調用的方式進行通信。節點通過調用其他節點的遠程服務接口完成其功能,同時也通過遠程服務調用接口對外提供服務。遠程服務調用(RPC)是一種進程間通信方式,允許進程通過網絡調用遠程服務接口來完成功能。但是由于跨主機通信,RPC服務更容易因為網絡故障和對等故障而出現故障。了解RPC服務的成功率和延遲,有助于掌握集群服務的狀態,保證集群服務的質量。因此,如何通過遠程服務調用服務的監控操作來實現集群系統的監控和預警,成為保證集群系統服務質量的有效解決方案。
技術實現思路
(一)解決的技術問題針對現有技術的不足,本專利技術提供基于RPC服務監控的集群服務故障預警系統,解決如何通過監控調用服務遠程服務運行,實現集群系統監控預警的技術問題。(二)技術方案為了達到上述目的,專利技術提供了如下技術方案:集群服務故障基于RPC服務監控的預警系統,包括:運行集群服務服務故障預警系統的服務器軟件和部署在遠程云端的云計算服務器,運行集群服務故障預警客戶端軟件的計算機終端系統,用于執行集群服務器的運維管理任務,計算機終端與云端通信通過網絡通信設備將計算服務器相互連接進行通信;集群服務故障預警系統包括數據采集代理節點CNi、網關服務器和數據計算中心,數據計算中心和網關服務器相互連接通信,網關服務器和數據計算中心相互連接。代理節點CNi進行相互之間的通信連接。進一步地,所述的數據獲取代理節點CNi部署在各個監控節點中,負責通過進程間通信收集被監控進程RPC框架上報的監控數據,并且該數據進一步,數據計算中心負責大規模監控數據流的實時計算和實時分析,主要包括數據清洗模塊、數據統計模塊、結果分析報警模塊,數據存儲模塊。
進一步,數據分析與告警模塊負責根據閾值判斷規則分析監控數據流的統計結果,判斷是否需要向運維平臺發出告警。 (三)有益技術效果 與現有技術相比,本專利技術具有以下有益技術效果: 專利技術用于通過在每個監控節點上部署一個數據采集代理節點CNi來采集被監控進程。RPC框架通過進程間通信上報監控數據,并通過網關服務器主動將數據發送給數據計算中心,數據計算中心負責對大規模監控數據進行實時計算和實時分析流,監控數據流基于閾值判斷規則,分析系統的統計結果,判斷是否需要向運維平臺發出告警,從而實現監控預警的技術效果。集群系統通過遠程服務調用服務的監控運行,具體實現方式以實現方式為準下面結合專利技術舉例,清楚完整地描述專利技術實施例中的技術方案。顯然,所描述的實施例僅僅是專利技術的一部分實施例,而不是全部的實施例。基于本專利技術中的實施例,本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其他實施例,都屬于本專利技術保護的范圍。一種集群服務故障預警基于RPC服務監控的系統,包括:運行集群服務故障預警系統服務器軟件和部署在遠程云端的云計算服務器運行集群服務故障預警系統客戶端軟件的計算機終端,用于執行操作和集群服務器的維護管理任務。計算機終端通過網絡通信設備與云計算服務器進行通信。進行相互通信連接;集群服務故障預警系統包括數據采集代理節點CNi、網關服務器和數據計算中心,數據計算中心和網關服務器相互連接通信,網關服務器和采集代理節點. CNi 相互通信;其中,數據收集代理節點CNi部署在各個監控節點上,負責收集被監控進程RPC框架通過進程間通信上報的監控數據,并主動將數據發送給網關服務器;網關服務器負責處理數據采集代理節點CNi的數據上報請求,負責監控數據的聚合;進一步,數據計算中心負責大規模監控數據流的實時計算和實時分析服務器運維技術,主要包括數據清洗模塊、數據統計模塊、結果分析與告警模塊、數據存儲模塊;數據清洗模塊負責從網關服務器獲取原始監控數據流,并檢查原始監控數據流的有效性和及時性。數據統計模塊負責統計監控數據流,包括系統的機器性能統計和各個RPC接口的服務性能統計;數據分析與告警模塊,負責根據閾值判斷規則對監控數據流的統計結果進行分析,判斷是否需要向運維平臺發出告警;數據存儲模塊負責監測數據統計,分析結果存入數據庫;進一步地,在計算機終端的操作系統上安裝并運行通信權限認證系統的服務器軟件;為防止非法網絡節點通過集群服務器冒充云計算服務器,服務故障預警系統向計算機終端發送虛假集群服務故障預警信息。在計算機終端接收到云計算服務器發送的告警信息之前,通信權限認證系統對云計算服務器的身份進行驗證。該認證方法具體包括以下步驟: 步驟1,云計算服務器在通信權限認證系統上注冊通信權限,具體如下:云計算服務器在通信權限認證系統上隨機選擇私鑰x,并計算公鑰y=x*P,其中P定義在有限域F上的橢圓曲線E的生成器將公鑰y暴露給通信權限認證系統;步驟二,當云計算服務器向計算機終端發送集群服務失敗警告信息時,通信權限認證系統驗證云計算服務器的身份。認證如下:云計算服務器隨機選擇一個整數N,計算M=N*P,將M發送給通信權限認證系統;通信權限認證系統隨機選擇字符l∈{0,1},分配字符l發送給云計算服務器;云計算服務器計算N+l*x并傳送給通信權限認證系統;通信權限認證系統驗證方程(N+l*x)*P=M+l*y是否成立;如果上式成立,證明云計算服務器知道通信私鑰x,具有合法的通信權限,則計算機終端接受云計算服務器發送的集群服務失敗警告信息;在上述認證過程中,密鑰x只在認證過程中。參與計算,不傳輸通信,使得非法跟蹤者無法截獲線路中的密鑰,云計算服務器的身份認證過程是零知識的;其中,遠程服務調用(,RPC)是一種進程間通信協議,它允許應用進程在不知道底層網絡的情況下,通過網絡向遠程計算機上的應用進程請求服務
【技術保護點】
1.一種基于RPC服務監控的集群服務故障預警系統,其特征在于它包括:運行集群服務故障預警系統服務器軟件并部署在遠程云端的云計算服務器,運行一個集群服務故障預警系統 服務故障預警系統的客戶端軟件和用于執行集群服務器運維管理任務的計算機終端,計算機終端通過網絡通信設備與云計算服務器連接,用于相互通信;/n 集群服務故障預警系統包括:數據采集代理節點CNi、網關服務器、數據計算中心、數據計算中心和網關服務器相互通信、網關服務器與采集代理節點CNi相互通信。 /n
【技術特點總結】
1.一種基于RPC服務監控的集群服務故障預警系統,其特征在于它包括:運行集群服務故障預警系統服務器軟件并部署在遠程云端的云計算服務器,運行一個集群服務故障預警系統 服務故障預警系統的客戶端軟件和計算機終端,用于執行集群服務器的運維管理任務,計算機終端通過網絡通信設備與云計算服務器連接,用于溝通;
集群服務故障預警系統包括數據采集代理節點CNi、網關服務器、數據計算中心。數據計算中心和網關服務器相互通信,網關服務器和采集代理節點CNi相互通信。通訊連接。
2.根據權利要求1所述的基于RPC服務監控的集群服務器...
【專利技術屬性】
技術研發人員:孫東英,
申請人(專利權):孫東英,
類型:發明
國家省市:山東;37
下載所有詳細的技術數據我是該專利的所有者