了解最新公司動態(tài)及行業(yè)資訊
本發(fā)明專利技術涉及集群服務故障預警技術領域,公開了一種基于RPC服務監(jiān)控的集群服務故障預警系統(tǒng),包括:運行集群服務服務器軟件的云服務器故障預警系統(tǒng),部署在遠程云計算服務器,計算機終端,運行集群服務故障預警系統(tǒng)客戶端軟件,用于執(zhí)行集群服務器的運維管理任務,計算機終端與云計算服務器通過網(wǎng)絡通信設備進行相互通信;集群服務故障預警系統(tǒng)包括數(shù)據(jù)采集代理節(jié)點CNi、網(wǎng)關服務器和數(shù)據(jù)計算中心。數(shù)據(jù)計算中心與網(wǎng)關服務器相互通信,網(wǎng)關服務器與采集代理節(jié)點CNi相互通信。本發(fā)明專利技術解決了如何通過遠程服務調用服務的監(jiān)控操作實現(xiàn)集群系統(tǒng)的監(jiān)控預警的技術難題。
下載所有詳細的技術數(shù)據(jù)
【技術實現(xiàn)步驟總結】
一種基于RPC服務監(jiān)控的集群服務故障預警系統(tǒng)
專利技術涉及集群服務故障預警
,具體來說是一個基于RPC服務監(jiān)控的集群服務故障預警系統(tǒng)。
技術介紹
隨著計算機制造技術和網(wǎng)絡通信技術的不斷發(fā)展,集群系統(tǒng)以其可擴展性好、性價比高等優(yōu)勢服務器運維技術,逐漸取代了傳統(tǒng)的大型機和超級計算機,在眾多工業(yè)領域得到了廣泛的應用。然而,集群系統(tǒng)往往由普通的計算機節(jié)點組成,無法保證始終穩(wěn)定可靠的運行。節(jié)點故障或網(wǎng)絡問題,甚至流量突然增加,都可能導致集群服務中斷。因此,集群監(jiān)控成為保障集群穩(wěn)健服務的關鍵技術。集群系統(tǒng)的節(jié)點通常通過遠程服務調用的方式進行通信。節(jié)點通過調用其他節(jié)點的遠程服務接口完成其功能,同時也通過遠程服務調用接口對外提供服務。遠程服務調用(RPC)是一種進程間通信方式,允許進程通過網(wǎng)絡調用遠程服務接口來完成功能。但是由于跨主機通信,RPC服務更容易因為網(wǎng)絡故障和對等故障而出現(xiàn)故障。了解RPC服務的成功率和延遲,有助于掌握集群服務的狀態(tài),保證集群服務的質量。因此,如何通過遠程服務調用服務的監(jiān)控操作來實現(xiàn)集群系統(tǒng)的監(jiān)控和預警,成為保證集群系統(tǒng)服務質量的有效解決方案。
技術實現(xiàn)思路
(一)解決的技術問題針對現(xiàn)有技術的不足,本專利技術提供基于RPC服務監(jiān)控的集群服務故障預警系統(tǒng),解決如何通過監(jiān)控調用服務遠程服務運行,實現(xiàn)集群系統(tǒng)監(jiān)控預警的技術問題。(二)技術方案為了達到上述目的,專利技術提供了如下技術方案:集群服務故障基于RPC服務監(jiān)控的預警系統(tǒng),包括:運行集群服務服務故障預警系統(tǒng)的服務器軟件和部署在遠程云端的云計算服務器,運行集群服務故障預警客戶端軟件的計算機終端系統(tǒng),用于執(zhí)行集群服務器的運維管理任務,計算機終端與云端通信通過網(wǎng)絡通信設備將計算服務器相互連接進行通信;集群服務故障預警系統(tǒng)包括數(shù)據(jù)采集代理節(jié)點CNi、網(wǎng)關服務器和數(shù)據(jù)計算中心,數(shù)據(jù)計算中心和網(wǎng)關服務器相互連接通信,網(wǎng)關服務器和數(shù)據(jù)計算中心相互連接。代理節(jié)點CNi進行相互之間的通信連接。進一步地,所述的數(shù)據(jù)獲取代理節(jié)點CNi部署在各個監(jiān)控節(jié)點中,負責通過進程間通信收集被監(jiān)控進程RPC框架上報的監(jiān)控數(shù)據(jù),并且該數(shù)據(jù)進一步,數(shù)據(jù)計算中心負責大規(guī)模監(jiān)控數(shù)據(jù)流的實時計算和實時分析,主要包括數(shù)據(jù)清洗模塊、數(shù)據(jù)統(tǒng)計模塊、結果分析報警模塊,數(shù)據(jù)存儲模塊。
進一步,數(shù)據(jù)分析與告警模塊負責根據(jù)閾值判斷規(guī)則分析監(jiān)控數(shù)據(jù)流的統(tǒng)計結果,判斷是否需要向運維平臺發(fā)出告警。 (三)有益技術效果 與現(xiàn)有技術相比,本專利技術具有以下有益技術效果: 專利技術用于通過在每個監(jiān)控節(jié)點上部署一個數(shù)據(jù)采集代理節(jié)點CNi來采集被監(jiān)控進程。RPC框架通過進程間通信上報監(jiān)控數(shù)據(jù),并通過網(wǎng)關服務器主動將數(shù)據(jù)發(fā)送給數(shù)據(jù)計算中心,數(shù)據(jù)計算中心負責對大規(guī)模監(jiān)控數(shù)據(jù)進行實時計算和實時分析流,監(jiān)控數(shù)據(jù)流基于閾值判斷規(guī)則,分析系統(tǒng)的統(tǒng)計結果,判斷是否需要向運維平臺發(fā)出告警,從而實現(xiàn)監(jiān)控預警的技術效果。集群系統(tǒng)通過遠程服務調用服務的監(jiān)控運行,具體實現(xiàn)方式以實現(xiàn)方式為準下面結合專利技術舉例,清楚完整地描述專利技術實施例中的技術方案。顯然,所描述的實施例僅僅是專利技術的一部分實施例,而不是全部的實施例?;诒緦@夹g中的實施例,本領域普通技術人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本專利技術保護的范圍。一種集群服務故障預警基于RPC服務監(jiān)控的系統(tǒng),包括:運行集群服務故障預警系統(tǒng)服務器軟件和部署在遠程云端的云計算服務器運行集群服務故障預警系統(tǒng)客戶端軟件的計算機終端,用于執(zhí)行操作和集群服務器的維護管理任務。計算機終端通過網(wǎng)絡通信設備與云計算服務器進行通信。進行相互通信連接;集群服務故障預警系統(tǒng)包括數(shù)據(jù)采集代理節(jié)點CNi、網(wǎng)關服務器和數(shù)據(jù)計算中心,數(shù)據(jù)計算中心和網(wǎng)關服務器相互連接通信,網(wǎng)關服務器和采集代理節(jié)點. CNi 相互通信;其中,數(shù)據(jù)收集代理節(jié)點CNi部署在各個監(jiān)控節(jié)點上,負責收集被監(jiān)控進程RPC框架通過進程間通信上報的監(jiān)控數(shù)據(jù),并主動將數(shù)據(jù)發(fā)送給網(wǎng)關服務器;網(wǎng)關服務器負責處理數(shù)據(jù)采集代理節(jié)點CNi的數(shù)據(jù)上報請求,負責監(jiān)控數(shù)據(jù)的聚合;進一步,數(shù)據(jù)計算中心負責大規(guī)模監(jiān)控數(shù)據(jù)流的實時計算和實時分析服務器運維技術,主要包括數(shù)據(jù)清洗模塊、數(shù)據(jù)統(tǒng)計模塊、結果分析與告警模塊、數(shù)據(jù)存儲模塊;數(shù)據(jù)清洗模塊負責從網(wǎng)關服務器獲取原始監(jiān)控數(shù)據(jù)流,并檢查原始監(jiān)控數(shù)據(jù)流的有效性和及時性。數(shù)據(jù)統(tǒng)計模塊負責統(tǒng)計監(jiān)控數(shù)據(jù)流,包括系統(tǒng)的機器性能統(tǒng)計和各個RPC接口的服務性能統(tǒng)計;數(shù)據(jù)分析與告警模塊,負責根據(jù)閾值判斷規(guī)則對監(jiān)控數(shù)據(jù)流的統(tǒng)計結果進行分析,判斷是否需要向運維平臺發(fā)出告警;數(shù)據(jù)存儲模塊負責監(jiān)測數(shù)據(jù)統(tǒng)計,分析結果存入數(shù)據(jù)庫;進一步地,在計算機終端的操作系統(tǒng)上安裝并運行通信權限認證系統(tǒng)的服務器軟件;為防止非法網(wǎng)絡節(jié)點通過集群服務器冒充云計算服務器,服務故障預警系統(tǒng)向計算機終端發(fā)送虛假集群服務故障預警信息。在計算機終端接收到云計算服務器發(fā)送的告警信息之前,通信權限認證系統(tǒng)對云計算服務器的身份進行驗證。該認證方法具體包括以下步驟: 步驟1,云計算服務器在通信權限認證系統(tǒng)上注冊通信權限,具體如下:云計算服務器在通信權限認證系統(tǒng)上隨機選擇私鑰x,并計算公鑰y=x*P,其中P定義在有限域F上的橢圓曲線E的生成器將公鑰y暴露給通信權限認證系統(tǒng);步驟二,當云計算服務器向計算機終端發(fā)送集群服務失敗警告信息時,通信權限認證系統(tǒng)驗證云計算服務器的身份。認證如下:云計算服務器隨機選擇一個整數(shù)N,計算M=N*P,將M發(fā)送給通信權限認證系統(tǒng);通信權限認證系統(tǒng)隨機選擇字符l∈{0,1},分配字符l發(fā)送給云計算服務器;云計算服務器計算N+l*x并傳送給通信權限認證系統(tǒng);通信權限認證系統(tǒng)驗證方程(N+l*x)*P=M+l*y是否成立;如果上式成立,證明云計算服務器知道通信私鑰x,具有合法的通信權限,則計算機終端接受云計算服務器發(fā)送的集群服務失敗警告信息;在上述認證過程中,密鑰x只在認證過程中。參與計算,不傳輸通信,使得非法跟蹤者無法截獲線路中的密鑰,云計算服務器的身份認證過程是零知識的;其中,遠程服務調用(,RPC)是一種進程間通信協(xié)議,它允許應用進程在不知道底層網(wǎng)絡的情況下,通過網(wǎng)絡向遠程計算機上的應用進程請求服務
【技術保護點】
1.一種基于RPC服務監(jiān)控的集群服務故障預警系統(tǒng),其特征在于它包括:運行集群服務故障預警系統(tǒng)服務器軟件并部署在遠程云端的云計算服務器,運行一個集群服務故障預警系統(tǒng) 服務故障預警系統(tǒng)的客戶端軟件和用于執(zhí)行集群服務器運維管理任務的計算機終端,計算機終端通過網(wǎng)絡通信設備與云計算服務器連接,用于相互通信;/n 集群服務故障預警系統(tǒng)包括:數(shù)據(jù)采集代理節(jié)點CNi、網(wǎng)關服務器、數(shù)據(jù)計算中心、數(shù)據(jù)計算中心和網(wǎng)關服務器相互通信、網(wǎng)關服務器與采集代理節(jié)點CNi相互通信。 /n
【技術特點總結】
1.一種基于RPC服務監(jiān)控的集群服務故障預警系統(tǒng),其特征在于它包括:運行集群服務故障預警系統(tǒng)服務器軟件并部署在遠程云端的云計算服務器,運行一個集群服務故障預警系統(tǒng) 服務故障預警系統(tǒng)的客戶端軟件和計算機終端,用于執(zhí)行集群服務器的運維管理任務,計算機終端通過網(wǎng)絡通信設備與云計算服務器連接,用于溝通;
集群服務故障預警系統(tǒng)包括數(shù)據(jù)采集代理節(jié)點CNi、網(wǎng)關服務器、數(shù)據(jù)計算中心。數(shù)據(jù)計算中心和網(wǎng)關服務器相互通信,網(wǎng)關服務器和采集代理節(jié)點CNi相互通信。通訊連接。
2.根據(jù)權利要求1所述的基于RPC服務監(jiān)控的集群服務器...
【專利技術屬性】
技術研發(fā)人員:孫東英,
申請人(專利權):孫東英,
類型:發(fā)明
國家省市:山東;37
下載所有詳細的技術數(shù)據(jù)我是該專利的所有者