基于prometheus的云監(jiān)控告警方案為五星云站全站提供智能報警
傳統(tǒng)的監(jiān)控警告初次使用需要大量配置,而且隨著服務器和業(yè)務的增長會發(fā)現面臨很多問題,比如DB性能瓶頸;多套部署,管理成本高;配置和管理非常復雜,易用性差;郵件配置各種規(guī)則相當復雜,一不小心可能就容易造成郵件風暴的問題等。
五星云站中使用了基于prometheus的云監(jiān)控告警方案,具有以下優(yōu)勢:
1.縮短流程。老系統(tǒng)要增加機器需要提前申請,而使用 Kubernetes 容器平臺只要整個資源池里有充足的資源,不用提交預算就可以直接使用。
2. 彈性擴容。在流量高峰期,容器平臺可以快速擴容;在流量不多的時段,空閑的資源可以處理其他離線任務,對資源的利用率高。
3.高可用。容器平臺可以保證運行的服務數量總是能達到預期。
4.減輕運維負擔。之前所有的部署上線活動都是運維來做。容器平臺上線后,開發(fā)人員可以直接在程序完成之后將其制作成鏡像,自己就可以進行部署。