資源簡介
隨著軟件日新月異的發展和微服務的深入人心,運維越來越受到人們的重視。在大量的運維數據里,最不可忽視的就是各種 KPI、指標數據,它們在數學上都可以被表達為時間序列的形式。在一個大型軟件系統里,往往每分鐘能產生百萬級的時間序列,如何從這些海量數據里發現規律,指導運維并將其智能化,成為了下一代運維中最重要的環節之一。 在本次演講中,我們將從機器學習的角度分享運維里指標的三大問題:預測、異常檢測和根源分析。同時,運維系統里的每個指標并非獨立存在,我們將闡述如何能從多 KPI 中挖掘它們的關聯去更好地指導系統監控。
代碼片段和文件信息
評論
共有 條評論