了解最新公司動態及行業資訊
在當今互聯網時代,我們的IT運維、技術等相關人員面臨以下問題和困惑:
-聽說SRE工程師的薪水很高,有沒有綜合學習的機會?
-SRE 是技術還是工作?工資高的原因是什么?
-SRE和-SRE有什么關系?具體有什么區別?
-研發團隊正在流水線上工作。作為運維人員,如何參與?
-SLO 怎么了?如何在企業內部實施?
-聽說“可觀察性”正在逐漸取代監控it運維技術,您如何理解“可觀察性”?
什么是 SRE?
SRE 的全稱是 Site。 SRE 最早由其工程實踐提出并在其工程實踐中發揚光大。出版同名著作《Site》,在互聯網工程師圈內廣為傳播。 SRE(站點可靠性工程)是一門結合軟件工程各個方面并將其應用于基礎設施和運營問題的學科,于 2003 年左右在 創建并通過 SRE 相關書籍進行推廣。 SRE是一門學科it運維技術,SRE是一種最佳實踐,SRE是一種創新立場。
為什么要學習 SRE?
傳統運維模式(Dev/Ops分離團隊模式)的沖突焦點:
戰略層面:
1、直接成本比較明確。
2、間接成本差異很大(背景、技術能力、工具習慣、工作目標)。
最初演變為目標方向的差異和嚴重的內部溝通問題,逐漸發展為部門之間的信任和尊重。
戰術級別:
傳統研發團隊和運維團隊的區別主要在于新軟件版本的發布速度和新的配置變化。
執行級別:
1、開發組宣布不再進行大規模的程序更新,而是進行功能開關調整、增量更新和補丁(大改→小改)。為了繞過運維團隊設置的各種流程,可以更快地推出新功能。
2、繞過運維團隊設置的新服務/變更發布流程,加速了新功能的上線,但事件仍在反復發生,導致服務質量不佳。
沖突解決:SRE
SRE 模型的優點:
1)運維次數比較少;
2)消除了開發團隊和運維團隊的沖突焦點;
3)提升產品分工水平,成員可以在SRE團隊和研發團隊之間自由流動。
SRE 是一種最佳實踐:
SRE和屬于開發運維一體化時代的產品很正常,有交集也很正常。 SRE可以是運維向運維研發的拓展,可以應用于國內廣泛的運維部門轉型。其實,還是“開發運維一體化”在國內剛剛開始實施。很多組織只是引入概念,還需要面對“生產環境每天都有問題,就是不知道問題出在哪里”的問題。
SRE 可以理解為一種具體的實踐。而不是有更具體的工作或角色定義。
1、SRE的主要思想如下:
意外是正常的/變化應該是漸進的/工具和文化是相關的/衡量的。
2、SRE的主要原理或核心如下:
2.1 軟件問題:用軟工程的思想解決運維領域的問題;
2.2 通過 SLO 管理:產品團隊和 SRE 團隊為服務及其用戶群選擇適當的可用性目標,并根據該 SLO 管理服務;
2.3 盡量減少家務:找出家務的來源,以便盡量減少甚至消除;
2.4 自動化:決定在什么條件下自動化什么以及如何自動化;
2.5 與開發者共享:工件透明、信息共享、工具同步;
2.6 持續改進:快速試錯,快速改進,更高效,更可靠,增加收入;
SRE 課程是關于什么的?
1.互聯網時代IT運維精英能力分析
2.如何成為稀缺的高薪SRE人才
3.SRE起源與實踐總結
4.SRE 自動化實踐
5.服務水平目標和錯誤預算
6.勞苦(勞苦)
7.監控和服務水平指標
8.SRE 工具和自動化
9.反脆弱和從失敗中學習
10.SRE框架及發展趨勢
參加 SRE 課程可以獲得什么?
SRE 代表了行業現有管理大型復雜服務的最佳實踐的重要突破。由于目前全球領先,SRE模型可以為廣大企業提供深度模仿或借鑒。
通過學習和掌握SRE,將帶來以下好處:
-SRE 學習路徑
-SRE 主導的自動化
-服務水平目標 (SLO)
-如何減少家務(Toil)
-可觀察性()
-入門
國際知名研究院(DOI)推出的SRE認證代表了該領域最新的知識體系。該認證介紹了SRE的發展及其未來方向,為學生提供了SRE的最新理念、實踐方法和日常生活。可以幫助現有 SRE 團隊將現有 SRE 實踐與國際理論標準相結合的工具,以增強 SRE 實踐能力。亞飛傲朗聯合推出SRE系列認證培訓,成為國內首家授權全系列SRE課程培訓考試機構。
更多 SRE 學習資料: