了解最新公司動態及行業資訊
XXXX有限公司服務器運維管理指南 XXXX有限公司運維服務部 1 文檔介紹 2 2 文檔用途 3 3 文檔適用范圍 3 4 故障處理流程 3 5 具體操作說明 41 服務器硬件管理 42 服務器系統管理91.系統管理92. Linux系統管理 9 6 相關文檔 10 1 文檔簡介 本文檔根據桑菲消費通信服務器的硬件設備和系統應用管理要求進行分類,日常維護內容在技術上分為概要說明和具體操作步驟及操作方法,以積累服務器風暴處理能力,使其服務運維能力更加主動可控。 第二篇文檔目的是規范服務器故障處理方法,指導服務器管理知識庫積累。 第三文件范圍。 服務器硬件故障判斷和標準處理操作服務器系統日常性能測量和標準測量。 1服務器硬件管理1. 檢測與故障判定 服務器硬件主動檢測方式主要分為三種: 設備面板指示燈檢測 硬件系統日志檢測 第三方工具檢測 面板燈檢測 IBM服務器有電源指示燈 硬盤 IDE設備活動指示燈 網卡指示燈系統 過熱告警燈、硬盤插槽和硬盤指示燈,惠普服務器中的指示燈一般為UID、內外健康燈,其他為電源和網口燈。 DELL的部分機型前面有風扇服務器運維,顯存,CPU燈,狀態圖標都很直觀,其他服務器和IBMHP差不多。 圖形說明和詳細說明。 二、系統日志檢測及檢測內容。 硬件歷史異常錯誤信息。 電腦管理-系統工具-風暴查看器。 異常故障情況歷史分析 硬件性能及使用生命周期 三種第三方檢測工具 檢測內容 硬件歷史異常錯誤信息 HP診斷工具 打開啟動程序 ELL診斷工具 第三方硬件設備診斷工具 IBM診斷工具 相關圖示 進入診斷頁面在第一個選項卡的下部有2個下拉項。 在兩側,選擇左側的全部以顯示更多硬件信息。 點擊右下角的保存按鈕保存該界面,可以看到服務器的所有硬件信息。 確定硬件設備變化的操作標準服務器運維,確定最快的恢復時間 確定是否有冗余設置 確定是否需要使c盤設備崩潰 檢查并確定陣列信息 確定數據備份是否會影響其他相關應用 制定回滾計劃鋼瓶現場處置選項。
pdf 鋼瓶現場處置方案。 doc 見習基地管理計劃。 doc 暴風雨團訪解決方案 工地揚塵整治專項方案 下載保障資料及應用可用性 設備變更 運行設備 兼容性測試 應用系統 運行測試設備 變更后將應用 3.相關檢查記錄表“服務器信息清單”的備注 》 《服務器指標檢查表》 2 服務器系統管理 服務器系統管理主要分為系統管理 Linux系統管理 1.系統管理 11c盤空間使用電腦管理盤
磁盤管理 c 盤空間使用率是否已經達到 8012 進程監控 任務管理器進程 檢查進程的 CPU 使用率和顯存使用率是否超過閾值 13 CPU 性能 任務管理器性能 檢查最高峰值和正常 CPU 使用率是否超過閾值 14 顯存性能 檢查任務管理器的性能,查看顯存的最高峰和正常使用是否超過閾值。 檢查顯存使用量是否超過70或其他定義的閾值。 應用程序或系統程序記錄的事件 安全日志 查看有效和無效登錄嘗試的事件和與資源使用相關的事件 系統組件記錄的系統日志事件 2. Linux 系統管理 1221 平均負載描述命令 以前只顯示系統多長時間一直在運行。 現在它可以顯示系統已經運行了多長時間。 當前有多少用戶登錄? 過去 1515 分鐘的平均負載是多少? Used The file has used 文件系統使用掛載目錄的容量。 23 進程監控 ps – 檢查應用程序啟動進程數是否正常。 多個進程共享多少顯存 C盤緩存的大小 第三行——有多少free is 多少 25 CPU使用率 top 說明 top提供了當前運行系統的實時動態視圖,即默認運行進程CPU占用率最高的任務排在第一行,每5秒刷新一次 26 IO監控 -r 等待進程數 -b 不間斷休眠進程數 -swpd 虛擬顯存占用KB – free idle video usage KB-buff為顯存使用量-c盤顯存量KBps-so從c盤換出的顯存量-bi每次讀取的塊數-bo 每秒寫入的塊數 in per 中斷次數包括時鐘中斷,cs,每秒上下文切換次數,CPU數量表示為us的比值 用戶進程執行時間 系統進程執行時間 空閑時間包括IO等待時間 wa 等待IO時間 27 Logs 系統日志記錄報告信息 硬件啟動日志記錄系統啟動錯誤信息 應用系統日志服務器各應用的日志系統,如etc 備注“系統主機信息”表》、《系統主機檢查表》、《系統風暴記錄表》六個相關文件《系統主機信息表》、《系統主機檢查表》、《系統風暴記錄表》、《服務器燈檢查表》、《服務器信息列表》 》、《IDC環境管理體系》