一. 服務(wù)器 1. 狀態(tài)監(jiān)控 (1) 服務(wù)器是否可訪問? (2) 相應(yīng)的數(shù)據(jù)庫服務(wù)是否啟用? (3) 操作系統(tǒng)事件日志中的錯(cuò)誤或告警 (4) 磁盤可用空間 服務(wù)器狀態(tài)監(jiān)控,不管使用第三方工具,還是使用自定義腳本,都建議部署在專門的一臺(tái)/多臺(tái)監(jiān)控機(jī)上,因?yàn)槿绻?wù)器DOW
一. 服務(wù)器
1. 狀態(tài)監(jiān)控
(1) 服務(wù)器是否可訪問?
(2) 相應(yīng)的數(shù)據(jù)庫服務(wù)是否啟用?
(3) 操作系統(tǒng)事件日志中的錯(cuò)誤或告警
(4) 磁盤可用空間
服務(wù)器狀態(tài)監(jiān)控,不管使用第三方工具,還是使用自定義腳本,都建議部署在專門的一臺(tái)/多臺(tái)監(jiān)控機(jī)上,因?yàn)槿绻?wù)器DOWN了或者故障了,任何本機(jī)的程序/腳本可能就無法運(yùn)行了,從而也失去了監(jiān)控的意義。
甚至有人想過在本機(jī)的SQL Server里寫SQL語句來監(jiān)視服務(wù)器狀態(tài),盡管可以實(shí)現(xiàn),但是有點(diǎn)自相矛盾。也許,又會(huì)有這么一個(gè)思路,服務(wù)器正常時(shí),SQL Server就發(fā)出郵件通知,如果沒有收到郵件就說明服務(wù)器不正常了,可如果有很多服務(wù)器時(shí),怎么知道誰沒發(fā)郵件呢?
2. 性能監(jiān)控
(1) IO壓力
(2) 內(nèi)存使用
(3) CPU使用
(4) 網(wǎng)絡(luò)帶寬占用
這1,香港服務(wù)器,2,香港服務(wù)器,3,4是按照容易出現(xiàn)瓶頸的順序排列的,由于磁盤的讀寫速度限制,通常IO是最容易出現(xiàn)瓶頸的地方,我們所做的很多優(yōu)化,也都是針對(duì)IO的,比如:索引優(yōu)化,讀寫分離等等。
從DBA的角度來說,服務(wù)器的某些性能監(jiān)控,如果可以的話,從數(shù)據(jù)庫層來做倒也無妨。
二. 數(shù)據(jù)庫
1. 狀態(tài)監(jiān)控
(1) 數(shù)據(jù)庫可否打開 (數(shù)據(jù)庫狀態(tài))
(2) 數(shù)據(jù)庫備份有沒有成功
(3) SQL Server/SQL Server Agent錯(cuò)誤日志中的錯(cuò)誤或告警
(4) SQL Agent 作業(yè)運(yùn)行狀態(tài)
(5) 數(shù)據(jù)庫一致性檢查的結(jié)果 (DBCC CHECKDB)
(6) 數(shù)據(jù)庫還原測試的結(jié)果
以下幾條狀態(tài)監(jiān)控,通常需要和系統(tǒng)平均值/基線值比較才有意義,否則沒有告警的標(biāo)準(zhǔn)。
(7) 連接數(shù)、請(qǐng)求數(shù)、事務(wù)數(shù)
(8) 數(shù)據(jù)庫/文件使用、大小、可用空間
(9) 表使用、行數(shù)、占用空間
2. 性能監(jiān)控
(1) 有沒有長時(shí)間運(yùn)行的查詢 (一般指沒有被任何請(qǐng)求阻塞,效率很差的查詢)
(2) 有沒有被阻塞的查詢 (可能單獨(dú)運(yùn)行很快,但和別的請(qǐng)求一起,由于有鎖等待,耗時(shí)很長)
(3) 有沒有死鎖 (開發(fā)人員/用戶口中說的”死鎖” 通常是阻塞/等待,數(shù)據(jù)庫死鎖通常很少讓用戶感覺到等待,香港服務(wù)器,一般是請(qǐng)求被中斷,因?yàn)楸籯ill掉了)
(4) 有沒有等待 (一般指各種資源的等待,等待和阻塞的交集就是鎖等待)
(5) 有沒有缺失的/未被使用的/效率不高的索引,以及索引碎片
(6) 有沒有過期的統(tǒng)計(jì)信息
(7) 有沒有數(shù)據(jù)庫文件的爭用 (比如:日志文件,tempdb爭用)
(8) 有沒有消耗CPU較大、IO讀寫較多的查詢 (通常IO消耗大的,也就是內(nèi)存消耗大的查詢)
三. 其他
(1). 如果有部署高可用的策略,會(huì)有鏡像、復(fù)制、日志傳送、集群狀態(tài)的監(jiān)控;
(2). 某些業(yè)務(wù)數(shù)據(jù)有嚴(yán)格的一致性要求,業(yè)務(wù)數(shù)據(jù)的校驗(yàn),最好也做在監(jiān)控的告警里面;
(3). 對(duì)于數(shù)據(jù)庫/實(shí)例的選項(xiàng)、參數(shù)設(shè)置,登錄、用戶、鏈接服務(wù)器等對(duì)象的可用性,通常在每年/每季度的health check里檢查過就可以了,如果不放心,當(dāng)然也可以放到監(jiān)控的告警中來。
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。TEL:177 7030 7066 E-MAIL:11247931@qq.com