OpenNMS 能監控到的資訊, 除了 "主機 (Node) 是不是還活著~", "Web Server 當掉了沒~", ... 等等 Yes or No 一翻兩瞪眼的資訊之外, 還有另外一種類型的資料來源: SNMP
SNMP 能夠提供哪些資訊給我們? 有圖有真相~
沒有安裝與設定 SNMP 時, 能看到的資源歷史資料只有一項:
把這個項目拉到右邊的框框, 並點了 "Graph Selection" 之後, 出現了這個資源的歷史明細資料 (如下圖), 目前有 ICMP (Ping) 與 HTTP. 從圖中可以看到, 過去一天之內 (Last Day) ICMP 的反應時間平均是 1.31 ms (毫秒), 最短是 0.2993 ms (毫秒), 最久是 7.99 ms (毫秒). 而 HTTP 的回應時間平均為 12.16 ms (毫秒), 最快是 9.86 ms (毫秒), 最慢是 36.37 ms (毫秒).
另外從圖裡面可以大致知道, HTTP 服務在 11:00~13:00 的時候比較忙碌.
靠近一點看~ 還可以看到比較詳細的資料~
以上是一台 Windows 2003 Server, 提供 HTTP 服務, 但是沒有安裝 SNMP 時, OpenNMS 可以提供給我們的資源歷史資料. 接下來我們來看一下, 當有安裝與設定 SNMP 時, 會怎樣? (以下示範是 Windows 2003 Server, 安裝 SNMP, 另外加上 SNMP Informant Standard 所呈現出來的結果)
點 "Resource Graphs" 後, 哇~ 左邊多出了好多好多的資源歷史資料可以選擇了ㄟ!!
那 ... 就來個 "Add All" (註: 把瀏覽器放到最大, 左下方就會有 "Add All" 的按鈕 ^^), 再來個 "Graph Selection" 吧!!
從下圖看, 網路用量不高, 一條 GB 網路才用到 0.04184% 而已 (是 User 根本不來用系統嗎 ^^), 所以~ 寫程式的~ 系統慢別怪網路啊, hehehe (註: 啊, 我也是寫程式的 =_=)
主機有8GB的記憶體, 目前執行 80 幾個 Process, 登入 Windows 的使用者約 8 個, 嗯~ 負擔不重, 可以考慮轉成 VM
剩餘記憶體還有4~5GB, 想怪罪主機 RAM 不夠? 自己掏錢去買!!
兩顆 CPU 的平均負擔趨近於零? hehehe, 想換主機下輩子吧
硬碟空間好像就有點不足了, 快寫簽呈申請購買去~ (註: 先清理硬碟上面的MP3跟AVI比較快 ^^)
上面列出使用 SNMP 之後幾個代表性的圖表, 相信大家可以了解 OpenNMS + SNMP 的威力了 ^^ 除此之外, 後續的文章會提到 OpenNMS 的 Event 與 Notification 功能, 這些功能結合起來, 可以在系統有異常 (例如: 服務當掉), 或快要異常 (例如: 硬碟只剩下 10% 空間) 時, 主動通知系統管理員. 帥吧!!

帥! 如果這樣一週一篇,看起來可以出一本書呢!
謝謝大大!! 目前只想達到一週一篇的目標, 至於出書喔? 順其自然囉
對了,你有注意到 OSE (OpenNMS Sans Effort) 嗎?用這個來安裝 OpenNMS ,再搭配你的文章服用,馬上就六三三,喔不是,是馬上就有一個強大的網管系統了!
剛剛去看了一下您所說的 OSE, 看起來是一套頗值得去研究的 OpenNMS Distribution (包含 OS 也算是 Distribution 嗎? ^^), 尤其他提出了一個架構 (architecture), 可以整合 Nagios/Zabbix, 以及所謂的 Ticket (Issue) Management System (或許可以考慮用 Mantis 或 Bugzilla), 嗯~ 有空真的要來好好的研究一下. 感謝大大您提供的建議囉!!
OSE 的確可以看成是一個 CentOS-based distro w/focus on Network Monitoring ,那個法國人自己寫的幾個用來安裝、設定 OpenNMS/Nagios 的程式套件也都有用開放授權釋出喔! 工單系統 的部份我有一點點小意見, Bugzilla 好像比較常用在軟體開發的臭蟲回報,不過 網管系統 需要的 工單系統 應該比較 著重在維修派工,例如(我待過的電信業)基地台設備異常,網管中心就要開單給各分區,甚至再派給廠商/下包。 也因此, OpenNMS 既有的整合比較是跟 OTRS 這一類的 工單系統。 以上。
了解, 因為我的屬性比較是軟體開發人員, 所以接觸到的多半是 Bugzilla, Mantis, jtra, dotProject, Subversion, ... 等軟體專案類的管理系統 ^^
【後續的文章會提到 OpenNMS 的 Event 與 Notification 功能, 這些功能結合起來, 可以在系統有異常 (例如: 服務當掉), 或快要異常 (例如: 硬碟只剩下 10% 空間) 時, 主動通知系統管理員.】 請問, 這個部分你有空時會寫嗎? 目前卡在這一塊...
感謝您的支持, 我盡快找時間補完. (你也知道的, 台灣工程師事多錢少離家遠...)
先謝謝您哦~ 另想請問, OpenNMS能否透過自訂或已內建的功能很快的能夠看到欲觀看的設備或服務的狀態, 如WEB Server點進去看就能顯示各個WEB Server的Loading(紅,黃,綠燈), 這是主管提的意見, 不知OpenNMS能否辦到??
OpenNMS 的 Surveillance 以及 Dashboard 或許可以達到您的目的, 類似這樣: http://0rz.tw/jNslU
您好~ 後來發現MAP蠻適合主管要的東西, 但node之間的link怎麼設定出來呢? = = 第4篇留言的問題也再麻煩您指導了!! 謝謝~
您好, 不好意思, 無意打擾, 看了很多針對Manage Thresholds的文章但我還是試不出來! 還在等待您的教學~ 再麻煩您抽空指導! 對了, 我大多是監控windows server... 如果可以, MAP是否也能一併指導呢? 非常不好意思~