“實(shí)在不好意思,不能和你們聚會了。公司的一個系統(tǒng)癱瘓了,現(xiàn)在還找不到原因,整個IT部門都在進(jìn)行‘尸檢”一一排查,我馬上要趕回公司。你們也知道,干我們這行的,這種事情多,沒辦法。”周未聚會上,剛在某傳統(tǒng)行業(yè)世界500強(qiáng)公司當(dāng)上IT主管的劉建軍對朋友們抱歉地說。
當(dāng)劉建軍趕到公司現(xiàn)場時,上到公司老總,下到銷售代表,都已經(jīng)急得跳腳,貨發(fā)不出去,款收不回來。劉建軍除了安慰老總馬上盡快搞定外,面對突發(fā)復(fù)雜的情況帶來的壓力,也有點(diǎn)慌亂,但他只能一邊親自逐步排查,一邊拿起了搶修電話叫技術(shù)專家過來共策共力。
最終,問題在凌晨2點(diǎn)時,得到了排除,原因出在系統(tǒng)軟硬件兼容性上,造成了系統(tǒng)崩潰,服務(wù)器宕機(jī),從下午5點(diǎn)到凌晨2點(diǎn),短短9個小時的時間,這次故障給公司帶來了直接二百多萬的訂單損失,還不算間接影響。
問題解決后,凌晨3點(diǎn)公司主管IT系統(tǒng)的老總當(dāng)即現(xiàn)場召集IT主管開會,對IT整個部門做出一系列嚴(yán)厲的行政處罰,并提出要求,類似的情況,要平時把好關(guān),將故障率降到最低,整個公司的信息化管理銷售全依賴這套系統(tǒng),老總清楚IT信息化帶來便利的同時,完全杜絕出現(xiàn)故障是不可能的,問題的關(guān)鍵在于故障前的細(xì)心維護(hù),快速反應(yīng),快速解決,他責(zé)成劉建軍在最短時間拿出一個根本性的解決方案出來。
會議結(jié)束后,劉建軍壓力很大,的確,在現(xiàn)有的IT運(yùn)維服務(wù)模式下,他不得不總?cè)フ葹l臨死亡的IT系統(tǒng),得充當(dāng)救火隊長到處滅火。企業(yè)賴以運(yùn)轉(zhuǎn)的IT系統(tǒng)一旦出現(xiàn)故障,不僅不能提高效率,而且還影響正常業(yè)務(wù)的開展。而作為肩負(fù)保證IT系統(tǒng)正常運(yùn)行責(zé)任的IT部門,面對的是由各種網(wǎng)絡(luò)、主機(jī)、系統(tǒng)軟件、中間件、數(shù)據(jù)庫、應(yīng)用軟件等等組成紛繁復(fù)雜的系統(tǒng)。處于救火狀態(tài)的IT主管,剛處理完財務(wù)系統(tǒng)的故障,辦公系統(tǒng)又罷工了。眾多的軟硬件耦合在一起,系統(tǒng)的復(fù)雜性和維護(hù)量呈指數(shù)級上升。要實(shí)現(xiàn)系統(tǒng)可持續(xù)運(yùn)營,太難了!
時間回溯到事故發(fā)生前,另一家世界500強(qiáng)公司的IT主管王彬卻顯得輕松自在,下午他陪女朋友游完一個小時泳,然后到了晚餐時間參加部門同事組織BBQ燒烤大會,其間他手機(jī)收到一條公司IT系統(tǒng)故障告警短信,當(dāng)他正準(zhǔn)備結(jié)束聚會趕往公司搶修時,短信提示故障專家已經(jīng)遠(yuǎn)程處理,系統(tǒng)恢復(fù)正常。經(jīng)過王彬電話向公司值班同事確認(rèn),部門BBQ燒烤大會照常舉行,大家一起度過了一個輕松愉快的周未,相比劉建軍充當(dāng)救火隊長的水深火熱,是什么樣的系統(tǒng)讓王彬如此游刃有余?
話題要從王彬不久前參加過的《網(wǎng)管員世界》雜志社舉辦的“2009中國網(wǎng)絡(luò)主管論壇”說起,在眾多國內(nèi)外廠商演講中,會議上王彬他注意到神州數(shù)碼提出的一個全新理念,面對現(xiàn)有的復(fù)雜IT網(wǎng)絡(luò)與系統(tǒng)環(huán)境,傳統(tǒng)的被動式IT維護(hù)已經(jīng)顯得捉襟見肘,而目前,以ITIL理念為指導(dǎo),以IT運(yùn)維專家為載體的“主動式IT運(yùn)維服務(wù)”正應(yīng)運(yùn)而生。
在被動式IT運(yùn)維模式下,由于沒有預(yù)警服務(wù),故障隱患不斷集聚,異常情況出現(xiàn)后,直接負(fù)責(zé)人不能即時發(fā)現(xiàn),IT部門不得不成為處理大量突發(fā)事件的“救火員”,無法提高工作效率。
而對于神州數(shù)碼易邦服務(wù)(www.ebond.com.cn)提出的主動式運(yùn)維模式來講,它是一套由獨(dú)立軟硬件相結(jié)合的運(yùn)維服務(wù)平臺,以監(jiān)控、告警、日志、報告服務(wù)工具為依托,實(shí)時監(jiān)控系統(tǒng)的運(yùn)行狀態(tài),并與呼叫中心結(jié)合一體,針對維護(hù)服務(wù)范圍中的IT系統(tǒng),進(jìn)行實(shí)時的監(jiān)控,出現(xiàn)問題的同時可以進(jìn)行實(shí)時告警,做到故障的主動式實(shí)時發(fā)現(xiàn),并自動、及時提供故障診斷服務(wù),若出現(xiàn)一些小的問題,在IT主管收到告警短信的同時,神州數(shù)碼易邦服務(wù)運(yùn)維專家就已經(jīng)將故障隱患消滅于萌芽之中。
而當(dāng)這套系統(tǒng)遇到一些特別復(fù)雜的情況遠(yuǎn)程無法處理時,神州數(shù)碼易邦服務(wù)IT運(yùn)維專家會根據(jù)客戶承諾的時間及時趕到現(xiàn)場,進(jìn)行快速的反應(yīng)和處理,并提供備機(jī)和備件、大大的減少了客戶故障恢復(fù)時間,為客戶爭分奪秒,減少損失。
最終王彬經(jīng)過詳細(xì)咨詢易邦主動式IT運(yùn)維服務(wù)的相關(guān)技術(shù)指標(biāo)及內(nèi)容,并根據(jù)公司自身需求征集各方IT專家論證后,該司正式啟用神州數(shù)碼主動式IT運(yùn)維服務(wù)——易邦服務(wù) ,我們發(fā)現(xiàn),當(dāng)企業(yè)應(yīng)用了主動式的IT運(yùn)維服務(wù)后,IT主管就可以經(jīng)常給系統(tǒng)做‘體檢’,從而實(shí)現(xiàn)長期的系統(tǒng)可持續(xù)運(yùn)營,而不是在系統(tǒng)癱瘓后坐‘尸檢’。
有了健康的IT系統(tǒng),王彬不僅可以按時參加朋友聚會,而且不用擔(dān)心因系統(tǒng)突發(fā)故障而臨時被召回去救火。與此同時,公司信息化流程的穩(wěn)定運(yùn)行,業(yè)務(wù)運(yùn)轉(zhuǎn)越來越順暢,大大提高了公司內(nèi)部溝通的效率,公司的產(chǎn)品及服務(wù)在市場上的競爭力將越來越強(qiáng),使公司在激烈的市場競爭中立于不敗之地。